Open data: sous quelle licence les proposer?

Article
Par Philippe Laurent · 30/10/2013

La question de la forme de licence à associer aux open data est un vaste sujet en soi.

La réponse n’est ni unique ni évidente, dans la mesure où les situations doivent s’analyser au cas par cas. Voici dès lors une liste de questions minimales à se poser pour aborder la problématique du choix de licence.

1. Pourquoi “fait-on” de l’open data? Quels sont les objectifs visés, les motivations?

Est-ce une stratégie commerciale, un choix politique, un principe éthique, l’effet d’une pression ou d’une obligation légale?

S’il s’agit d’une stratégie commerciale ou d’un choix politique, la licence devra aller dans le sens des objectifs du donneur de licence… S’il s’agit d’un principe administratif ou d’une obligation (pensons par exemple à la nouvelle directive européenne PSI [Public Sector Information] qui pousse les administrations à permettre la réutilisation de leurs données), la licence veillera également à ce que le cadre contraignant soit respecté.

Quelques liens utiles

Le texte français de la nouvelle directive PSI, adopté en juin 2013 peut être téléchargé via ce lien

Pour d’autres versions linguistiques, utilisez ce lien

Pour des informations sur le processus de révision qui a précédé la publication de la nouvelle directive, rendez-vous sur cette page du site de l’Union européenne.

2. Qu’entend-on pas “données”?

La définition scientifique d’une donnée est assez restrictive et la distingue de la notion d’“information” ou de “connaissance”.

Une métaphore compare la donnée au coton, l’information au fil à tisser, et la connaissance au tissu.

L’open data couvre bien entendu les jeux de données, au sens strict du terme.

Cependant, force est de constater qu’une tendance se dessine pour donner au terme “donnée” des dimensions beaucoup plus larges. A tel point qu’il viserait n’importe quel élément informationnel dématérialisé (document, image, représentation, enregistrement…). Pareille inclusion aura pour effet de complexifier la licence, étant donné la multiplicité et l’hétérogénéité des “objets” concernés, et dès lors, la multiplicité et l’hétérogénéité des droits à prendre en compte. Il s’agit en effet d’être complet et précis dans la détermination de l’objet du contrat.

3. Quels droits s’appliquent aux données?

Le terme “licence” fait avant tout référence à une autorisation donnée par le titulaire d’un droit exclusif, généralement un droit de propriété intellectuelle.

Rappelons un principe de base: les données et les informations relatives à l’univers qui nous entoure ne sont normalement pas protégées en tant que telles par la propriété intellectuelle.  Ce qui est protégé ou protégeable, ce sont les œuvres (droits d’auteur), les enregistrements (droits voisins), les bases de données (droits d’auteur et droits “sui generis”), les inventions (brevets), les marques, les dessins et modèles (droits ad hoc)…

Avant de pouvoir être considérées comme relevant de ces statuts “privilégiés”, les données et informations doivent faire l’objet de transformations ou d’incorporations effectuées dans le cadre d’une activité créative ou inventive, et le résultat doit remplir certaines conditions légales.

Des données brutes générées par une activité administrative ne rempliront donc pas toujours ces conditions préalables. Dès lors, si elles ne font pas l’objet d’un droit de propriété intellectuelle, le seul fait de publier ces données les rendra “libres” et réutilisables (domaine public) sans qu’une licence soit nécessaire.

Si les données ne font pas l’objet d’un droit de propriété intellectuelle, le seul fait de publier ces données les rendra “libres” et réutilisables (domaine public) sans qu’une licence soit nécessaire.

Par ailleurs, outre la possible protection par des droits de propriété intellectuelle, certaines données peuvent faire l’objet d’autres protections ou restrictions, en fonction de leur nature ou des objets auxquels elles ont trait. Ce sera entre autres le cas des données à caractère personnel.

Ces données relatives aux personnes physiques sont protégées par une loi générale qui encadre leur traitement de manière stricte afin de protéger la vie privée des individus concernés. La loi restreint largement la possibilité de transférer ces données à des tiers ou la récupération de ces données à des fins autres que leur finalité initiale… ce qui représente bien entendu un frein majeur à leur publication et/ou leur réutilisation.

4. Pourquoi une licence est-elle nécessaire?

Si les données sont protégées par un droit exclusif de propriété intellectuelle, une réutilisation ne sera normalement possible qu’avec l’autorisation du titulaire des droits. La licence contractualisera cette autorisation.

On notera qu’il n’est pas toujours évident de savoir si un jeu de données fait ou non l’objet de droits intellectuels. En effet, la loi prévoit par exemple qu’une base de données n’est protégée par le droit spécifique du même nom – dit “sui generis” – que lorsque son producteur prouve qu’elle a donné lieu ou est la résultante d’un “investissement substantiel”.

Pareil critère n’est pas évident à apprécier.

Il en va parfois de même avec le critère d’originalité imposé par le droit d’auteur.

Par ailleurs, les régimes protégeant la propriété intellectuelle prévoient aussi des exceptions aux droits exclusifs, qui sont également soumises à de nombreuses conditions, parfois difficiles à remplir.

La présence d’une licence permet en tout cas de rassurer l’utilisateur: que les données soient protégées ou non, elles s’accompagnent d’une licence permissive qui permet leur réutilisation, sans devoir par ailleurs invoquer une exception.

Enfin, on peut comprendre que les administrations et autres détenteurs de données ne désirent octroyer l’accès à celles-ci et permettre leur réutilisation que sous certaines réserves… la “licence” fera alors office de contrat d’accès ou de conditions générales d’utilisation.

5. Quels droits concéder au “licencié” ou “ré-utilisateur”?

L’objectif de l’open data est de permettre aux licenciés de réutiliser les données. Cette réutilisation peut se concevoir de différentes manières.

Afin de traiter les données, il faut au minimum pouvoir y avoir accès, les télécharger, les reproduire et les communiquer. Les données seront-elles accessibles via une API ou en “bulk access” (téléchargement total)? Selon certains (l’Open Knowledge Foundation, par exemple), l’accès par API ne serait pas suffisante.

La modification, la combinaison et le partage des résultats de ces opérations devraient également être autorisés dans l’esprit “open data”. Cependant, certaines licences (telle que la licence choisie par la Ville de Bruxelles) permettent la modification mais interdisent par contre “l’altération des données ou la dénaturation de leur sens”.

Dans sa définition, l’Open Knowledge Foundation préconise, quant à elle, de se limiter à stipuler les données ont été modifiées.

Soulignons aussi le fait que les différents droits intellectuels cités plus haut couvrent des actes d’exploitation différents. Par exemple, alors que le droit d’auteur permet à un auteur d’autoriser ou d’interdire la reproduction, la communication et la distribution de copies d’une œuvre, le droit sui generis de base de données permet au producteur de s’opposer à l’extraction ou la réutilisation de parties substantielles de la base.

Les droits concédés aux licenciés devraient être définis en prenant en compte les actes visés par les droits de propriété intellectuelle concernés.

6. Attend-on du licencié  un comportement ou des engagements particuliers?

L’accès ou une licence seront-ils conférés à condition que le licencié soit tenu à certaines obligations?

La contrepartie réclamée au licencié peut par ailleurs avoir une étendue fort variable en fonction des licences utilisées.

La majorité des licences imposeront l’obligation de mentionner la source ou l’auteur. En cas de modification des données, le licencié doit généralement mentionner cette modification afin de clairement distinguer sa version. Certaines licences (telles que l’OdBL – acronyme d’“open database license”) iront jusqu’à rendre obligatoire, dans certains cas précis, le partage des améliorations apportées à la base de données.

Par ailleurs, le licencié doit généralement accepter des clauses de limitation de responsabilité et de non-garantie, ce qui limitera largement ses possibilités d’action en justice.

7. Doit-on se prémunir contre certains risques ou responsabilités?

Comme dans toute licence de type “open”, permissive et concédée gratuitement, il est courant  – et admis – que le donneur de licence rejette tout ou partie de sa responsabilité et ne donne pas de garantie quant à la qualité ou la pertinence de l’objet donné en licence. Pareilles limitations sont généralement perçues comme la contrepartie logique et inhérente des licences offertes gratuitement. Ces clauses peuvent être plus ou moins précises en fonction de la sensibilité des données ou du secteur concerné.

8. Faut-il spécifier un droit applicable ainsi que les tribunaux compétents?

Il est également courant que les licences “open data” prévoient l’application d’un droit national et précisent les instances ou les juridictions devant lesquelles d’éventuelles actions devraient être intentées. Pareilles clauses ne sont évidemment pas anodines et leurs effets sont conséquents, non seulement d’un point de vue pratique, mais également sur l’interprétation à donner à la licence.

La licence doit à la fois répondre aux attentes et réserves légitimes du donneur de licence, tout en évitant de décourager les candidats à la réutilisation.

9. Existe-t-il une licence qui remplit les critères choisis?

En général, il est toujours conseillé de ne pas créer de nouvelles licences mais de réutiliser des licences préexistantes. Dans le meilleur des mondes, l’usage d’une seule et même licence par l’ensemble des acteurs de l’open data permettrait une pratique constante, harmonieuse et sans problème de compatibilité juridique entre les jeux de données. En effet, il est parfois périlleux de regrouper des données sous différentes licences dans  le cadre d’une base commune. Le donneur de licence doit en effet à tout moment respecter toutes les clauses des différentes licences concernées. Dans le pire des cas, les données se trouveront sous des licences imposant des obligations contradictoires empêchant le licencié de respecter les deux licences en même temps. Dans pareil cas, le résultat pourrait devenir difficilement exploitable.

10. La licence résultant des choix effectués ci-dessus est-elle acceptable?

N’oublions pas que la démarche de l’open data consiste avant tout à permettre la réutilisation des données par le plus grand nombre. La licence doit dès lors à la fois répondre aux attentes et réserves légitimes du donneur de licence, et ne pas décourager les candidats à la réutilisation.

La licence doit dès lors être claire, non-ambiguë et ne pas imposer trop de contraintes au donneur de licence. Il est donc toujours conseillé d’apprécier la licence également du point de vue du bénéficiaire…

Philippe Laurent est avocat (cabinet MVVP), chercheur senior (CRIDS) et formateur (legalict.be)