1. Le cadre juridique de référence

Source de confusion, le cadre juridique de référence se compose d’une part de règle de droit public (dédiées à l’ouverture et à l’utilisation des informations publiques) et d’autre part de règles de droit privé (la propriété intellectuelle à l’égard des objets juridiques que posséderait la collectivité ou l’administration).

Les deux régimes sont néanmoins plus complémentaires qu’ils ne s’opposent et on s’aperçoit que l’ouverture des données peut reposer sur un usage cumulatif qui augmente l’attrait de ces deux régimes.

1.1. Les informations publiques et le cadre juridique dédié à leur ouverture et utilisation

C’est là un sujet déjà longuement étudié, citons les trois textes juridiques clés :

  • La Loi de 1978 «  portant diverses mesures d’amélioration des relations entre l’administration et le public et diverses dispositions d’ordre administratif, social et fiscal  » ;
  • L’Ordonnance de 2005 « relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques  » (transposant la directive européenne de 2003 « sur la réutilisation des données du secteur public ») ;
  • Enfin, le Décret (et circulaire) du 26 mai (qui concerne principalement l’État) « relatif à la réutilisation des informations publiques détenues par l’État et ses établissements publics administratifs »

On retiendra une obligation « passives » de mise à disposition des données publiques et des informations relatives à ces dernières complétée par une obligation « actives » de la diffusion (pour une réutilisation) des données publiques (même s’il ne s’agit que de certaines données, pour certaines personnes publiques et pour certaines utilisations). Mentionnant ici que la Commission d’Accès aux Documents Administratifs (CADA) est garantes de leur respect (des correspondants CADA sont par ailleurs désignés au sein de chaque collectivité) – on y reviendra, mais il semblerait que l’ouverture des données, en plus de bouleverser les mentalités, risque de renforcer le rôle de contrôle de la CADA.

1.2. Les objets juridiques saisis par la propriété intellectuelle

Il faudrait, afin de tendre à l’exhaustivité, analyser en détail le Code de la Propriété Intellectuelle et la série de droits exclusifs qui confère un monopole à leur titulaire (droit d’auteur, droits voisins, droit sui generis des bases de données d’une part ; marques, brevets, certificats divers d’autre part), mais il suffit ici de retenir que :

  • les données ne sont donc pas appropriables (objet d’un droit exclusif) par principe et en tant que telles, qu’il s’agisse de données brutes (primaires), corrigées (ou traitées/ exploitables) ou encore données élaborées (ou analysées ou dérivées — des données extérieures sont ajoutées) à moins de répondre au critère de l’un des droits de propriété intellectuelle (comme le droit d’auteur si elles peuvent être qualifiées de créations originales) ;
  • les bases de données peuvent être protégées : par le droit d’auteur si elles sont originales (mais cette originalité est exceptionnelle puisque l’architecture des bases de données est généralement normalisée, voir conditionnée par les usages qu’elles doivent offrir) ou par le droit sui generis si son producteur justifie d’un investissement relatif à la conception de la base (et non pas à la production des données de celle-ci).

Ces prérogatives bénéficient à toute personne (privée ou publique), lui conférant un monopole qui la fait entrer dans une logique de marché et donc de concurrence dès lors qu’elle en use.

1.3. L’usage cumulatif des deux régimes dans le cadre de l’ouverture des données publiques

La Loi de 78, plusieurs fois modifiée, met en place une série d’obligations à la charge des personnes publiques/établissements publics. Ceux sont doivent donc mettre à disposition les informations publiques qu’ils détiennent, dans un cadre relativement souple dont la Loi fixe le minimum. Il n’y a ainsi pas de reconnaissance d’un droit exclusif en tant que telle, même si cette mise à disposition est accompagnée d’un encadrement contractuel guidé par la Loi elle-même. Ainsi, celui qui prendrait connaissance de telles données publiques sans consentir à un quelconque contrat pourrait en user librement et sans limitation (sauf à mentionner l’origine de ces données — cf ci-après).

Néanmoins, compte tenu de l’importance de l’origine/de la source (et de la confiance qui en résulte), la Loi fixe un formalisme précis et sanctionne (par l’intermédiaire de la CADA) certains comportements : ainsi faut-il indiquer l’origine des données diffusées ainsi que la date de la dernière mise à jour des bases de données publiées, et toute dénaturation des données est proscrite (c’est-à-dire un usage de ces dernières d’une façon qui pervertirait les informations objectives qui sont communiquées – tirant des choses fausses de statistiques par exemple).

De leur côté, les droits de propriété intellectuelle constituent la traduction juridique d’une politique économique : l’utilisation d’une licence libre n’étant ainsi qu’une exploitation par la collectivité ou l’administration des droits qu’elle détient (en l’occurrence pour organiser un portage au profit des tiers / contributeurs potentiels). Ainsi, dans cet exercice de ses prérogatives, la personne publique est en tout point assimilable à un acteur privé – même si les motivations seront, au moins partiellement, influencées par leur mission de services publics.

On le voit, les deux notions, si elles concernent toutes deux les données détenues, n’ont pas les mêmes fonctions. C’est la raison pour laquelle il serait pertinent de se poser la question de l’opportunité d’intégrer les dispositions de la Loi de 78 dans les licences utilisées par collectivité, alors :

  1. que la Loi de 78 est la cause d’une telle diffusion, mais sûrement pas l‘objet ;
  2. qu‘il s’agit d’une exploitation de leur patrimoine immatériel (en l’absence d’une telle prise en considération des dispositions du Code de la propriété intellectuelle, on favoriserait une insécurité juridique puisque seuls les titulaires publics seraient en capacité d’exploiter les bases de données).

2. Les enjeux relatifs au choix de la licence

Le choix de la licence initial est fondamental : en terme de communication afin d’interpeller des communautés déjà existantes, en terme stratégique, car le modèle économique imaginé peut en dépendre, et enfin en terme juridique, car en cas d’intégration de contributions le titulaire de droits initial ne pourra pas unilatéralement changer de licence (sauf à supprimer toutes lesdites contributions). Par ailleurs, une licence adaptée au contexte facilitera la structuration de la collaboration future – quant à l’évolution et l’exploitation de la création.

Plusieurs démarches nécessitent d’être décrites : l’opportunité de la création d’une licence spécifique ou le choix d’une licence – voire plusieurs licences – existante.

2.1. La création d’une licence particulière

S’épargnant tout choix, il peut être tentant de s’orienter vers la rédaction d’une licence spécifique, particulièrement lorsque le projet est, objectivement ou subjectivement, jugé qualitativement ou quantitativement important. Néanmoins, avant de se lancer dans cet exercice, il est nécessaire de mesurer l’intérêt et les inconvénients de cette solution – qu’elle soit motivée par une volonté de créer un « pot commun encadré » ou l’idée de créer une licence optimisée en fonction des besoins.

S’il s’agit de « sectoriser » pour éviter certaines récupérations (par exemple par une entreprise ou une initiative concurrente), l’effet est généralement relatif (compte tenu des libertés conférées par la licence) et les inconvénients sont non négligeables : la manne de contributions tierces diffusées sous une autre licence devient indisponible (et effet, au plus la licence est spécifique, au plus la compatibilité sera difficile à atteindre) et il sera au surplus plus ardu d’intéresser les tiers aux projets (puisqu’ils ne pourront eux-mêmes réutiliser les autres contributions dans d’autres projets). Enfin, il n’est pas possible d’ajouter une compatibilité en faveur d’autres licences sans entrer en contradiction avec cet objectif de réservation.

S’il s’agit, de manière tout à fait légitime, d’une volonté de créer une nouvelle licence optimisée au contexte, cet effort peut aussi s’avérer contreproductif : faisant courir le risque que la licence contienne des failles non existantes (ou résolues) dans d’autres licences, et demandant, outre sa rédaction, la mise en œuvre d’un travail de communication, d’interprétation et d’assistance nécessaire à la compréhension de la licence (ce qui est, une nouvelle fois, une activité coûteuse en temps et énergie). Les techniques contractuelles existantes (et particulièrement celle des exceptions ou des multilicences) peuvent s’avérer être plus simples et plus efficaces.

Par ailleurs, la rédaction d’une licence est un est projet ambitieux (il n’est pas rare que les nouvelles versions de licences prennent un ou deux ans avant d’être terminées) qui fait appel à des compétences particulières (il est ainsi généralement plus sûr d’utiliser une licence largement utilisée et testée.). Le seul aspect positif d’un tel travail est la potentielle compatibilité avec la licence utilisée comme canevas, avantage bien faible compte tenu des autres solutions assurant une même compatibilité.

Ainsi, la rédaction d’une nouvelle licence, si elle peut se justifier, ne doit pas être une solution « par défaut », mais au contraire le fruit d’une réflexion globale (ne pouvant se passer d’une sélection en amont d’une ou plusieurs licences « modèles »). Bien entendu, l’aspect politique peut, à lui seul, justifier la rédaction d’une nouvelle licence, mais on observera néanmoins que cette licence ne sera alors généralement pas utilisée en dehors de la sphère du rédacteur et de ses partenaires, ce qui diminue d’autant son intérêt.

2.2. Le choix d’une licence

Il est ainsi généralement recommandé d’utiliser une ou plusieurs licences. Le choix d’une licence est généralement complexe, savant mélange de stratégie et de tactique.

En terme stratégique, il doit traduire les intérêts juridiques, stratégiques, techniques et commerciaux, et prendre en compte les contraintes issues de l’utilisation de composants tiers (en l’occurrence, on pourrait songer à l’utilisation de données tierces). Il est nécessaire d’adopter la licence la plus adaptée à son projet en se concentrant sur ses obligations, son étendue, son élément déclencheur et éventuellement la compatibilité qu’elle organise. Dans un second temps, il peut être utile d’estimer l’intérêt des licences au regard du contexte : est-ce important d’utiliser une licence déjà connue, voire testée ? Doit-on s’inspirer des choix opérés pour des projets concurrents ou analogues ? Ces réponses ne peuvent être données qu’au cas par cas, en fonction de l’examen et de l’approche choisie. Incontestablement, une licence disposant d’une large notoriété participe avantageusement à la communication qui suivra l’ouverture.

Afin de peaufiner le choix, il n’est pas étonnant de personnaliser la licence pour s’assurer qu’elle réponde en tout point aux objectifs initiaux (c’est la partie « tactique ») – encore faut-il veiller à ne pas créer ainsi d’incompatibilité non désirée. En cas de clauses imprécises ou équivoques, il peut être utile de préciser le sens attendu, voire de désigner une personne tierce comme source d’interprétation. Cela confère une portée précise à la licence, qui tient les parties et le juge. On parle d’ « interprétation ». L’usage des exceptions est une autre technique plus radicale qui consiste à modifier la licence de base en ajoutant, dans une clause jointe à la licence ou insérée dans les en-têtes, une spécificité qui déroge aux termes initiaux avec pour effet de rendre la licence finale plus ou moins contraignante. Il est à noter qu’en l’absence de stipulation contraire, une clause additionnelle qui ne fait « qu’ajouter des droits » pourra être supprimée par tout licencié au moment de la redistribution d’une copie du logiciel.

La maîtrise de plus en plus fine de la pratique contractuelle liée aux licences Open Source conduit aujourd’hui à conseiller une pratique réfléchie et adaptée de ces exceptions et interprétations. Les premières confèrent plus de souplesse aux licences, les secondes assurent une plus grande sécurité juridique. Un bon usage de celles-ci peut permettre de prévoir et de résoudre a priori la plupart des situations préjudiciables : problèmes d’incompatibilité, failles au sein des licences, etc.

2.3. L’ajout d’une licence et la notion d’incompatibilité

Choisir une licence est simple, mais il peut être plus complexe d‘ajouter celles-ci aux créations souhaitées. En effet, il est très simple d’ajouter une licence à une base de données sur laquelle on détiendrait tous les droits, mais il faut être plus vigilant lorsque celle-ci appartient à un tiers : car il n’est jamais possible de supprimer arbitrairement la licence choisie par le titulaire de droits, tout au plus peut-on opter pour l’ajout d’une licence à celle utilisée initialement lorsqu’elle est compatible avec la précédente, c’est-à-dire :

  • qu’elle ne confère pas plus de droits
  • qu’elle n’oblige pas moins

Une étude spécifique permet d’envisager au cas par cas la possibilité d’un tel ajout – les réponses étant, selon les cas, simples ou très complexes. À la question de savoir si l’usage d’une licence du type APIE permettrait ensuite la réutilisation des données au sein du projet Open Street Map (sous ODbL), la réponse risquerait d’être négative 1) si la licence de l’APIE contenait des obligations à la charge de l’utilisateur différentes de celles contenues dans la licence ODbL ou 2) si les bases de données ouvertes étaient originales (donc objet de droit d’auteur) ou conséquentes à un investissement (donc objet du droit sui generis des bases de données), car l’ajout de la licence ODbL à ces bases nécessiterait qu’il y ait en amont une cession de droits adaptée.

Plus original, il est aussi possible de faire le choix de la multilicence (le choix du libre choix), c’est-à-dire diffuser la création sous différentes licences simultanément : qu’elles soient toutes libres ou qu’au moins l’une d’elles le soit. Multiplier les licences libres permet d’associer les avantages de plusieurs licences : assurer une compatibilité au bénéfice de plusieurs licences, bénéficier de la renommée d’une licence, consolider la cession de droits, etc. Contrairement à ce que beaucoup semblent croire, le multilicenciement se trouve être une technique simple et efficace qui, d’une certaine manière, confère une liberté supplémentaire à l’utilisateur : celle du choix de la licence à laquelle il se soumet (chaque usage fait de la création doit être conforme à au moins une des licences). Une telle solution offre parallèlement une bonne compatibilité tout en restant conforme aux attentes de la Société (permettant par exemple de cumuler langue française, Copyleft et compatibilité).

C’est donc une solution qui, utilisée à bon escient par les auteurs, peut permettre optimiser la diffusion du logiciel et faciliter les contributions.

3. Les licences existantes

Trois types de licences sont actuellement utilisées lors de l’ouverture de données publiques. Néanmoins, toutes n’ont pas la même efficience juridique :

  • Les licences « traditionnelles » basées sur le droit d’auteur
  • Les licences rédigées sur la base de la Loi de 78
  • Les licences appréhendant les bases de données comme objet juridique

3.1.Les licences « traditionnelles » basées sur le droit d’auteur

Il s’agit ici du « courant principal » des licences libres, utilisé sur les œuvres logicielles ou non logicielles et essentiellement construit sur la base du droit d’auteur (les autres droits n’étant envisagés qu’accessoirement). Parmi ces dernières, les licences Creative Commons (CC-By ; CC-By-SA ; etc.) sont les plus utilisées à l’égard des bases de données – choix tout à fait pertinent à l’extérieur de l’Europe où le droit sui generis des BDD n’existe pas. D’autres licences similaires pourraient aussi être envisagées : telles la Licence Art Libre (LAL) ou la Design Sciences License (DSL) qui ont des effets similaires à la CC-By-SA ou la GNU FDL qui a une étendue plus large.

Elles ont pour principal avantage d’être de manière générale connues et comprises (et s’appuie sur une large doctrine et quelques jugements les validant).

En revanche, elles portent en elle un inconvénient rédhibitoire pour ce qui nous intéresse : elles sont inadaptées à l’objet juridique que sont les bases de données. Ainsi, de la même façon qu’elles sont inadaptées pour une utilisation sur des logiciels, il convient d’éviter leur usage sur des bases de données qui, par nature, ne sont qu’exceptionnellement originales et ne sont donc pas appréhendées par les licences.

Ainsi, le droit sui generis sur les bases de données n’étant envisagé qu’accessoirement (lorsque la base est originale), l’usage de ce type de licence :

  • constitue un risque juridique pour les utilisateurs qui voudraient utiliser ou concevoir des services sur la base de telles bases de données ;
  • risque de rendre inefficient le copyleft des licences avec la clause SA (share alike) puisque celui-c repose sur la reconnaissance d’un droit d’auteur.

3.2. Les licences rédigées sur la base de la Loi de 78

Deux initiatives reposent sur ces dispositions françaises : les conditions générales d’utilisation de l’Agence du Patrimoine Immatériel de l’État (APIE) et la Licence « information publique librement réutilisable » (LIP)

Les Conditions générales de réutilisation des informations publiques fournies par l’APIE sont des contrats généraux basés sur les textes relatifs à la mise à disposition des informations publiques et qui ont notamment pour avantage de renvoyer à des conditions particulières d’utilisation. Elles ont cependant pour inconvénients d’être franco-françaises (et donc incompatibles à l’international) et inspirées des modèles de contrat administratifs qui sont peu adaptés à des utilisateurs standards (notamment du fait du renvoi à d’autres textes). Au surplus, elles présentent pour défauts rédhibitoires (sources d’insécurité juridique) 1) d’être principalement axée sur la diffusion des données et non sur l’échange et la construction de services qu’une diffusion libre pourrait offrir, et 2) surtout d’être uniquement construite sur la base de la Loi du 17 juillet 1978 et de ne pas du tout prendre en compte les différents droits de propriété intellectuelle que la collectivité ou l’administration pourrait détenir sur ces bases.

Ainsi, ces contrats (dénommés « licences ») ne devraient semble-t-il être utilisés seuls dans le cadre d’une démarche d’ouverture des données publiques. À ce sujet, l’APIE incite-t-elle, lorsqu’opportun, à opérer une cession parallèle des droits de propriété intellectuelle. Par ailleurs, il semblerait tout aussi juste de considérer que la Loi s’applique à tous sans distinction, et qu’il n’est donc pas nécessaire de reformuler celle-ci sous forme de contrat pour obliger les utilisateurs de ces différentes données publiques (un simple rappel sur la plate-forme utilisée pour la mise à disposition des données pourrait néanmoins s’avérer utile). L’agence précise elle-même que « dans le cas où la réutilisation est à titre gratuit ou plus généralement n’est soumise à aucune condition particulière, le recours à une licence n’est pas nécessaire. Dans ce cas, un simple rappel des obligations posées par la Loi peut accompagner la mise à disposition des informations publiques », précisant juste après que « c‘est l’objet des conditions générales de réutilisation élaborées par l’APIE » (voir le guide « Des licences pour favoriser la réutilisation des informations publiques », Ressources de l’Immatériel, publié par l’APIE).

La licence information publique librement réutilisable (LIP) (j’en parlais déjà dans l’article « Une compatibilité possible entre informations publiques et licences libres ? ») a pour avantage d’être détachée de la personne qui l’utilise et de favoriser la réutilisation et la création de services à valeur ajoutée. Son auteur parlait auparavant d’une compatibilité future avec les licences Creative Commons, actuellement non organisée (mais les Creative Commons 3.0 permettraient ce type de compatibilité). Mon sentiment est que ces licences permirent surtout de rassurer les administrations françaises, alors qu’une licence de type Creative Commons aurait parfaitement rempli cette fonction – la Loi de 1978 demeurant applicables. Cette licence a aussi pour inconvénient de ne pas appréhender les droits de propriété intellectuelle et d’être aussi franco-française (principalement en raison des mécanismes de la Loi de 1978 qu’elle intègre). Enfin, cette licence n’autorise l’usage commercial des données libérées que dans certaines hypothèses (lorsque les données ont été traitées, « augmentées » par l’utilisateur/la société utilisatrice.

Il faut néanmoins relativiser ses propos dans la mesures où ces licences constituent un véritable avancée dans l’ouverture des données publiques et qu’elles ont le mérite d’informer les utilisateurs de l’existence de la Loi de 78. C’est donc un travail utile sur lequel il faudra s’appuyer, mais, me semble-t-il, en le distinguant clairement des licences utilisées sur les bases de données.

3.3. Les licences appréhendant les bases de données comme objet juridique

Il s’agit ici principalement de la licence CC-zero rédigée à l’initiative de Sciences Commons et des licences publiées par l’OKFN.

Nous avions traduit et publié la CC-Zero à l’occasion de la publication du Framabook « Un monde sans copyright… et sans monopole » de Joost Smiers (voir la traduction). En résumé, la licence liste et appréhende les différents droits de propriété littéraire et artistique détenus sur la création (droit d’auteur, droits voisins, droit sui generis sur les bases de données) afin d’y renoncer expressément — de manière supplétive, une cession large de ces droits est organisée lorsqu’une telle renonciation est impossible (ainsi en est-il en France où le titulaire de droits pourrait valablement contester a posteriori une telle renonciation). En conclusion, il s’agit d’une licence adaptée pour qui souhaite renoncer à tout droit sur ses données et bases de données (la Loi de 78 reste néanmoins applicable).

Les licences de l’OKFN sont aux nombres de trois :

  • la Public Domain Dedication and License (PDDL)  — “Public Domain for data/databases”, cette licence peut être assimilée à la CC-Zero précitée ;
  • l’Attribution License (ODC-By)  — “Attribution for data/databases”, cette licence permet toute utilisation de la base de données à la seule condition que la paternité soit clairement maintenue ;
  • et l’Open Database License (ODC-ODbL) — “Copyleft for databases“, qui impose que toute base de données dérivée soit maintenue sous la même licence (notamment utilisée par OpenStreetMap et la mairie de Paris)

Ces licences bénéficient de l’expérience des licences Open Source sur lesquelles est elles se basent, tout en les adaptant à l’objet juridique que sont les bases de données (se basant cumulativement sur le droit des contrats, le droit d’auteur et le droit sui generis des bases de données).

Par ailleurs, l’OdbL est copyleft (la base de données dérivée – distinguée de la base de données collaborative), ce qui permet éventuellement de mettre en œuvre une politique de double licence : l’utilisateur étant amené à choisir d’utiliser la base de données sous la licence libre ou sous une licence commerciale classique (ce qui peut être intéressant pour les acteurs classiques qui veulent bénéficier de ces bases de données sans pour autant ouvrir leur propre base de données). La licence a aussi pour avantage de rendre son utilisation relativement flexible grâce à la possibilité offerte au concédant de déterminer par avance les licences compatibles.

Ces licences présentent néanmoins l’inconvénient – d’autant plus fort en présence d’administration française ou de collectivité soumise à la Loi Toubon relative à l’emploi de la langue française – d’être rédigée en langue anglaise. Cela rend d’autant plus utile le travail de traduction réalisé dans le cadre de l’Open Data parisien (voir la traduction sur le site de VVL).

4. Quelques préconisations

Ces quelques lignes découlent et synthétisent les développements qui précèdent. Ainsi, dans le cadre d’une démarche d’ouverture des données publiques, les enjeux relatifs au choix de la licence amènent à conseiller :

  • de dissocier les aspects relatifs à la Loi de 78 (qui reste applicable et nécessiterait d’être rappelée sur le site de diffusion des données publiques — mais qui ne nécessite pas, me semble-t-il de contrat supplémentaire) et la licence utilisée pour exploiter les droits détenus par l’administration ou la collectivité ;
  • de préférer le choix d’une licence libre existante plutôt que la création d’une nouvelle licence.

Concernant ce dernier point, il convient de distinguer :

  • le projet d’ouverture de données « classique » : les licences rédigées par l’OKFN (telle l’ODbL) semblent les mieux adaptées à l’objet juridique que constituent les bases de données (elles sont par ailleurs internationale, construite sur la base des licences Open Source largement testées et utilisées en matière de logiciel, et enfin très plus flexibles) ;
  • une démarche globale qui chercherait à écrire une nouvelle licence utilisable par un grand nombre d’acteurs (par exemple le travail d’Etalab issu du décret n° 2011-194 du 21 février 2011 « portant création d’une mission « Etalab » chargée de la création d’un portail unique interministériel des données publiques ») : il pourrait ici être pertinent de rédiger une nouvelle licence, pour peu que l’initiative justifie de cette nécessité (principalement en terme de sécurité juridique, je ne pense pas que le respect de la Loi de 78 soit un motif suffisant en tant que tel) et qu’elle recherche une compatibilité avec les licences et projets déjà existants.

En espérant que ces développements sauront être utiles !