Une énorme faille dans la loi Valter sur les données culturelles ?

La loi pour une République numérique (dite Loi Lemaire) va avoir en France un impact important en matière d’ouverture des données publiques, puisqu’elle institue un principe d’Open Data par défaut, dont j’ai déjà eu l’occasion de parler plusieurs fois dans ce blog (ici ou ). Mais ceux qui ont suivi attentivement cette évolution savent qu’il y a un secteur qui a réussi à conserver une position de privilège pour ne pas participer à cette dynamique d’ouverture : celui de la culture et du patrimoine.

Head in Hands
Facepalm pour la politique de réutilisation des données culturelles en France. (Images par Alex E. Proimos. CC-BY. Source : Wikimedia Commons).

C’est notamment l’effet de la loi du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (dite aussi loi Valter). Ce texte ainsi que son décret d’application vont permettre aux établissements culturels (bibliothèques, archives, musées) – là où la quasi-integralité des autres administrations sont désormais soumises à un principe de gratuité – de continuer à lever des redevances pour la réutilisation d’informations issues des opérations de numérisation de leurs collections (et des métadonnées associées).

Du côté de SavoirsCom1, nous avons fermement combattu cette politique de maintien d’un statut dérogatoire pour les établissements culturels, notamment parce qu’elle revient à institutionnaliser les pratiques de Copyfraud sur les reproductions fidèles d’oeuvres du domaine public et à neutraliser les libertés qu’il autorise. C’est la raison pour laquelle nous avions poussé pour que la loi Lemaire consacre la notion de « domaine commun informationnel » afin de sanctuariser les oeuvres du domaine public contre les tentatives de réappropriation. Mais les arbitrages politiques ont joué en notre défaveur, malgré le soutien du Conseil National du Numérique et de plusieurs députés.

Aspiration de données pour Filae.com

C’était donc la soupe à la grimace sur le volet culturel de l’ouverture des données publiques, jusqu’à ce qu’un événement survienne la semaine dernière qui montre que la « ligne Maginot » érigée par la loi Valter comporte visiblement une brèche béante dans laquelle certains ont décidé de s’engouffrer. La société genealogie.com a en effet lancé une nouvelle version de son portail, en le rebaptisant pour l’occasion Filae.com. Or un grand changement a eu lieu au niveau du contenu disponible puisque le site contient à présent la quasi-intégralité de l’état civil français, récupéré sur les sites d’archives départementales, soit plus de 100 millions d’images numérisées.

filae
La page d’accueil du nouveau site Filae.com.

Il faut savoir que cette entreprise est restée pendant longtemps en conflit avec plusieurs départements qui refusaient de lui fournir l’état civil numérisé. L’affaire a même dégénéré en contentieux devant les tribunaux administratifs qui ont rendu plusieurs décisions contradictoires, jusqu’à ce la Cour Administrative d’Appel de Bordeaux vienne trancher en mai 2015 en défaveur de la société. Dans cette décision, qui a fait couler beaucoup d’encre, la Cour a estimé que le département de la Vienne pouvait valablement opposer à la société son droit sui generis de producteur de base de données, ce qui revenait à neutraliser en pratique le droit à la réutilisation des informations publiques.

Mais la situation a changé avec les lois Valter et Lemaire. Tout d’abord, le droit des bases de données ne constitue plus un obstacle, y compris dans le champ des institutions culturelles. La loi République numérique contient en effet un article 11 rédigé comme suit :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Cela signifie que les administrations (sauf lorsqu’elles gèrent des SPIC – services publics à caractère industriel et commercial) ne peuvent plus désormais opposer leur droit de producteur de bases de données aux demandes de réutilisation d’informations publiques, et les institutions culturelles ne bénéficient d’aucun privilège en la matière. C’est ce qui explique que la société ait pu aspirer en masse les données d’état civil pour alimenter son site Filae.com (actes constituant des « extractions substantielles » normalement interdites au titre de la protection des bases de données).

Des règlements de réutilisation devenus caducs

Par ailleurs, la majorité des services d’archives départementales avaient mis en place des tarifs de réutilisation, établis sur le fondement de la loi du 17 juillet 1978 relative à la réutilisation des informations publiques (l’ancienne loi CADA, aujourd’hui transposée dans le Code des Relations entre le public et l’administration). Mais la loi Valter a prévu à son article 10 – II une période transitoire au cours de laquelle les établissements doivent mettre en conformité leurs licences avec les nouvelles dispositions de la loi, notamment en ce qui concerne les modalités de calcul des redevances qui ont été modifiées. Or c’est ici que le texte présente une brèche, car visiblement, les départements n’ont pas respecté ces délais pour mettre à jour leurs règlements, ce qui les a rendus… caducs !

C’est la raison que la société avance pour justifier la manière dont elle a agi et ces arguments sont aussi détaillées par l’avocate Virginie Delannoy dans cet intéressant billet :

L’article 10-II de la loi Valter a fixé aux départements un délai transitoire, expirant le 1er décembre 2016, pour mettre leurs règlements et licences de réutilisation en conformité avec les nouvelles règles cardinales de la gratuité ou de la fixation d’une redevance modérée orientée vers les coûts spécifiques engendrés par la numérisation des données (article 15 de la loi du 17 juillet 1978 modifiée).

On peut donc déduire de tout ce qui précède que les services d’archives départementales se sont retrouvées ces derniers jours dans un véritable état d’apesanteur juridique : plus de droit des bases de données opposable et plus de licence de réutilisation valide. Cela ouvrait la voie à une aspiration systématique des fichiers par Filae.com qui ne s’est pas gêné pour le faire. Je ne sais pas exactement ce qui va se passer à présent : on peut s’attendre à ce que les départements adoptent en catastrophe de nouveaux règlements de réutilisation, mais pourront-ils les faire valoir à l’encontre de l’entreprise pour l’obliger à verser une redevance pour les données qu’elle exploite ? Filae.com met les autorités publiques devant le fait accompli et devient le seul acteur à disposer de la quasi-intégralité de l’état civil en un point centralisé. 

Sur son blog, Filae.com soutient que les Lois Valter et Lemaire ont eu pour effet de faire passer les données d’archives en Open Data :

Ce projet a été rendu possible grâce aux travaux de numérisation des registres originaux principalement réalisés par les départements français. En vertu de la loi Valter « relative à la gratuité et aux modalités de la réutilisation des informations du secteur public » et de la loi Lemaire « pour une République Numérique », ces données officielles numérisées sont, depuis le 1er décembre 2016, librement réutilisables en Opendata par tout un chacun : citoyen, startup, associations…

En réalité, c’est faux. La combinaison des lois Valter et Lemaire fait que l’on est certain à présent que les services d’archives ne peuvent plus refuser des demandes de réutilisation commerciale de leurs données, mais ils peuvent encore fixer des redevances et il restera à présent à déterminer si les départements vont pouvoir opposer à la société leurs nouveaux règlements après régularisation. Il n’est d’ailleurs pas impossible que l’affaire suscite de nouveaux contentieux devant la justice administrative et bien malin qui pourra en déterminer l’issue… 

Quelles conséquences au-delà des archives ?

Mais prenons un peu de recul par rapport à cette affaire Filae.com et examinons les conséquences plus larges que pourrait avoir la révélation de cette « brèche » dans la loi Valter. D’autres institutions culturelles vont être (et même sont déjà) affectées par le même problème, bien au-delà des services d’archives. Un certain nombre d’établissements ont en effet établi les conditions d’utilisation de leurs sites sur la loi du 17 juillet 1978. C’est le cas par exemple de Gallica à la Bibliothèque nationale de France :

1/ Les contenus accessibles sur le site Gallica sont pour la plupart des reproductions numériques d’oeuvres tombées dans le domaine public provenant des collections de la BnF.
Leur réutilisation s’inscrit dans le cadre de la loi n°78-753 du 17 juillet 1978 :
– La réutilisation non commerciale de ces contenus est libre et gratuite dans le respect de la législation en vigueur et notamment du maintien de la mention de source.
– La réutilisation commerciale de ces contenus est payante et fait l’objet d’une licence. Est entendue par réutilisation commerciale la revente de contenus sous forme de produits élaborés ou de fourniture de service. Cliquer ici pour accéder aux tarifs et à la licence

[…]

3/ Gallica constitue une base de données, dont la BnF est producteur, protégée au sens des articles L341-1 et suivants du code de la propriété intellectuelle.

[…]

5/ L’utilisateur s’engage à respecter les présentes conditions d’utilisation ainsi que la législation en vigueur. En cas de non respect de ces dispositions, il est notamment passible d’une amende prévue par la loi du 17 juillet 1978.

A l’image de ce qui s’est passé pour les services d’archives départementales, ces CGU ont perdu toute valeur, car le droit des bases de données est devenu inopposable et les licences établies sur le fondement de la loi du 17 juillet 1978 doivent être révisées. Il en résulte que, dans l’intervalle, les contenus de Gallica peuvent être librement employés à toutes fins. Il est donc possible de les réutiliser dans un cadre commercial, mais aussi de les rediffuser sur des sites comme Wikimedia Commons ou Internet Archive, ce qui n’était pas possible jusqu’à présent, en vertu des restrictions imposées à l’usage commercial (non que ces sites fassent eux-mêmes un usage commercial des contenus, mais ils permettent aux tiers d’en effectuer).

De l’urgence à repenser la politique de diffusion des données culturelles

Un nombre important de bibliothèques, archives et musées s’appuient aussi sur la loi du 17 juillet 1978 dans leurs CGU et à défaut d’être en Open Data, leurs sites sont donc passés jusqu’à nouvel ordre en mode Open Bar !  L’incident Filae.com pourrait donc avoir des incidences beaucoup plus fortes sur le secteur et c’est toute la stratégie de « Ligne Maginot » des institutions culturelles françaises qui va peut-être brusquement s’écrouler… Cela fait pourtant à présent des années que des groupes comme SavoirsCom1 disent que ces politiques sont ineptes et plaident pour une autre approche du rapport aux usages commerciaux et aux plateformes de libre diffusion comme Wikimedia Commons et Internet Archive.

Comme j’ai déjà eu l’occasion de le dire à plusieurs reprises, je n’ai aucune sympathie particulière pour des initiatives privées comme Filae.com, qui par leur caractère centralisateur peuvent être génératrices de nouvelles enclosures sur le bien commun que constituent des ressources comme l’Etat civil numérisé. Mais c’est la raison pour laquelle nous étions plusieurs à plaider pour que ces données passent sous un régime de partage à l’identique, n’empêchant pas les réutilisations commerciales, mais imposant aux acteurs privés la libre rediffusion des données. Cette solution, qui a été retenue par certaines institutions minoritaires comme les archives municipales de Toulouse, se serait avérée bien plus protectrice au final que les licences payantes de réutilisation, réduites à présent à l’état de « tigres de papier »…

Au final, cet épisode tragi-comique est révélateur de l’errance des politiques culturelles en matière de réutilisation des données. On  notera par exemple que le 5 décembre dernier le Ministère de la Culture a ouvert un nouveau portail Open Data sur lequel il diffuse une (petite) trentaine de jeux de données. Les pages de présentation du projet nous disent que « Le Ministère de la culture et de la communication est pleinement engagé dans la politique en faveur de l’ouverture et du partage des données publiques, ainsi que dans le développement d’une économie numérique culturelle. » Mais la réalité est hélas différente : le Ministère de la Culture a en effet effectué un travail de lobbying forcené au moment de l’adoption de la loi Valter pour que les établissements culturels conservent le privilège d’échapper à l’Open Data par défaut. Et son portail n’est qu’un arbre masquant la forêt, car les données les plus importantes en matière culturelle ne sont pas au niveau du Ministère, mais chez les opérateurs que sont les services de musées, d’archives et de bibliothèques (au niveau national et au niveau des collectivités locales).

***

Il est piquant de remarquer  que la même semaine où ouvrait cette belle façade d’Open Data ministériel se lançait le site Filae.com alimenté par une opération cavalière d’aspiration massive des données des services d’archives départementales, qui se croyaient pourtant à l’abri derrière leurs licences payantes. C’est un bon résumé de la situation schizophrénique dans laquelle se trouve l’Open Data culturel dans notre pays et on espère que ce fail retentissant révélé par l’affaire Filae.com sera l’occasion de résorber enfin ces contradictions dans le sens de l’ouverture.

Quelle réalité pour le principe d’Open Data « par défaut » de la loi Lemaire ?

C’est l’un des points sur lesquels la secrétaire d’Etat Axelle Lemaire avait le plus insisté lors du processus d’élaboration de la Loi numérique : la volonté d’instaurer en France un « principe d’Open Data par défaut« .

16323834751_0b990c39a9_b

A quelques semaines du début des débats à l’Assemblée nationale sur le texte, Next INpact a consacré hier un article à cette question où le journaliste Xavier Berne examine les dispositions relatives à « l’ouverture par défaut des données publiques« . On peut y lire notamment ceci :

Le Premier ministre s’y était engagé en juin dernier : inscrire dans la loi « le principe d’Open Data par défaut ». Aujourd’hui, le citoyen qui souhaite obtenir un document public (rapport, délibération, étude, correspondance, statistiques…) doit généralement en faire la demande auprès de l’administration. L’objectif du projet de loi « pour une République numérique » est donc de renverser ce paradigme, pour que l’ouverture devienne la règle et la fermeture l’exception.

Concrètement, cela signifie que toutes les données publiques détenues par les ministères ou certains établissements publics devraient être systématiquement mises en ligne par les pouvoirs publics – hormis certains documents relevant par exemple du secret des affaires.

Le problème, c’est que cette affirmation ne se révèle que partiellement vraie à la lecture attentive du texte.

Rappel : ce que l’Open Data veut dire… 

Pour comprendre pourquoi, il faut revenir à la définition de ce qu’est l’Open Data. On peut pour cela reprendre la fameuse « échelle en 5 étoiles » proposée par Tim Berners-Lee :

5-stars

On voit au premier niveau que pour parler d’Open Data au sens propre, les données doivent être publiées en ligne sous une licence ouverte garantissant la libre réutilisation.

C’est pour ainsi dire l’exigence première en matière d’Open Data, les niveaux supérieurs renvoyant davantage à des degrés de qualité des données (données structurées, format ouvert) ou à leur insertion dans le web de données ou Linked Data.

Mise en ligne à géométrie variable

Or c’est sur cette question basique de la mise en ligne des données que la loi Lemaire comporte encore une faiblesse relativement importante. En l’état, l’article 4 de la loi impose aux administrations de plus de 250 agents ou salariés de « rendre publics en ligne, sous un format ouvert aisément réutilisables » quatre type d’éléments (résumés ci-dessous par Xavier Berne) :

  • Les bases de données (et leur contenu).
  • Les documents communiqués à des particuliers suite à des procédures « CADA », ainsi que leurs « mises à jour ».
  • Les « données dont l’administration, qui les détient, estime que leur publication présente un intérêt économique, social ou environnemental ».
  • Les « principaux documents » figurant dans le répertoire d’informations publiques prévu par l’article 17 de la loi CADA.

Certes, l’inclusion des bases de données dans le périmètre de cet article constitue une grande avancée par rapport à la situation légale préexistante (surtout que le projet de loi précise plus loin à l’article 7 que les administrations ne pourront plus opposer leur droit de producteur de base de données à une demande de réutilisation, ce qui s’est déjà produit par le passé). Les bases de données produites par les administrations devront en principe être accessibles en ligne et on peut bien parler à leur sujet d’Open Data « par défaut ».

Par contre, pour ce qui concerne les documents administratifs, qui sont eux-aussi susceptibles de contenir des informations publiques, l’effet de la loi risque d’être plus limité. En effet, les administrations ne sont tenues de mettre en ligne de manière spontanée que les documents « communiqués à des particuliers suite à une procédure CADA« .

On ne sort donc pas vraiment à leur sujet de la situation préexistante, dans laquelle il fallait que les citoyens aillent demander à l’administration communication des données qu’ils souhaitaient réutiliser.

Logique persistante d’Open Data « à la demande » 

Cette lecture est confirmée par ce billet publié à la mi-décembre sur le blog d’Etalab qui analyse les conséquences de la loi Lemaire, dans lequel on peut lire ceci :

  • l’open data se développera sur la demande des citoyens : ainsi, les administrations seront tenues de diffuser en ligne les documents communicables à tous qui auront fait l’objet d’une demande de communication, ainsi que les mises à jour de ces documents;

  • par ailleurs, les administrations seront tenues de publier spontanément en ligne les documents qui figurent dans leurs répertoires d’informations publiques, ainsi que leurs bases de données. Elles diffuseront en outre les données présentant un intérêt économique, social ou environnemental.

Le premier paragraphe montre bien qu’on reste – du moins pour les documents contenant des informations publiques – dans une logique d’Open Data « à la demande », sans aller vers un passage à une logique d’offre systématique par l’administration.

RIP à la carte (et à trous)

Le projet de loi numérique ajoute cependant que les administrations devront aussi mettre en ligne les « principaux documents » figurant dans le répertoire d’informations publiques (RIP) qu’elles doivent tenir en vertu de l’article 17 de la loi CADA (dont voici le texte) :

Les administrations qui produisent ou détiennent des informations publiques tiennent à la disposition des usagers un répertoire des principaux documents dans lesquels ces informations figurent.

Les conditions de réutilisation des informations publiques ainsi que, le cas échéant, le montant des redevances et les bases de calcul retenues pour la fixation de ce montant sont rendus publics, dans un standard ouvert, par les administrations mentionnées à l’article 1er qui les ont produites ou reçues.

D’après la rédaction de cet article 17, la tenue du RIP est une obligation pour les administrations, ce qui devrait garantir en principe la mise en ligne de nombreux documents. Pourtant, si la plupart des Ministères ont établi un RIP, je ne suis pas certain que ce soit encore le cas pour tous. Par ailleurs, la majorité des établissements publics n’ont pas encore mis en place de tels répertoires et c’est pourtant à ce niveau que se situe à présent l’essentiel des données restant à libérer en France. En l’absence de répertoire, l’effet de la loi Lemaire risque d’être limité pour beaucoup d’administrations.

Quand bien même ce serait le cas, la loi ne fait obligation de faire figurer dans le RIP que les « principaux documents » produits par les administrations. Et la loi Lemaire indique de son côté que l’obligation de mise en ligne ne porte que sur les « principaux documents » figurant dans le RIP. Donc en définitive, la mise en ligne ne portera que sur les « principaux documents » parmi « les « principaux documents » produits par les administrations…

Comment arriver à un véritable Open Data « par défaut » ? 

On mesure déjà qu’on est loin en réalité d’un véritable Open Data « par défaut » avec mise en ligne spontanée des informations par l’administration et une large part de sélectivité risque de subsister. Cet état de fait est confirmé par le texte de l’article 4 qui ajoute que les administrations devront aussi mettre en ligne  les « données dont l’administration, qui les détient, estime que leur publication présente un intérêt économique, social ou environnemental ».

On reste encore ici dans une pure faculté discrétionnaire étant donné que l’évaluation de l’intérêt de la publication reste soumis à l’appréciation de l’administration concernée. Est-ce que par exemple les documents relatifs au budget ou au personnel d’un établissement public doivent ou non aller en ligne ? Ce sera aux instances dirigeantes d’en décider, comme c’était déjà le cas auparavant, alors qu’on pourrait penser qu’il s’agit au contraire des premières données qui devraient passer en Open Data.

En réalité pour imposer un véritable « Open Data par défaut », il aurait fallu que l’article 4 de la loi indique que l’obligation de mise en ligne pro-active concerne non seulement les documents « communiqués à des particuliers suite à une procédure CADA« , mais aussi tous ceux qui sont « communicables » en vertu de la loi du 17 juillet 1978.

On aurait eu alors un effet de levier très puissant et on serait sorti une fois pour toute de la logique insatisfaisante d’un Open Data « à la demande ».

Et les collectivités locales ? 

De manière paradoxale, les collectivités locales, qui sont pourtant explicitement exclues du champ de l’article 4 de la loi numérique, risquent d’être soumises à une obligation beaucoup plus forte de mise en ligne spontanée des documents qu’elles produisent.

L’article 106 de la Loi NOTRe adoptée cet été indique en effet que :

Les collectivités territoriales de plus de 3 500 habitants ainsi que les établissements publics de coopération intercommunale à fiscalité propre auxquels elles appartiennent rendent accessibles en ligne les informations publiques mentionnées à l’article 10 de la loi du 17 juillet 1978 […], lorsque ces informations se rapportent à leur territoire et sont disponibles sous forme électronique.

Contrairement aux administrations centrales et aux établissements publics rattachés à l’État, les collectivités locales de plus de 3500 habitants seront donc bien dans l’obligation de mettre en ligne toutes les informations publiques qu’elles produisent, ce qui implique nécessairement qu’elles publient aussi sur Internet l’intégralité des documents qui contiennent de telles informations.

Par contre, l’obligation de la loi NOTRe ne porte que sur l’accès en ligne et pas sur la réutilisation en tant que telle. On est ici davantage dans une logique d’Open Access que dans de l’Open Data au sens propre, les collectivités gardant comme aujourd’hui la faculté de décider de placer ou non leurs données sous licence ouverte.

Au final, on risque d’avoir au niveau de l’État une extension du principe de réutilisation, mais sans mise en ligne spontanée, tandis qu’au niveau des collectivités locales, on risque d’avoir une extension de la mise en ligne sans possibilité de réutilisation…

***

On voit donc qu’en définitive, ni au niveau de l’État, ni au niveau des collectivités locales, les changements législatifs récents ou à venir ne vont parvenir à satisfaire complètement cet objectif d’instauration d’un « Open Data par défaut ».

Pour ce qui concerne la loi Lemaire cependant, il serait assez simple pour les parlementaires qui vont bientôt examiner le texte de corriger ce défaut : il suffirait comme je l’ai dit plus haut d’amender l’article 4 du projet de loi pour faire en sorte que l’obligation de mise en ligne concerne tous les documents communicables au sens de la loi CADA et pas les documents effectivement communiqués.

Un simple mot à changer : c’est la condition pour éviter un Open Data « en trompe-l’oeil » que la loi risque de produire autrement…