Une énorme faille dans la loi Valter sur les données culturelles ?

La loi pour une République numérique (dite Loi Lemaire) va avoir en France un impact important en matière d’ouverture des données publiques, puisqu’elle institue un principe d’Open Data par défaut, dont j’ai déjà eu l’occasion de parler plusieurs fois dans ce blog (ici ou ). Mais ceux qui ont suivi attentivement cette évolution savent qu’il y a un secteur qui a réussi à conserver une position de privilège pour ne pas participer à cette dynamique d’ouverture : celui de la culture et du patrimoine.

Head in Hands
Facepalm pour la politique de réutilisation des données culturelles en France. (Images par Alex E. Proimos. CC-BY. Source : Wikimedia Commons).

C’est notamment l’effet de la loi du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (dite aussi loi Valter). Ce texte ainsi que son décret d’application vont permettre aux établissements culturels (bibliothèques, archives, musées) – là où la quasi-integralité des autres administrations sont désormais soumises à un principe de gratuité – de continuer à lever des redevances pour la réutilisation d’informations issues des opérations de numérisation de leurs collections (et des métadonnées associées).

Du côté de SavoirsCom1, nous avons fermement combattu cette politique de maintien d’un statut dérogatoire pour les établissements culturels, notamment parce qu’elle revient à institutionnaliser les pratiques de Copyfraud sur les reproductions fidèles d’oeuvres du domaine public et à neutraliser les libertés qu’il autorise. C’est la raison pour laquelle nous avions poussé pour que la loi Lemaire consacre la notion de « domaine commun informationnel » afin de sanctuariser les oeuvres du domaine public contre les tentatives de réappropriation. Mais les arbitrages politiques ont joué en notre défaveur, malgré le soutien du Conseil National du Numérique et de plusieurs députés.

Aspiration de données pour Filae.com

C’était donc la soupe à la grimace sur le volet culturel de l’ouverture des données publiques, jusqu’à ce qu’un événement survienne la semaine dernière qui montre que la « ligne Maginot » érigée par la loi Valter comporte visiblement une brèche béante dans laquelle certains ont décidé de s’engouffrer. La société genealogie.com a en effet lancé une nouvelle version de son portail, en le rebaptisant pour l’occasion Filae.com. Or un grand changement a eu lieu au niveau du contenu disponible puisque le site contient à présent la quasi-intégralité de l’état civil français, récupéré sur les sites d’archives départementales, soit plus de 100 millions d’images numérisées.

filae
La page d’accueil du nouveau site Filae.com.

Il faut savoir que cette entreprise est restée pendant longtemps en conflit avec plusieurs départements qui refusaient de lui fournir l’état civil numérisé. L’affaire a même dégénéré en contentieux devant les tribunaux administratifs qui ont rendu plusieurs décisions contradictoires, jusqu’à ce la Cour Administrative d’Appel de Bordeaux vienne trancher en mai 2015 en défaveur de la société. Dans cette décision, qui a fait couler beaucoup d’encre, la Cour a estimé que le département de la Vienne pouvait valablement opposer à la société son droit sui generis de producteur de base de données, ce qui revenait à neutraliser en pratique le droit à la réutilisation des informations publiques.

Mais la situation a changé avec les lois Valter et Lemaire. Tout d’abord, le droit des bases de données ne constitue plus un obstacle, y compris dans le champ des institutions culturelles. La loi République numérique contient en effet un article 11 rédigé comme suit :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Cela signifie que les administrations (sauf lorsqu’elles gèrent des SPIC – services publics à caractère industriel et commercial) ne peuvent plus désormais opposer leur droit de producteur de bases de données aux demandes de réutilisation d’informations publiques, et les institutions culturelles ne bénéficient d’aucun privilège en la matière. C’est ce qui explique que la société ait pu aspirer en masse les données d’état civil pour alimenter son site Filae.com (actes constituant des « extractions substantielles » normalement interdites au titre de la protection des bases de données).

Des règlements de réutilisation devenus caducs

Par ailleurs, la majorité des services d’archives départementales avaient mis en place des tarifs de réutilisation, établis sur le fondement de la loi du 17 juillet 1978 relative à la réutilisation des informations publiques (l’ancienne loi CADA, aujourd’hui transposée dans le Code des Relations entre le public et l’administration). Mais la loi Valter a prévu à son article 10 – II une période transitoire au cours de laquelle les établissements doivent mettre en conformité leurs licences avec les nouvelles dispositions de la loi, notamment en ce qui concerne les modalités de calcul des redevances qui ont été modifiées. Or c’est ici que le texte présente une brèche, car visiblement, les départements n’ont pas respecté ces délais pour mettre à jour leurs règlements, ce qui les a rendus… caducs !

C’est la raison que la société avance pour justifier la manière dont elle a agi et ces arguments sont aussi détaillées par l’avocate Virginie Delannoy dans cet intéressant billet :

L’article 10-II de la loi Valter a fixé aux départements un délai transitoire, expirant le 1er décembre 2016, pour mettre leurs règlements et licences de réutilisation en conformité avec les nouvelles règles cardinales de la gratuité ou de la fixation d’une redevance modérée orientée vers les coûts spécifiques engendrés par la numérisation des données (article 15 de la loi du 17 juillet 1978 modifiée).

On peut donc déduire de tout ce qui précède que les services d’archives départementales se sont retrouvées ces derniers jours dans un véritable état d’apesanteur juridique : plus de droit des bases de données opposable et plus de licence de réutilisation valide. Cela ouvrait la voie à une aspiration systématique des fichiers par Filae.com qui ne s’est pas gêné pour le faire. Je ne sais pas exactement ce qui va se passer à présent : on peut s’attendre à ce que les départements adoptent en catastrophe de nouveaux règlements de réutilisation, mais pourront-ils les faire valoir à l’encontre de l’entreprise pour l’obliger à verser une redevance pour les données qu’elle exploite ? Filae.com met les autorités publiques devant le fait accompli et devient le seul acteur à disposer de la quasi-intégralité de l’état civil en un point centralisé. 

Sur son blog, Filae.com soutient que les Lois Valter et Lemaire ont eu pour effet de faire passer les données d’archives en Open Data :

Ce projet a été rendu possible grâce aux travaux de numérisation des registres originaux principalement réalisés par les départements français. En vertu de la loi Valter « relative à la gratuité et aux modalités de la réutilisation des informations du secteur public » et de la loi Lemaire « pour une République Numérique », ces données officielles numérisées sont, depuis le 1er décembre 2016, librement réutilisables en Opendata par tout un chacun : citoyen, startup, associations…

En réalité, c’est faux. La combinaison des lois Valter et Lemaire fait que l’on est certain à présent que les services d’archives ne peuvent plus refuser des demandes de réutilisation commerciale de leurs données, mais ils peuvent encore fixer des redevances et il restera à présent à déterminer si les départements vont pouvoir opposer à la société leurs nouveaux règlements après régularisation. Il n’est d’ailleurs pas impossible que l’affaire suscite de nouveaux contentieux devant la justice administrative et bien malin qui pourra en déterminer l’issue… 

Quelles conséquences au-delà des archives ?

Mais prenons un peu de recul par rapport à cette affaire Filae.com et examinons les conséquences plus larges que pourrait avoir la révélation de cette « brèche » dans la loi Valter. D’autres institutions culturelles vont être (et même sont déjà) affectées par le même problème, bien au-delà des services d’archives. Un certain nombre d’établissements ont en effet établi les conditions d’utilisation de leurs sites sur la loi du 17 juillet 1978. C’est le cas par exemple de Gallica à la Bibliothèque nationale de France :

1/ Les contenus accessibles sur le site Gallica sont pour la plupart des reproductions numériques d’oeuvres tombées dans le domaine public provenant des collections de la BnF.
Leur réutilisation s’inscrit dans le cadre de la loi n°78-753 du 17 juillet 1978 :
– La réutilisation non commerciale de ces contenus est libre et gratuite dans le respect de la législation en vigueur et notamment du maintien de la mention de source.
– La réutilisation commerciale de ces contenus est payante et fait l’objet d’une licence. Est entendue par réutilisation commerciale la revente de contenus sous forme de produits élaborés ou de fourniture de service. Cliquer ici pour accéder aux tarifs et à la licence

[…]

3/ Gallica constitue une base de données, dont la BnF est producteur, protégée au sens des articles L341-1 et suivants du code de la propriété intellectuelle.

[…]

5/ L’utilisateur s’engage à respecter les présentes conditions d’utilisation ainsi que la législation en vigueur. En cas de non respect de ces dispositions, il est notamment passible d’une amende prévue par la loi du 17 juillet 1978.

A l’image de ce qui s’est passé pour les services d’archives départementales, ces CGU ont perdu toute valeur, car le droit des bases de données est devenu inopposable et les licences établies sur le fondement de la loi du 17 juillet 1978 doivent être révisées. Il en résulte que, dans l’intervalle, les contenus de Gallica peuvent être librement employés à toutes fins. Il est donc possible de les réutiliser dans un cadre commercial, mais aussi de les rediffuser sur des sites comme Wikimedia Commons ou Internet Archive, ce qui n’était pas possible jusqu’à présent, en vertu des restrictions imposées à l’usage commercial (non que ces sites fassent eux-mêmes un usage commercial des contenus, mais ils permettent aux tiers d’en effectuer).

De l’urgence à repenser la politique de diffusion des données culturelles

Un nombre important de bibliothèques, archives et musées s’appuient aussi sur la loi du 17 juillet 1978 dans leurs CGU et à défaut d’être en Open Data, leurs sites sont donc passés jusqu’à nouvel ordre en mode Open Bar !  L’incident Filae.com pourrait donc avoir des incidences beaucoup plus fortes sur le secteur et c’est toute la stratégie de « Ligne Maginot » des institutions culturelles françaises qui va peut-être brusquement s’écrouler… Cela fait pourtant à présent des années que des groupes comme SavoirsCom1 disent que ces politiques sont ineptes et plaident pour une autre approche du rapport aux usages commerciaux et aux plateformes de libre diffusion comme Wikimedia Commons et Internet Archive.

Comme j’ai déjà eu l’occasion de le dire à plusieurs reprises, je n’ai aucune sympathie particulière pour des initiatives privées comme Filae.com, qui par leur caractère centralisateur peuvent être génératrices de nouvelles enclosures sur le bien commun que constituent des ressources comme l’Etat civil numérisé. Mais c’est la raison pour laquelle nous étions plusieurs à plaider pour que ces données passent sous un régime de partage à l’identique, n’empêchant pas les réutilisations commerciales, mais imposant aux acteurs privés la libre rediffusion des données. Cette solution, qui a été retenue par certaines institutions minoritaires comme les archives municipales de Toulouse, se serait avérée bien plus protectrice au final que les licences payantes de réutilisation, réduites à présent à l’état de « tigres de papier »…

Au final, cet épisode tragi-comique est révélateur de l’errance des politiques culturelles en matière de réutilisation des données. On  notera par exemple que le 5 décembre dernier le Ministère de la Culture a ouvert un nouveau portail Open Data sur lequel il diffuse une (petite) trentaine de jeux de données. Les pages de présentation du projet nous disent que « Le Ministère de la culture et de la communication est pleinement engagé dans la politique en faveur de l’ouverture et du partage des données publiques, ainsi que dans le développement d’une économie numérique culturelle. » Mais la réalité est hélas différente : le Ministère de la Culture a en effet effectué un travail de lobbying forcené au moment de l’adoption de la loi Valter pour que les établissements culturels conservent le privilège d’échapper à l’Open Data par défaut. Et son portail n’est qu’un arbre masquant la forêt, car les données les plus importantes en matière culturelle ne sont pas au niveau du Ministère, mais chez les opérateurs que sont les services de musées, d’archives et de bibliothèques (au niveau national et au niveau des collectivités locales).

***

Il est piquant de remarquer  que la même semaine où ouvrait cette belle façade d’Open Data ministériel se lançait le site Filae.com alimenté par une opération cavalière d’aspiration massive des données des services d’archives départementales, qui se croyaient pourtant à l’abri derrière leurs licences payantes. C’est un bon résumé de la situation schizophrénique dans laquelle se trouve l’Open Data culturel dans notre pays et on espère que ce fail retentissant révélé par l’affaire Filae.com sera l’occasion de résorber enfin ces contradictions dans le sens de l’ouverture.

Quel statut pour les données de la recherche après la loi numérique ?

Ce billet est le troisième d’une série que j’ai entamée au début de la semaine pour cerner les répercussions de la loi « République numérique » sur le secteur de l’Enseignement supérieur et de la Recherche. Après avoir commencé lundi à passer en revue le volet Open Access de la loi, je me suis penché sur la question de l’ouverture des données publiques et sur la manière dont les universités ont été intégrées dans le principe « d’Open Data par défaut » instauré par le texte. Cela concerne au premier chef les données administratives de ces établissements- celles produites par leurs services centraux et communs -, mais je terminais en posant la question de savoir dans quelle mesure les données de la recherche allaient être impactées (ou non) par ces nouvelles obligations de publication en Open Data.

data

C’est ce sujet que je vais traiter dans ce troisième billet, en élargissant la perspective pour essayer de montrer en quoi la loi « République numérique » a commencé à mettre en place un statut juridique spécifique pour les données de la recherche. Vous allez voir que les répercussions potentielles de la loi sont profondes en la matière, même si le texte contient quelques zones d’ombre qui rendent encore assez imprévisibles ses effets à long terme.

Par « données de la recherche » – notion complexe à définir -, je n’entendrai pas les données sur la recherche (qui cherche sur quoi ? avec quels financements ? etc.), qui relèvent des données administratives et donc du nouveau principe d’Open Data par défaut, mais les données résultant directement des activités de recherche, produites par les chercheurs.

L’ébauche d’un statut spécifique pour les données de recherche

Il faut faire une lecture combinée de plusieurs articles de la loi numérique pour apercevoir dans le texte l’ébauche d’un statut juridique des données de recherche. L’article 38 – celui qui consacre une nouvelle exception au droit d’auteur en faveur du Text et Data Mining – contient à ce propos une précision intéressante. Le texte aborde en effet la question de la conservation des fichiers qui sont produits dans le cadre de ce type d’activités de recherche et il prend la peine d’indiquer la chose suivante :

[…] ces fichiers constituent des données de la recherche.

Cette phrase peut paraître à première vue assez anodine, mais elle signifie en réalité que les « données de la recherche » vont à présent constituer une nouvelle catégorie juridique au sens propre du terme, avec des conséquences en terme de régime applicable. C’est un premier indice  qui nous montre que la loi a introduit un « statut » spécifique pour les données de la recherche, même si comme vous allez le voir, il faut produire un effort d’interprétation conséquent pour cerner exactement en quoi il consiste.

Une protection puissante contre la captation par les éditeurs

A l’article 30 de la loi numérique – celui consacré à l’Open Access -, on trouve les premiers éléments de réponse. C’est là que la loi consacre un nouveau « droit d’exploitation secondaire » au profit des chercheurs leur garantissant la possibilité d’auto-archiver leurs écrits, en dépit des clauses des contrats d’exclusivité qu’ils auraient pu signer avec des éditeurs, au terme d’un délai de 6 à 12 mois selon les disciplines.

 Mais le texte contient aussi un passage sur les données de la recherche, qui instaure un mécanisme de protection contre leur captation par les éditeurs scientifiques :

L’éditeur d’un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication.

Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite.

Ce passage répond à une inquiétude grandissante dans les milieux académiques face aux pratiques des éditeurs vis-à-vis des données de recherche. Ces derniers – et notamment les plus puissants du secteur, type Elsevier ou Springer – ont commencé à inciter ces dernières années les chercheurs à publier non seulement le texte de leurs publications, mais aussi des matériaux complémentaires (complementary material), constitués en général par les jeux de données brutes ayant permis d’élaborer les résultats faisant l’objet de la publication. Grâce à leur position dominante, ces acteurs étaient donc en mesure d’emmagasiner peu à peu de grands volumes de données de recherche, soumises aux mêmes clauses d’exclusivité que les articles. Dès lors, le même phénomène de privatisation qui a frappé les écrits scientifiques était en train de se reproduire pour les données de recherche, avec à terme le risque pour les universités d’avoir à racheter aux éditeurs l’accès aux données que la communauté des chercheurs avaient produites.

Pour parer à ce danger, la loi numérique a prévu un mécanisme de protection assez similaire à celui du droit d’exploitation secondaire sur les écrits, même si on va voir qu’il est en réalité plus puissant dans ses effets. Le principe sera dorénavant que l’éditeur ne pourra plus « limiter la réutilisation des données de la recherche rendue publiques [accompagnant un écrit] dans le cadre de sa publication« . Cela signifie que, quand bien même des contrats contenant des clauses d’exclusivité seraient signés par les chercheurs, celles-ci seraient privées par la loi de toute validité. Plus encore, si l’éditeur rassemble ces informations fournies par les chercheurs dans une base de données, les Conditions Générales d’Utilisation (CGU) – qui ont une valeur contractuelle – ne pourront pas non plus empêcher la réutilisation des données de recherche. Elles doivent pouvoir en être librement extraites pour réutilisation. Sur ce dernier point, il faudra cependant attendre pour y voir plus clair les dispositions du décret d’application de l’article 38 de la loi sur le Text et Data Mining, qui doit déterminer les « conditions dans lesquelles l’exploration des textes et des données est mise en œuvre« .

On a donc ici un puissant mécanisme contre la captation à titre exclusif des données de la recherche par les éditeurs scientifiques, et on notera que par rapport au droit d’exploitation secondaire sur les écrits, ce dispositif de neutralisation des clauses contractuelles possède un effet immédiat. Il n’y a pas de durée d’embargo destinée à garantir une période d’exploitation commerciale exclusive pour l’éditeur. Les donnés de recherche sont en quelque sorte « immunisées » dès leur publication à toute tentative d’enclosure (pour employer un terme tiré de la théorie des Communs).

Puissante dans ses effets, cette disposition est cependant limitée dans son périmètre d’application. Notamment, elle n’est opposable qu’aux « éditeurs » d’un écrit scientifique auquel des données sont associées. Or on aurait aimé qu’elle puisse l’être également à des acteurs comme les réseaux sociaux numériques, type Academia ou Research Gate qui, déjà avides des données personnelles des chercheurs, pourraient très bien à terme aussi développer un appétit pour les données de la recherche. Et on sait aussi que certaines plateformes de diffusion des données de recherche sont contrôlées en réalité par des éditeurs (comme Figshare par exemple, qui est la propriété de Macmillian Publishers). Il aurait donc mieux valu que la protection conférée par l’article 30 soit formulée de manière plus générale pour être opposable à n’importe quel type d’acteurs, et pas uniquement aux éditeurs.

Mais moyennant ces réserves, on peut considérer que la loi numérique a posé des garde-fous précieux contre ce qui pourrait constituer dans les années à venir un grave problème pour l’écosystème de la recherche. Les éditeurs pourront tout à fait continuer à développer des activités autour des données de la recherche, mais ils devront fonder leurs modèles économiques sur de véritables services à valeur ajoutée. Ils ne pourront pas se contenter d’utiliser leur position dominante pour en revendre l’accès (à condition toutefois que se développe en parallèle une véritable politique publique d’infrastructures pour l’archivage et la diffusion des données scientifiques pour empêcher la constitution d’un monopole de fait. Mais c’est justement ce que la loi rend possible, en interdisant aux éditeurs de s’approprier en amont les données à titre exclusif).

Des données de recherche « libres » dès la publication

Pour revenir à l’article 30, on va voir à présent qu’il va créer une « condition juridique »originale pour les données de recherche et très différente de celle des articles scientifiques.

On sait en effet que les chercheurs constituent des agents publics qui ont la particularité de conserver pleinement leur droit d’auteur sur les œuvres qu’ils produisent dans le cadre de leurs fonctions (contrairement aux autres agents publics, dont les droits patrimoniaux sont exercés par leurs tutelles et dont le droit moral est réduit au droit à la paternité).

Une des conséquences secondaires de cette titularité individuelle des droits pour les chercheurs sur leurs écrits est que ceux-ci ne deviennent pas automatiquement réutilisables lorsqu’ils choisissent de les publier en ligne dans des archives ouvertes ou sur un site personnel. Le droit d’auteur qui s’applique à eux est pleinement maintenu lors de la diffusion sur Internet. C’est le cas par exemple pour un article déposé par un chercheur sur HAL ou dans une archive ouverte institutionnelle : par défaut, si le chercheur ne fait rien d’autre que le déposer, l’article sera librement accessible, mais pas librement réutilisable. Il ne le deviendra que si le chercheur choisit d’opter par un acte positif pour une licence Creative Commons (ce que la plate-forme HAL permet depuis le passage à la v3).

Cet état de fait justifie aux yeux de certains que l’on fasse une distinction entre « l’Accès ouvert »  et « l’Accès libre », les deux expressions renvoyant à deux réalités différentes. C’est notamment une précision que rappelle régulièrement Marin Dacos (et encore récemment dans la préface de la traduction d’un ouvrage de Peter Suber, dont voici un extrait)  :

Le terme open signifie « ouvert », et non « libre ». Il implique donc que le texte d’un article en open access est ouvert en lecture, sans barrière juridique, technique ou commerciale. Mais il ne dit rien des possibilités de réutilisation du document. Par conséquent, stricto sensu, l’open access lève les barrières à l’accès et maintient toutes les protections du droit d’auteur sur les textes, ce qui signifie qu’ils ne peuvent être reproduits ou modifiés qu’après une autorisation explicite, dans le cadre d’un contrat de cession de droit.

Or c’est précisément une distinction qui n’aura à présent plus de sens à propos des données de la recherche : des données publiées par un chercheur ou un établissement deviendront instantanément réutilisables librement, si bien que l’accès ouvert sera aussi synonyme d’accès libre.

C’est ce qui ressort notamment de ce passage de l’article 30 de la loi :

Dès lors que les données issues d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités territoriales, des établissements publics, des subventions d’agences de financement nationales ou par des fonds de l’Union européenne ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu’elles ont été rendues publiques par le chercheur, l’établissement ou l’organisme de recherche, leur réutilisation est libre.

« Leur réutilisation est libre ». La formule peut paraître lapidaire, mais elle n’en a pas moins d’importantes conséquences sur le plan juridique. Ces termes doivent être pris au sens de la lettre : la réutilisation est complètement libre, à toutes fins (y compris commerciales) et sans condition (pas même celle de citer la source). 

On peut en déduire (et c’est assez révolutionnaire) que la loi numérique va rendre inutile le recours aux licences libres pour la diffusion des données de la recherche. On sait que pour encadrer l’ouverture des données publiques en France, l’Etat a créé la Licence ouverte / Open Licence (qui permet la réutilisation des informations  à toutes fins, à condition d’en citer la source). D’autres licences, comme l’ODbL ou les licences Creative Commons, sont également utilisables en matière d’ouverture de bases de données. Or pour les données de recherche, de tels instruments sont à présent inutiles, car c’est la loi directement qui instaure à leur sujet un droit de libre réutilisation dès lors qu’elles sont publiées. 

On peut même aller plus loin en disant qu’il ne faut pas utiliser ces outils pour diffuser des données de recherche, car ces différentes licences comportent des conditions de réutilisation plus restrictives que le droit de libre réutilisation totale prévu par la loi. Or ces clauses (BY/NC/ND/SA) n’auront plus d’effet utile en raison du caractère d’ordre public des dispositions de l’article 30. La seule licence dorénavant compatible avec le régime légal des données de recherche est la CC0 

En cela, ce texte innove réellement, car c’est à ma connaissance un des seuls cas où la loi française va créer du « libre à l’état natif », sans avoir besoin de recourir à des licences pour opérer cette libération. Les dispositions de la loi se déclenchent automatiquement par l’acte de publication (et vous noterez d’ailleurs que le texte ne parle pas de publication « en ligne », mais simplement de publication, ce qui couvre des hypothèses plus larges, comme la diffusion via une base de données commerciale).

Quelles limites à la libre réutilisation ?

Néanmoins, il faut immédiatement préciser que l’article 30 a prévu de limiter son périmètre d’application, en excluant certains types de données de cet effet de « libération immédiate ». Il indique en effet que la réutilisation est libre , sauf si les données « sont protégées par un droit spécifique ou une réglementation particulière« .

Cette précision peut paraître à première vue assez sibylline, mais elle est en réalité parfaitement logique. On peut en effet penser à des données correspondant à des informations à caractère personnel, qui sont protégées par une « réglementation particulière ». Si c’est le cas, alors bien évidement, leur réutilisation ne sera pas libre, mais soumise à ce que prévoit la législation en la matière.

On peut aussi penser également au droit à l’image des personnes, qui constitue un « droit spécifique ». Celui-ci ne cédera pas du fait que des matériaux serait utilisés à des fins de recherche. Il est donc normal que le législateur ait prévu ces restrictions à la libre réutilisation des données de recherche, qui permettent de concilier des principes d’égale valeur.

Quid de l’articulation avec les droits de propriété intellectuelle ?

Mais la question devient plus épineuse si l’on entend par « droits spécifiques » des droits de propriété intellectuelle. Cela entre d’ailleurs manifestement dans l’intention du législateur, puisque ces droits sont visés dans l’exposé des motifs de la loi :

Le II spécifie que la réutilisation de données issues d’activité de recherche financées majoritairement sur des fonds publics est libre, dès lors que ces données ne sont pas protégées par un droit spécifique, comme par exemple un droit de propriété intellectuelle, et qu’elles ont été rendues publiques par le chercheur ou l’organisme de recherche.

Si par droit de propriété intellectuelle, on entend le droit d’auteur, alors les choses sont somme toute logiques encore, notamment afin de préserver les droits des tiers. Imaginons qu’un corpus de recherche contienne des documents protégés par des droits d’auteur (par exemple, un ensemble de textes littéraires). Si ce corpus est publié, alors bien entendu, il ne peut devenir ipso facto librement réutilisable. Pour être plus exact, il sera réutilisable dans une certaine mesure, sur le fondement de l’exception  Text et Data Mining prévue à l’article 38 de la loi, mais pas sur celui du droit de libre réutilisation des données de la recherche figurant à l’article 30.

Le vrai problème que pose l’articulation de cet article 30 avec les droits de propriété intellectuelle se situe en fait au niveau du droit des bases de données. Imaginons qu’un chercheur ou un établissement publie un jeu de données sur lequel porte un droit sui generis de producteur de base de données. On a alors bien affaire à un objet protégé par un « droit spécifique » et dans ce cas, ce jeu ne devrait pas devenir « librement réutilisable », si l’on s’en tient à la seule lecture de l’article 30.

Si l’on admet une telle interprétation,  la portée de ce droit de libre réutilisation des données de la recherche serait en réalité bien limitée, car dès lors que des jeux de données sont un peu conséquents, la protection du droit des bases de données leur sera sans doute applicable. Par ailleurs, l’application de l’article deviendrait aussi très incertaine, car le droit de producteur des bases de données est souvent aléatoire dans sa mise en œuvre. La jurisprudence est en effet  fluctuante sur la question et il n’est pas simple a priori de déterminer si telle ou telle base bénéficie ou non de la protection.

Mais vous allez voir l’obstacle à la libre réutilisation que pourrait constituer le droit des bases de données n’est en réalité pas insurmontable.

Qui est réellement titulaire des droits sur les données de recherche ?

Pour démêler cette question, il faut se demander à qui appartient réellement la propriété sur les données de recherche. Et le raisonnement à suivre pour répondre est là encore complètement différent de celui applicable aux articles.

En effet, pour les écrits scientifiques, les chercheurs sont incontestablement titulaires du droit d’auteur. Ce qui signifie que même si un chercheur produit des écrits sur son temps de travail et avec les moyens fournis par une université, il reste entièrement maître du droit sur ses créations, et c’est lui qui décide où et comment publier ses écrits.

Or pour les bases de données, les choses sont différentes. Même si ce sont les chercheurs qui produisent les données figurant dans ces bases, la titularité des droits peut – et même va dans la plupart des cas – leur échapper. En effet, le Code de propriété intellectuelle prévoit que la notion de producteur d’une base de données ne s’entend pas des personnes physiques qui collectent et traitent les informations, mais de la personne – physique ou morale – qui « prend l’initiative et le risque des investissements correspondants » et en retour « bénéficie d’une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d’un investissement financier, matériel ou humain substantiel« .

C’est donc vers le financeur et le fournisseur de moyens qu’il faut se tourner pour déterminer qui est titulaire des droits sur une base de données de la recherche. Dans la plupart des cas, ce seront donc les établissements auxquels les chercheurs sont rattachés qui bénéficieront de ces droits et non les chercheurs. Contrairement à ce qui prévaut pour les articles et autre écrits scientifiques, les bases de données appartiennent donc en principe aux institutions de recherche.

Sans doute faut-il nuancer quelque peu cette affirmation. Imaginons un chercheur qui publie un article dans une revue et qui lui adjoint un tableau de données brutes lui ayant servi à arriver aux résultats faisant l’objet de la publication. Dans ce cas, il est possible que le chercheur soit la personne qui a réalisé les « investissements » nécessaires –  sur ses propres forces – pour produire ces données. Mais quand bien même, il est fort improbable que de tels investissements individuels soient considérés comme « substantiels » au sens de la jurisprudence et ce tableau ne constituera vraisemblablement pas une base de données protégée. Donc il y a peu de chances qu’un chercheur isolé puisse être considéré comme un « producteur de base de données », au sens juridique du terme.

Imaginons à présent une base de données produite collaborativement et maintenue par les chercheurs d’un laboratoire ou une base de données développée spécifiquement dans le cadre d’un projet de recherche majoritairement financé par de l’argent public. Alors c’est l’employeur des chercheurs qui sera vraisemblablement titulaire des droits de producteur de base de données, car c’est lui qui assure les investissements nécessaires à la production de la base.

Or si c’est l’université qui est titulaire ab initio des droits sur une base de données scientifiques, cela aura d’importantes  conséquences du point de vue de la loi numérique. Pour le comprendre, il faut vous reporter au billet précédent que j’ai écrit sur l’Open Data et les universités, car vous allez voir que cette question rejoint en définitive celle des données de la recherche.

Le droit des bases de données des universités est neutralisé par défaut

En effet, l’article 11 de la loi numérique contient une disposition qui neutralise le droit des bases de données dont pourrait bénéficier les administrations soumises au principe d’Open Data par défaut (ce qui est le cas des universités) :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Donc on peut en déduire que si une université est titulaire d’un droit de producteur de base de données scientifiques, alors elle ne peut opposer ce droit à la réutilisation des informations qu’elle contient. Cela revient dès lors à dire que la réutilisation de ces données de recherche, nonobstant le droit de producteur de base de données, est bien « libre ».

Et nous rebouclons ici avec l’article 30 et son droit de libre réutilisation des données de recherche. De tout ce qui précède, nous pouvons conclure que l’article 30 nous dit bien que le droit de libre réutilisation des données de recherche ne vaut pas lorsque celles-ci sont protégées par un « droit spécifique », mais comme je viens de le montrer, cela ne peut concerner le droit de producteur de base de données qui, de toutes façons, est neutralisé en vertu de l’article 11 et ne peut être opposé à la libre réutilisation.

La conclusion est donc la suivante : des données de la recherche publiées par un chercheur ou un établissement seront donc bien librement réutilisables, sous réserve de respecter la législation sur les données personnelles ou le droit à l’image, ainsi que le droit d’auteur des tiers.

Reste alors une ultime question à considérer, car en définitive le seul moyen pour des chercheurs ou une institution d’empêcher la libre réutilisation de leurs données pourrait consister tout simplement à ne pas les publier. Mais vous allez voir qu’en réalité, ce choix-là n’existe pas non plus en vertu des dispositions combinées de la loi.

L’Open Data par défaut est applicable aux données de la recherche

Pour le comprendre, il faut revenir au principe d’Open Data par défaut que j’ai décrit dans le billet précédent. La loi numérique soumet dorénavant les administrations à l’obligation de publier de manière proactive et de rendre librement réutilisables un ensemble conséquent de documents et de données. C’est l’article 6 de la loi qui liste les informations concernées :

Sous réserve des articles L. 311-5 et L. 311-6 et lorsque ces documents sont disponibles sous forme électronique, les administrations mentionnées au premier alinéa de l’article L. 300-2, à l’exception des personnes morales dont le nombre d’agents ou de salariés est inférieur à un seuil fixé par décret, publient en ligne les documents administratifs suivants :
« 1° Les documents qu’elles communiquent en application des procédures prévues au présent titre, ainsi que leurs versions mises à jour ;
« 2° Les documents qui figurent dans le répertoire mentionné au premier alinéa de l’article L. 322-6 ;
« 3° Les bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent et qui ne font pas l’objet d’une diffusion publique par ailleurs ;
« 4° Les données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental.

Comme vous le voyez, la loi impose la publication en ligne des « bases de données ». Cela signifie que si l’université est titulaire du droit de producteur de bases de données scientifiques développées en son sein (et nous avons vu dans la partie précédente que ce sera généralement le cas), alors elle devra les mettre en ligne en Open Data (à la seule réserve de la protection des données personnelles).

L’article précise aussi que les données présentant un intérêt « économique, sociétal, sanitaire ou environnemental » entrent dans le principe d’Open Data par défaut. Cela laisse une large marge d’interprétation  pour déterminer ce qui rentre dans ce périmètre. Mais une recherche serait bien insignifiante si les données qu’elle produit ne comportant pas a minima un intérêt « sociétal » et dans certains secteurs, ces informations revêtiront aussi un intérêt économique, environnemental ou sanitaire.

La conclusion de tout ceci – et je pense que les autorités de la recherche sont très loin de l’avoir suffisamment perçu -, c’est que la loi numérique va avoir des effets de levier très puissants sur la diffusion des données de la recherche en France. Là où les chercheurs ont gardé la faculté de décider s’ils publient ou non leur écrits en Open Access, ils l’ont manifestement perdue pour les données la recherche. Les universités dont ils dépendent ont à présent l’obligation de publier en ligne les données de la recherche produites en leur sein, et une fois publiées, ces données deviennent ipso facto librement réutilisables (sous la réserve – importante – de la protection des données personnelles et du respect des autres droits éventuels des tiers).

Dans l’hypothèse où les universités (ou les chercheurs) opposeraient une certaine inertie et ne respecteraient pas ces obligations de publication en Open Data, la loi n’a pas directement prévu de sanctions, mais il existera un mécanisme correctif assez facilement actionnable.

Le texte a en effet instauré un dispositif d’Open Data « à la demande » connecté au droit à la communication des documents administratifs. Si un individu, une association (ou même une entreprise) savent qu’un jeu de données de recherche existe, mais n’a pas encore fait l’objet d’une publication en Open Data, ils peuvent faire une demande de communication sur la base de la loi CADA. Si cette demande est fondée, l’université devra communiquer le document, mais aussi (s’il existe sous forme numérique), le mettre en ligne  et rendre librement réutilisables les informations qu’il contient dans un format ouvert lisible par les machines.

Au cas où les établissements de recherche n’agiraient pas d’eux-mêmes pour se conformer aux obligations de la loi, il existera donc un moyen de faire bouger les lignes par le biais de demandes de communication.

Conclusion : Données de la recherche et Communs de la connaissance

Pour conclure, je voudrais revenir sur la généalogie de la phrase « leur réutilisation est libre » figurant à l’article 30 de la loi numérique, qui joue un rôle central dans ce nouveau statut des données de la recherche créé par le texte.

A l’origine, le gouvernement avait l’ambition  d’introduire en droit français la notion de « domaine commun informationnel », en rattachant un certain  nombre d’informations et de données à la notion de « choses communes » issue de l’article 714 du Code civil :

Il est des choses qui n’appartiennent à personne et dont l’usage est commun à tous.

Il se trouve que les aléas politiques – et une bonne dose de lâcheté gouvernementale – ont entraîné l’abandon de l’article 8 de la loi qui manifestait cette ambition. Mais après la phase de consultation en ligne, le texte a été réécrit et ce sont les données de la recherche que le gouvernement a voulu qualifier de « choses communes » :

Les données de la recherche rendues publiques légalement issues d’une activité de recherche financée au moins pour moitié par des fonds publics et qui ne sont pas protégées par un droit spécifique sont des choses communes, au sens de l’article 714 du code civil.

Le Conseil d’Etat s’est alors prononcé sur cette version et il a émis un avis défavorable à propos de cette rédaction (au motif qu’aucune étude d’impact n’avait été réalisée sur ce point précis…).

L’argument était bien faible, mais il a suffi à ce que le texte du projet de la loi soit encore été remanié, avant l’introduction au Parlement, et c’est là qu’est apparue la rédaction qui y figure encore : « leur réutilisation est libre« .

Le rattachement explicite des données de la recherche aux choses communes a donc été gommé au fil des versions successives, mais si l’on y réfléchit bien, le résultat final est exactement le même du point de vue des conséquences juridiques que cela emporte.

Car en effet, on peut tout à fait dire à présent que les données de la recherche « n’appartiennent à personne » : elles n’appartiennent pas aux chercheurs, car ce sont les universités qui détiennent généralement le droit de producteur de base de données sur elles. Mais celui-ci est neutralisé par l’article 11 de la loi, qui impose par ailleurs la mise en ligne proactive. Donc concrètement, les données ne sont soumises à aucun droit de propriété efficace.

Et j’ai montré que l’article 30 avait pour conséquence qu’une fois les données de la recherche publiées, leur usage devient pleinement libre et donc « commun à tous » (sous réserve de la préoccupation légitime de protéger les données personnelles et les droits des tiers).

Par ailleurs, ces données sont non seulement rendues librement réutilisables par l’effet de la loi, mais aussi protégées contre les phénomènes d’enclosure, comme je l’ai montré dans la première partie du billet à propos des mécanismes de défense vis-à-vis de la captation par les éditeurs. La liberté d’usage donnée par la loi ne peut être reprise par quiconque.

Donc la conclusion à laquelle nous devons aboutir, c’est que la loi numérique a bien créé un statut juridique remarquable pour les données de la recherche : elle en a fait des Communs de la connaissance.

 

Les universités françaises et l’Open Data après la loi numérique

Ce billet est le second d’une série de trois que je vais publier sur ce blog cette semaine pour examiner les répercussions de la loi « République numérique » sur le secteur de l’enseignement supérieur et de la recherche. Après un premier billet publié lundi à propos de l’impact de la loi en matière d’Open Access, je vais à présent me pencher sur le volet « Open Data » et la façon dont il va affecter les universités. Ce n’est pas l’aspect qui a été le plus commenté jusqu’à présent, mais vous allez voir que les changements à attendre pour ces établissements sont substantiels par rapport à la situation antérieure.

opendata
Image par Auregann. CC-BY-SA. Source : Wikimedia Commons.

Pour saisir complètement la portée de cette réforme, il faut prendre en considération, outre la loi « République numérique », la loi du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (dite aussi « loi Valter »), ainsi que son décret d’application paru en juillet dernier.

Je colle ci-dessous une présentation qui résume les grandes lignes de la question que je vais développer dans le billet par la suite.

Fin du régime dérogatoire des établissements d’enseignement supérieur et de recherche

Pour comprendre ce qui va changer pour les universités en matière d’ouverture des informations publiques qu’elles produisent, il faut remonter un peu en arrière et rappeler le cadre juridique qui leur était applicable avant l’entrée en vigueur de la loi numérique.

En 2005, la loi CADA (relative à l’accès aux documents administratifs) a été modifiée de manière à consacrer un principe de libre réutilisation des informations publiques des administrations. Néanmoins, la portée de cette règle était assez limitée, car si les administrations ne pouvaient en théorie refuser de faire droit à une demande de réutilisation de leurs données, elles n’étaient pas obligées de les mettre en ligne de manière pro-active et elles avaient aussi la possibilité de rendre la réutilisation payante par le biais de redevances.

A partir de 2011, un mouvement en faveur de l’Open Data a commencé à se dessiner en France, au niveau des administrations centrales, qui ont été obligées par le biais de décrets de mettre en ligne sur la plateforme data.gouv.fr un nombre croissant de jeux de données en les plaçant sous la Licence Ouverte / Open Licence (laquelle autorise la libre réutilisation y compris à des fins commerciales, à la condition de citer la source des données). Les ministères ont été les premières entités concernées par cette nouvelle politique et celui de l’Enseignement Supérieur et de la Recherche a publié à ce jour 55 jeux de données en Open Data.

Cependant les universités et les établissements de recherche sont restés de leur côté en dehors de ce mouvement d’Open Data, dans la mesure où ces administrations bénéficiaient d’un régime dérogatoire dans la loi CADA. Le texte comportait en effet un article 11 contenant les dispositions suivantes :

Par dérogation au présent chapitre, les conditions dans lesquelles les informations peuvent être utilisées sont fixées, le cas échéant, par les administrations […] lorsqu’elles figurent dans des documents produits ou reçus par :

a) des établissements et institutions d’enseignement et de recherche ;

b) des établissements, organismes ou services culturels.

Cet article signifiait que les établissements bénéficiaires (universités et institutions de recherche, mais aussi côté culture, bibliothèques, archives et musées) restaient libre de déterminer les conditions de réutilisation des informations qu’ils produisaient, et donc (pour simplifier) de ne pas autoriser les réutilisations. Cette forme de « privilège » a fait que ces administrations n’ont pas été concernées par les décrets de 2011 ayant initié la politique d’Open Data en France. Pour être exact, il ne leur était pas interdit d’ouvrir leurs données dans le cadre d’une politique d’Open Data, mais elles n’y étaient pas obligées et elles gardaient entièrement la faculté de déterminer quels jeux elles souhaitaient rendre librement réutilisables.

C’est précisément sur ce point que la loi « République numérique » va avoir un fort impact sur les universités, dans la mesure où le régime dérogatoire dont bénéficiaient les établissements d’enseignement supérieur et de recherche est supprimé. Ces derniers seront à présent intégrés au principe « d’Open Data par défaut » instauré par ce texte et qui en constitue une des principales innovations.

Les universités dorénavant incluses dans le principe « d’Open Data par défaut »

Pour comprendre en quoi consiste ce principe d’Open Data par défaut, il faut se reporter à l’article 6 de la loi « République numérique » :

Sous réserve des articles L. 311-5 et L. 311-6 et lorsque ces documents sont disponibles sous forme électronique, les administrations mentionnées au premier alinéa de l’article L. 300-2, à l’exception des personnes morales dont le nombre d’agents ou de salariés est inférieur à un seuil fixé par décret, publient en ligne les documents administratifs suivants :
« 1° Les documents qu’elles communiquent en application des procédures prévues au présent titre, ainsi que leurs versions mises à jour ;
« 2° Les documents qui figurent dans le répertoire mentionné au premier alinéa de l’article L. 322-6 ;
« 3° Les bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent et qui ne font pas l’objet d’une diffusion publique par ailleurs ;
« 4° Les données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental.

Contrairement à la situation antérieure, les administrations (sauf quelques exceptions maintenues notamment par la loi Valter) sont désormais obligées de publier en ligne et de rendre réutilisables un large ensemble de jeux de données, dont l’article 6 définit plusieurs catégories. Et la nouveauté, c’est que les universités ne bénéficient plus à présent d’un régime dérogatoire qui leur permettraient de se soustraire à cette obligation d’ouverture des informations publiques. Celui a été en effet explicitement supprimé par la loi Valter en octobre 2015.

Parmi la liste figurant à l’article 6, on trouve notamment les « bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent […] ». Cela concerne notamment les bases de données composant le système d’information de l’administration centrale des universités, qui leur servent à gérer des aspects comme le budget, le personnel, leurs bâtiments et les flux associés, les formations dispensées ou les activités de recherche des laboratoires rattachés à l’établissement.

Le texte impose aussi (alinéa 2) la mise en ligne des documents listés dans un Répertoire des Informations Publiques (RIP), qu’en vertu de l’ancien article 17 de la loi CADA, toutes les administrations sont tenues de mettre en place. Le RIP consiste en un registre mis à disposition des usagers dans lequel figure la liste des « principaux documents » comportant les informations produites par l’établissement. A ma connaissance, aucune université française n’a encore rempli cette obligation légale de mise en place d’un RIP (ce qui pourrait leur être reproché), mais avec la loi numérique, elles seront aussi tenues de rendre réutilisables les documents qu’elles y feront figurer.

La loi numérique est plus floue lorsqu’elle évoque l’obligation de mise en ligne des « données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental« . Les universités garderont ici une marge de manoeuvre pour déterminer quelles informations parmi celles qu’elles produisent présentent un tel intérêt. Mais elles ne pourront cependant pas faire l’économie d’une démarche d’inventaire des jeux qu’elles détiennent et d’une sélection en vue d’une diffusion ouverte. L’idéal serait d’ailleurs que les universités se concertent entre elles pour libérer des jeux similaires.

A noter d’ailleurs qu’un mécanisme « d’Open Data à la demande » a été instauré par la loi république numérique, qui permettra assez facilement de forcer la mise en ligne de jeux de données au cas où une université ne procéderait pas d’elle-même à sa diffusion. L’alinéa 1 de l’article 6 indique en effet que les administrations doivent mettre en ligne « les documents qu’elles communiquent en application des procédures prévues au présent titre« . Cela signifie que les administrations seront obligées de mettre en ligne les documents qui leurs sont demandés par les usagers dans le cadre d’une procédure CADA d’accès aux documents administratifs. Si un document entre dans le périmètre (somme toute assez large) de cette loi, alors l’université ne pourra s’opposer à la communication (sous peine d’un recours à la CADA) et lorsque le document est communiqué, l’administration devra ensuite le mettre en ligne et rendre réutilisable les informations qu’il contient. Tout ceci fait que si une université fait preuve d’inertie dans la mise à disposition de données couvertes par l’article 6, il suffira qu’un citoyen, une association ou même une entreprise en fassent la demande auprès d’elle pour qu’elle soit obligée de les mettre en ligne.

On le voit ce principe « d’Open Data par défaut » est relativement puissant, et s’il n’est pas sans limite, il va sans doute produire des changements considérables dans la manière dont les universités diffusent les documents et les données qu’elles produisent.

Quelles limites à la réutilisation des données des universités ?

Le principe d’Open Data par défaut de la loi « République numérique » a beau être large, il n’est cependant pas sans limite. La première concerne l’impératif de protection des données personnelles et de la vie privée, qui devra naturellement continuer à être respecté et sur lequelle l’article 6 de la loi met l’accent :

Sauf dispositions législatives contraires ou si les personnes intéressées ont donné leur accord, lorsque les documents et les données mentionnés aux articles L. 312-1 ou L. 312-1-1 comportent des données à caractère personnel, ils ne peuvent être rendus publics qu’après avoir fait l’objet d’un traitement permettant de rendre impossible l’identification de ces personnes. Une liste des catégories de documents pouvant être rendus publics sans avoir fait l’objet du traitement susmentionné est fixée par décret pris après avis motivé et publié de la Commission nationale de l’informatique et des libertés.

Ce passage signifie que si des informations correspondent à des données à caractère personnel, alors les administrations ne doivent pas les mettre en ligne et les rendre réutilisables, à moins de rendre impossible l’identification des personnes concernées ou après avoir obtenu leur consentement. On notera qu’il ne suffit pas simplement d’anonymiser les données, mais de « rendre impossible l’identification des personnes« , ce qui va plus loin (notamment pour empêcher les identifications par recoupements de données).

Cet aspect risque d’être très compliqué à gérer pour les administrations en général et pour les universités en particulier. Car les établissements vont se retrouver pris entre deux exigences contradictoires : d’une part une soumission au principe d’Open Data par défaut, qui implique la publication de nombreux documents et jeux de données ; d’autre part l’impératif de protection des données personnelles qui reste toujours aussi fort. Pour prendre un exemple concret, une université sera dorénavant obligée de mettre en ligne les informations relatives au personnel qu’elle emploie ou aux étudiants inscrits, mais à la condition d’anonymiser ces données et de rendre impossible l’identification par recoupement, ce qui peut s’avérer très complexe à réaliser. La CNIL a annoncé qu’elle préparait un « pack de conformité » à destination des acteurs publics pour la mise en oeuvre de la loi République numérique et on attend à présent avec impatience ce document qui permettra sans doute d’y voir plus clair sur la manière de jongler avec ces exigences contradictoires.

Une autre limitation au principe d’Open Data par défaut concerne la protection des droits de propriété intellectuelle détenus par des tiers à l’administration. L’article L. 321-2 du Code des relations entre le public et les administrations prévoit ainsi que :

Ne sont pas considérées comme des informations publiques […] les informations contenues dans des documents […] sur lesquels des tiers détiennent des droits de propriété intellectuelle.

Dans le contexte d’établissements comme des universités, de nombreux documents couverts par des droits de propriété intellectuelle sont produits, que l’on songe par exemple aux cours et aux publications des enseignants-chercheurs, aux diverses productions des étudiants (copies d’examen, travaux, mémoires, etc), aux ressources pédagogiques à distance, etc. Tous ces contenus sont naturellement exclus du périmètre des documents soumis à l’obligation de mise en ligne définie à l’article 6 de la loi. Pour ce qui concerne le cas spécifique des publications des chercheurs, il est traité à l’article 30 de la loi, à travers les dispositions de faveur de l’Open Access dont j’ai parlé dans un précédent billet, mais le principe demeure que les chercheurs restent pleinement titulaires du droit d’auteur sur leurs productions et sont à ce titre libres de décider s’ils souhaitent les publier en ligne ou non.

A propos de cette question de l’articulation entre l’Open Data et les droits de propriété intellectuelle, il faut noter que la loi « République numérique » a cependant apporté une clarification importante relative au droit des bases de données des administrations. Il était arrivé dans le passé que des administrations (notamment des services d’archives) opposent leur droit de producteur de base de données à une demande de réutilisation. Après quelques flottements, la jurisprudence administrative avait fini par leur donner raison, ce qui signifiait que ces établissements pouvaient neutraliser le principe de libre réutilisation des informations publiques en s’appuyant sur le droit des bases de données. Or la loi numérique contient un article 11 qui va complètement changer la donne en la matière :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Cette phrase signifie que les administrations ne peuvent dorénavant plus opposer un droit de producteur de base de données à une demande de réutilisation des informations publiques qu’elles détiennent, et cela s’appliquera aux universités comme aux autres.

Quid de la faculté à fixer des redevances de réutilisation ?

Contrairement à la situation qui prévalait antérieurement dans laquelle les administrations pouvaient discrétionnairement mettre en place des redevances pour la réutilisation de leurs données, la loi Valter a consacré un principe général de gratuité. L’article 15 de la loi prévoit néanmoins une dérogation possible à titre exceptionnel pour les administrations dont le financement est substantiellement assuré par des ressources propres :

La réutilisation d’informations publiques est gratuite. Toutefois, les administrations mentionnées à l’article 1er peuvent établir une redevance de réutilisation lorsqu’elles sont tenues de couvrir par des recettes propres une part substantielle des coûts liés à l’accomplissement de leurs missions de service public.

Un doute pourrait poindre ici à propos des universités, car il s’agit typiquement d’établissements auxquels il est demandé de dégager des ressources propres pour assurer une part d’auto-financement. Néanmoins, le décret d’application de la loi Valter, paru en juillet dernier, a clairement défini un seuil minimal de 25% de ressources propres en dessous duquel les administrations ne sont plus autorisées à exiger des redevances de réutilisation :

Sont seuls autorisés à établir des redevances de réutilisation en application de l’article L. 324-1 les services de l’Etat et les autres personnes mentionnées à l’article L. 300-2 dont l’activité principale consiste en la collecte, la production, la mise à disposition ou la diffusion d’informations publiques, lorsque la couverture des coûts liés à cette activité principale est assurée à moins de 75 % par des recettes fiscales, des dotations ou des subventions.

Or si l’on en croit ces chiffres tirés de l’Observatoire KPMG 2015 des Universités et des Ecoles, les universités en France dégagent en moyenne 18% de ressources propres, ce qui les placent en dessous du seuil fixé par le décret de la loi Valter.

ressources

Ceci étant dit, on pourrait imaginer qu’une université arrive à dépasser ce seuil des 25% et l’étude KPMG précité indique que les Ecoles et Instituts de recherche atteignent en moyenne plutôt des taux d’autofinancement de 32%. Néanmoins, cela ne permettra toujours pas à ces établissements de recherche de lever des redevances de réutilisation sur la réutilisation de leurs données.

Car le décret de la loi Valter précise bien que seuls disposent de cette faculté les administrations dont « l’activité principale consiste en la collecte, la production, la mise à disposition ou la diffusion d’informations publiques » et il faut par ailleurs que les subventions qui leur sont versées servent directement à couvrir les coûts de cette activité principale liée aux données. Or ce n’est pas le cas des universités et établissements de recherche, dont les missions sont bien plus larges que la seule production d’informations publiques.

On en déduit donc que les universités sont strictement astreintes au respect du principe de gratuité et qu’elles ne pourront plus établir de redevances de réutilisation des données, sous peine de se mettre dans l’illégalité.

Conclusion : les universités françaises doivent à présent passer à l’Open Data

On le voit, la loi « République numérique » va avoir un impact important sur les universités en les soumettant, comme les autres administrations au principe d’Open Data par défaut qu’elle instaure. C’est la fin d’une situation dérogatoire qui s’appliquait aux universités et établissements de recherche dans la législation antérieure. Cela signifie qu’un grand nombre de documents et de jeux de données devront être mis en ligne dans les années à venir par les universités, ce qui implique des défis organisationnels non négligeables à surmonter. Il me semble d’ailleurs que les conséquences de ce texte n’ont pas été assez clairement perçus par ces acteurs, qui se sont beaucoup focalisés sur le volet Open Access de la loi sans voir que la partie Open Data les concernait également.

La loi fixe aux administrations plusieurs délais (de 6 mois à deux ans selon les catégories de données) pour se conformer à ces nouvelles obligations, échéances qui vont arriver très rapidement à présent. Il faut cependant noter qu’un décret est encore attendu qui va fixer un seuil d’agents au-delà duquel une administration sera soumise au principe d’Open Data par défaut. Mais les universités étant généralement des établissements employant un nombre conséquent d’employés, il serait surprenant qu’elles ne soient pas comprises dans les administrations concernées.

Dans ce billet, j’ai surtout insisté sur les données produites par les universités en tant qu’établissement administratif. Ce sont les informations produites par les services centraux et les services communs de ces établissements qui sont au premier chef concernées par le passage en Open Data (y compris d’ailleurs celles des Services Communs de la Documentation, c’est-à-dire les bibliothèques universitaires). Néanmoins, une autre question importante est de savoir si les données de la recherche, en tant que telles, sont comprises ou non dans ce principe d’Open Data par défaut. Au cas où la réponse serait positive, cela signifie qu’il y aurait également obligation de les mettre en ligne et de les rendre réutilisables, moyennant la protection des données personnelles.

C’est une interrogation à laquelle j’essaierai de répondre dans le troisième billet de cette série consacrée aux répercussions de la loi numérique sur le secteur de l’enseignement supérieur et de la recherche. J’y étudierai la manière dont le texte met en place un nouveau « statut » des données de la recherche.

En attendant, les commentaires sont ouverts si vous souhaitez poser des questions ou laisser des observations à propos de ce nouveau tournant de l’Open Data qui attend les universités.

Résoudre le casse-tête du financement de la numérisation patrimoniale ?

Lorsque l’on revendique que le produit de la numérisation du patrimoine soit rendu librement réutilisable par les institutions culturelles, le principal argument qui nous est opposé est d’ordre budgétaire : les crédits publics alloués à la numérisation sont – comme les autres – en voie de réduction et le volume des collections restant à convertir au format numérique est immense. Dès lors, il serait indispensable qu’un retour sur investissement demeure possible, sous une forme ou une autre, et cela justifierait que les institutions culturelles continuent à appliquer des redevances pour la réutilisation des fichiers, en s’appuyant sur divers fondements juridiques.

money
Par Angelolucas. CC0. Source : Pixabay

Sur le fond, cette question du modèle économique de la numérisation patrimoniale ne doit pas être niée ou escamotée. Il faut au contraire la regarder en face, car dans le contexte de morosité budgétaire que nous traversons, il s’agit bien d’un problème central. Mais deux séries de contre-arguments (au moins) peuvent être opposés à cette « doctrine » de l’application systématique de redevances de réutilisation :

  1.  Il est extrêmement douteux que ces redevances puissent efficacement contribuer au financement de la numérisation, alors qu’elles provoquent dans le même temps des dommages collatéraux considérables (notamment une destruction de valeur sociale liée à la disparition du domaine public sous forme numérique et des libertés associées) ;
  2. Il est possible d’envisager d’autres modèles économiques que les redevances de réutilisation, mieux à même de concilier une soutenabilité budgétaire à long terme et la libre réutilisation du produit final de la numérisation.

J’ai déjà beaucoup écrit sur à propos du premier volet de ces contre-arguments, notamment les problèmes posés par le copyfraud des institutions culturelles et les atteintes au domaine public. Aussi, je voudrais dans ce billet me consacrer davantage au second volet, en partant d’un exemple de nouveau modèle économique mis en œuvre par une institution culturelle qui me paraît hautement intéressant. Il s’agit du dispositif de numérisation à la demande de documents développé par les Archives Départementales des Hautes-Alpes (AD05) dans le cadre d’une nouvelle politique de services aux publics. Cette stratégie de numérisation a fait l’objet d’une présentation détaillée vendredi dernier par le directeur de cette institution, Gaël Chenard, à laquelle j’ai pu assister à l’occasion du colloque « Consommateurs ou acteurs ? Les publics en ligne des archives et des bibliothèques patrimoniales ».

Articuler numérisation de masse et numérisation à la demande

Actuellement, le modèle économique de la numérisation patrimoniale le plus répandu en France parmi les institutions culturelles repose sur deux présupposés :

  • Il importerait de numériser le volume le plus important possible de collections (numérisation de masse), en « peignant » systématiquement des tranches de cotes complètes pour tendre vers l’exhaustivité ;
  • Comme cette approche est onéreuse, le produit de la numérisation ne doit pas être rendu librement réutilisable et l’institution doit appliquer une redevance sur la réutilisation, en s’appuyant soit sur le droit d’auteur (modèle de la RMN, qui revendique un copyright sur les reproductions des œuvres, y compris lorsque celles-ci appartiennent au domaine public), soit sur la réutilisation des informations publiques (modèle de la BnF, qui autorise les usages non-commerciaux des contenus de Gallica, mais fait payer les réutilisations effectuées dans un cadre commercial).

La présentation de Gaël Chenard a commencé par une remise en cause du premier présupposé, appuyée sur une analyse pointue des statistiques de consultation des documents numérisés mis en ligne par son institution. Celles montrent en effet que certains types de documents font l’objet d’une forte consultation par le public (Etat civil ou Registres matricules, notamment), chaque document numérisé pouvant être consulté plus de 5 fois par an. Mais d’autres pans des collections, comme les actes notariés par exemple, sont au contraire beaucoup moins consultés (parfois moins d’une fois par an en moyenne).

[tweet https://twitter.com/tokenheiser/status/649893284404436992]

Une priorisation paraît dès lors souhaitable dans la numérisation des collections : il semble en effet plus intéressant que les crédits publics aillent en priorité à la numérisation des documents les plus consultées. Mais pour ceux dont l’usage est plus confidentiel, cet investissement public est « moins rentable » en termes d’utilité sociale. Et c’est d’autant plus vrai que les actes notariés aux AD05 représentent un énorme volume à numériser, qui pourrait occuper le service d’archives pendant 10 ans, en monopolisant ses crédits et les ressources humaines pouvant être consacrées à la numérisation.

Sur la base de ce constat, Gaël Chenard explique que le choix a été fait par le département de mettre l’accent sur la numérisation à la demande pour les collections les moins consultées en ligne. L’établissement mobilise ses chaînes internes pour dématérialiser les documents non-disponibles au format numérique demandés par les usagers, en leur fournissant les fichiers à distance à l’issue de l’opération. Pour que ce service soit attractif, les AD des Hautes Alpes ont aussi baissé substantiellement leurs tarifs en les divisant par 4, de 1 euro à 25 centimes d’euros la page, avec un tarif maximum bloqué à un forfait de 20 euros pour inciter les utilisateurs à commander des numérisations intégrales de documents.

Renverser le mode de financement de la numérisation patrimoniale

Le point le plus intéressant dans cette stratégie de numérisation réside sans doute dans le statut juridique des fichiers produits à l’issue de ces opérations de numérisation à la demande. Voici ce que l’on peut lire à ce sujet sur le site des AD05 :

QUE FAITES-VOUS DES IMAGES QUE J’AI PAYÉES ? QUE PUIS-JE EN FAIRE ?

Nous les livrons sur votre espace personnel pour vous permettre de les télécharger librement. Si les documents que vous avez commandés sont susceptibles d’intéresser un public plus large, ils sont ensuite publiés sur notre site internet six mois après votre demande. Vous pouvez également publier librement ces images sur votre propre site : la réutilisation est libre et gratuite dès livraison.

Le « règlement de réutilisation des informations publiques contenues dans les documents des Archives départementales des Hautes Alpes » précise que le produit de la numérisation est placé sous la Licence Ouverte/Open Licence d’Etalab et que le département se refuse à concéder des exclusivités à des tiers :

En dehors du cas des informations comportant des informations personnelles protégées au titre de la loi n°78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés, la réutilisation est libre et gratuite, et placée sous le régime de la « licence ouverte » élaborée par Etalab dans sa version 1.0. La « licence ouverte » est annexée au présent règlement

Le Conseil Général des Hautes-Alpes exclue toute possibilité d’exclusivité d’exploitation des informations publiques produites, reçues et conservées par les Archives départementales des Hautes-Alpes, y compris dans les cas prévus à l’article 14 de la loi n° 78-753 du 17 juillet 1978.

Concrètement, cela signifie que les documents numérisés peuvent être librement réutilisés sans avoir à verser de redevances, y compris à des fins commerciales, à condition de mentionner leur source (condition posée par la licence Etalab). C’est le cas pour les personnes qui commandent des numérisations à la demande pour les fichiers qui leur sont transmis. Mais c’est aussi le cas in fine pour l’ensemble du public, puisque les AD05 indiquent que lorsque les documents commandés sont susceptibles d’intéresser le plus grand nombre, ils sont mis en ligne en accès gratuit sur le site de l’institution à l’issue d’un délai de 6 mois.

Ce modèle aboutit à un renversement de perspective intéressant dans le financement de la numérisation. Plutôt que de lever ex post des redevances sur la réutilisation des documents numérisés, l’établissement fait payer une prestation ex ante pour le service rendu au premier utilisateur. Ce paiement est donc effectué une fois et il s’éteint ensuite. L’avantage réside dans le fait que ce modèle préserve le principe de réutilisation des informations publiques et l’intégrité du domaine public (lorsque la numérisation porte sur des œuvres). Cette formule paraît aussi infiniment supérieure aux partenariats de numérisation public-privé – type Accords Proquest/BnF – qui suppriment la gratuité de l’accès en ligne aux documents numérisés pendant une période d’exclusivité accordée à la société privée, sans pour autant garantir une fois celle-ci achevée que l’institution culturelle ne continuera pas à appliquer une redevance pour la réutilisation des documents (double peine pour les droits du public).

Ce passage d’une forme de « vente des données » à la facturation d’un service rendu correspond à ce que nous préconisons dans le Manifeste de SavoirsCom1 à propos des modèles économiques compatibles avec la préservation des Communs de la connaissance :

9. Placer les communs au cœur des modèles économiques de l’information. 

[…]  Le collectif déclare encourager des modèles qui valorisent économiquement des services, à la différence de ceux qui vendent des données. Il refuse catégoriquement tous les dispositifs techniques (DRM) qui limitent les usages de l’information et, par conséquent, entravent le développement de biens communs de la connaissances.

La question centrale de l’efficacité économique

Visiblement, l’efficacité économique est au rendez-vous avec ce dispositif. Gaël Chenard a indiqué vendredi que son service d’archives se plaçait dans le peloton de tête des établissements qui numérisent le plus de vues chaque année et que l’abaissement des tarifs avait permis d’augmenter suffisamment le volume des demandes pour parvenir à un équilibre budgétaire. Le point de tension réside cependant dans la capacité de la chaîne interne à absorber les demandes, en maintenant des délais de réponse suffisamment courts pour que le service reste attractif. Le site des AD05 annonce qu’il est en mesure de servir les commandes en 2 ou 3 jours en moyenne, mais on imagine qu’il faut consacrer des ressources humaines conséquentes pour arriver à ce résultat et c’est sur ce point que ce dispositif peut s’avérer difficile à implémenter.

Si la question de l’efficacité économique est centrale dans ce débat sur le financement de la numérisation patrimoniale, force est de constater qu’à l’inverse, le modèle de l’application de redevances de réutilisation est très loin d’avoir apporté la preuve de sa capacité à assurer le financement durable de la numérisation patrimoniale. C’est notamment ce qui ressort assez nettement d’un rapport publié – avec une surprenante discrétion – par le Ministère de la Culture en juin dernier, consacré à« l‘Evaluation du développement des ressources propres des établissements culturels de l’Etat ».

On peut notamment y lire ce constat, assez éloquent, sur l’efficacité relatives des différentes sources d’auto-financement utilisées par les institutions culturelles :

Seules trois activités (la location d’espaces, les redevances de concessions et le mécénat, sous réserve de la dépense fiscale et des contreparties offertes aux mécènes qu’il induit) contribuent systématiquement à l’équilibre financier des établissements. L’ensemble des autres activités (les activités annexes telles que la gestion d’un auditorium, les expositions itinérantes, la gestion en direct d’une boutique, l’ingénierie culturelle, les éditions, les activités numériques et la gestion des droits de propriété intellectuelle) présentent, en moyenne sur l’échantillon analysé, un résultat déficitaire. Ces résultats posent la question du maintien et du développement de ces activités à l’équilibre financier fragile lorsqu’il n’apparaît pas qu’elles participent significativement aux missions de service public de l’établissement.

Les redevances (englobées de manière surprenante dans le rapport dans le volet « gestion des droits de propriété intellectuelle) » ne sont donc pas citées comme un moyen de financement efficace et pour cause ! Une série de focus sur diverses institutions (RMN, BnF, Musée d’Orsay, Quai Branly, etc.) figurant dans les annexes le confirme complètement : les recettes tirées des redevances de réutilisation restent marginales pour ces établissements, eu égard aux coûts importants découlant de la numérisation. C’est particulièrement clair à propos de l’agence photographique de la RMN, dont le déficit se creuse chaque année de manière assez inquiétante, alors qu’elle reste la « championne nationale » du modèle des redevances (et donc du copyfraud…). Voir notamment le schéma ci-dessous tiré de l’annexe V du rapport).

Des chiffres encore plus précis avaient été fournis en janvier dernier à la députée Isabelle Attard en réponse à une question parlementaire posée au Ministère de la Culture à propos du bilan économique de l’agence photo de la RMN, montrant un déficit croissant chaque année s’élevant à plus de 3,5 millions d’euros pour 2014.

rmn

Ces constats sur l’inefficacité économique des redevances rejoignent plus largement les conclusions du rapport Trojette rendu à la fin de l’année 2014, qui s’était livré à une évaluation globale du modèle économique des redevances mises en place par les administrations pour la réutilisation des informations publiques. Hormis quelques rares hypothèses où les redevances se justifient encore (temporairement), le rapport Trojette préconise de placer les données publiques en Open Data pour maximiser leur utilité sociale, en abandonnant les tarifs de réutilisation. Le secteur culturel présente certes la spécificité de devoir assumer des coûts importants pour la numérisation des collections. Mais nous avons vu qu’il est loin d’être prouvé que les redevances de réutilisation puissent constituer une solution satisfaisante et des exemples comme celui des Archives Départementales des Hautes Alpes montrent qu’au moins une partie de ces coûts peut être amortie par la facturation de services plutôt que par des entraves à la réutilisation des fichiers.

Quelle équité dans l’appel à contribution du public ?

La numérisation a un coût important et il est clair qu’en l’état des finances publiques, il ne sera pas possible de faire porter l’intégralité de l’effort sur le budget des collectivités. Le public doit prendre sa part dans ce financement, mais il existe plusieurs façons de le mettre à contribution : certaines paraissent équitables, tandis que d’autres ne le sont manifestement pas.

A vrai dire, les services de numérisation à la demande existent depuis longtemps dans les institutions culturelles, qui sont nombreuses à disposer de départements dédiés à la reproduction. Mais en général, le produit de cette numérisation n’est pas libéré sous une licence garantissant les droits d’usage du public et, parfois, il n’est même pas mis en ligne une fois le service rendu. En somme, ce qui est payé directement avec l’argent du public ne respecte pas au final les droits du public. Les individus sont appelés à contribuer pour financer leur propre expropriation du patrimoine commun et sous couvert de « rendre un service », les institutions culturelles alimentent en réalité une véritable machine à enclosures…

Or il devient de plus en plus à la mode dans le champ culturel de faire appel au « mécénat » du public sous diverses formes : formule de parrainage de la numérisation de documents avec le service « Adopte un livre » à la BnF ; financement participatif pour l’achat de pièces rares et précieuses (au Louvre ou à la BnF) couplé à des opérations de numérisation ; appel aux dons pour la restauration d’œuvres emblématique (au Louvre ou au Musée d’Orsay). Ces dispositifs participatifs rencontrent souvent l’enthousiasme d’un public attaché au patrimoine, mais on peut clairement poser la question de l’équité de ces modes de financement quand les droits d’usage ne sont pas respectés. C’est ce qu’a fait par exemple brillamment Hervé Le Crosnier à propos du recours au crowdfunding pour la restauration du tableau « l’Atelier du peintre » de Courbet au Musée d’Orsay :

[…] la moindre des choses serait de rendre au public autre chose que des « cartes pass » à bon prix (une fois déduite la participation de 2/3 de l’État au travers des réductions d’impôts) et l’affichage du nom des donateurs sur Facebook.

Comme ce genre d’opération va se multiplier, ne devrions-nous pas exiger que l’ensemble des droits sur les reproductions de ces œuvres aidées soient directement posées dans le domaine public ?

Dans le dispositif mis en place par les Archives des Hautes Alpes, il me semble au contraire que l’appel à contribution du public est équitable. L’établissement tarifie un service rendu à l’usager (numérisation d’un original non-disponible sous forme numérique dans un délai donné et transmission du fichier), ce qui est entièrement légitime. Par ailleurs, le paiement par l’usager a aussi le sens d’un « micro-mécénat » contribuant à la numérisation globale des collections pour tous. Et au final, il n’y a pas d’enclosure instaurée par l’établissement culturel, puisque la licence ouverte garantit les droits du public à la réutilisation des contenus et la préservation de l’intégrité du domaine public.

La légitimité du système deviendrait contestable si la stratégie des AD05 consistait à substituer intégralement la numérisation de masse, couverte par les crédits publics de la collectivité, à ce service de numérisation à la demande financé par le paiement direct des usagers. Mais tel n’est pas le cas, puisque la numérisation à la demande vise prioritairement à faire passer au format électronique des pans spécifiques des collections que les archives ne seraient pas à même de numériser autrement. Sans doute faudra-t-il rester vigilant pour qu’un phénomène de bascule ne s’opère pas et que ces solutions de numérisation à la demande ne deviennent pas un prétexte au désengagement financier des pouvoirs publics.

Mais tel n’est pas le cas pour les AD05, qui me paraissent avoir trouvé un équilibre satisfaisant. Il ne s’agit pas de dire que la numérisation  à la demande doit devenir LE modèle exclusif de financement de la numérisation du patrimoine, mais il y a là assurément une piste intéressante à creuser, notamment en ce qui concerne l’offre de services à valeur ajoutée autour des données.

La numérisation du patrimoine à la croisée des chemins législatifs

On constate donc que sur le terrain, des institutions culturelles comme les AD05 explorent actuellement de nouveaux modèles économiques pour assurer la pérennité du financement de la numérisation. C’est d’autant plus stimulant que les positions émises sur le sujet par le Ministère de la Culture traduisent en revanche un immobilisme inquiétant, confinant parfois au dogmatisme. La « doctrine de la redevance » et le mépris pour la question du respect du domaine public et du principe de libre réutilisation restent obstinément la règle, alors que le rapport produit par le Ministère lui-même (cité ci-dessus) montre que cette voie constitue une impasse budgétaire.

En août dernier, Fleur Pellerin a répondu à une question parlementaire posée par le député Olivier Falorni qui insistait sur l’importance de libérer la réutilisation des oeuvres numérisées du domaine public et appelait le Ministère à mettre fin aux pratiques de tarification de la RMN. La réponse de la Ministre, non seulement légitime le copyfraud auquel se livre dans leur très grande majorité les musées, mais manifeste également un attachement sans faille à la « doctrine des redevances ».

La numérisation du patrimoine se trouve à présent à la croisée des chemins législatifs. Le projet de loi numérique portée par les services d’Axelle Lemaire du côté du Ministère de l’Economie (et c’est loin d’être innocent…) contient en effet une définition positive du « domaine public informationnel », visant à interdire les pratiques de copyfraud et la réapparition d’exclusivités sur les éléments du patrimoine culturel qui devraient rester communs à tous. Si cette notion venait à être consacrée par la loi, il est clair que les institutions culturelles seraient rapidement obligées de revoir en profondeur leurs pratiques de diffusion des documents numérisés, sauf pour elles à courir le risque d’affronter des recours contentieux que la loi va ouvrir.

 Mais dans le même temps, une autre loi est en train de progresser, portée par Clotilde Valter au secrétariat à la réforme de l’Etat, qui s’appuie sur une logique rigoureusement opposée. Alors que toutes les autres administrations publiques vont être soumises à un principe de gratuité pour la réutilisation des informations publiques, avec des possibilités exceptionnelles d’instaurer des redevances, la loi Valter graverait dans le marbre une faculté discrétionnaire pour les établissements culturel de lever des redevances sur la réutilisation du patrimoine numérisé, ainsi que d’accorder des exclusivités à des partenaires privés de numérisation. Si c’est cette seconde loi qui prévaut, alors une forme de « domaine public payant » sera instaurée en France, au bénéfice des institutions culturelles.

***

Ne nous y trompons pas : cette « doctrine des redevances » a beau se draper – mais de plus en plus difficilement – dans des arguments de rationalité budgétaire, elle traduit surtout une vision idéologique du patrimoine conçu comme « actif immatériel » à valoriser, qui est tout sauf innocente. Le pire, c’est que cette politique sera incapable d’assurer la durabilité de la numérisation à long terme, mais elle conduira immanquablement à une adultération profonde de l’identité des institutions culturelles et de leurs missions de service public.

Heureusement que des services comme celui des Archives départementales des Hautes Alpes montrent concrètement qu’une autre voie est encore possible !

 

 

De nouvelles études confirment la valeur du domaine public pour l’innovation et la créativité

J’avais écrit en avril dernier un billet à propos d’un article scientifique qui proposait une méthode indirecte pour calculer la « valeur économique » des photographies appartenant au domaine public figurant sur Wikipédia. Ces chercheurs étaient arrivés à la conclusion que ces contenus généraient une valeur de 246 à 270 millions d’euros par an, en augmentant la visibilité des pages de l’encyclopédie et en réduisant les coûts de transaction pour les utilisateurs. En réalité, cette étude ne constituait que l’un des trois volets d’un rapport sur la valeur du domaine public, commandé par l’Intellectual Property Office au Royaume-Uni. Intitulé « Copyright and The Value Of Public Domain : An Empirical Assessment« , ce document est particulièrement intéressant, à la fois par sa méthodologie et ses résultats. Ses conclusions ont d’ailleurs fait l’objet au début du mois de juillet d’une présentation à l’OMPI (Organisation Mondiale de la Propriété Intellectuelle), dans le cadre des travaux de cette institution sur le domaine public.

public domain
Cliquez sur l’image pour accéder au document.

Outre la partie sur la valeur des photos sur Wikipédia dont j’ai déjà parlé, ce rapport contient deux autres sections. L’une s’attache à la réutilisation d’oeuvres du domaine public par de petites entreprises créatives et essaie au travers d’une approche qualitative (conduite d’entretiens) de comprendre quels avantages ces acteurs tirent du domaine public et quelles stratégies ils déploient pour le valoriser. L’autre aborde la question du crowdfunding (financement participatif) et essaie d’observer si l’on peut faire un lien entre le succès de projets sur la plateforme Kickstarter et le fait qu’ils réutilisent des oeuvres du domaine public.
Lire la suite

Un risque de voir le domaine public numérisé enseveli sous la propriété matérielle des fichiers ?

Le Tribunal de Grande Instance de Paris a rendu le 13 mars dernier un jugement dans une affaire opposant la photographe professionnelle Marie-Laure de Decker à l’agence Gamma-Rapho. Bien que la décision ne porte pas directement sur la question de la numérisation d’oeuvres du domaine public, les principes sur lesquels elle s’appuie pourraient avoir des effets potentiellement dévastateurs s’ils étaient étendus à ce sujet.

Dans cette affaire, le juge a en effet été amené à rejeter la demande de la photographe qui demandait la restitution de plusieurs centaines de fichiers résultant de la numérisation de tirages de ses photos détenus par l’agence. Plus encore, le TGI a considéré que la publication par la photographe d’un de ces fichiers sur son propre site et sur Facebook constituait une « utilisation fautive » et l’a condamnée à payer 1000 euros de dommages et intérêts.

Strate
Le domaine public numérisé tend souvent à être recouvert de plusieurs « couches » de droits, entravant sa réutilisation. Le TGI de Paris vient potentiellement d’en ajouter une nouvelle, en reconnaissant l’existence d’une droit de propriété sur les fichiers eux-mêmes issus de l’opération de numérisation (Image par Anne97432. CC-BY-SA. Source : Wikimedia Commons).

Ce jugement fait visiblement grand bruit dans le cercle des photographes professionnels, car il tend à affaiblir leur position vis-à-vis des intermédiaires économiques que sont les agences. Mais je voudrais ici m’attarder surtout sur le fondement juridique invoqué par le juge pour justifier sa décision. Le TGI a en effet considéré que l’agence Gamma-Rapho disposait d’un droit de propriété sur les fichiers eux-mêmes, assimilés à des « biens meubles corporels« . Cette qualification revient donc à reconnaître une forme de propriété matérielle sur ces fichiers, indépendante de la propriété intellectuelle.

Appliqué à des oeuvres du domaine public numérisé, ce raisonnement conduirait à reconnaître au profit des organismes procédant à la numérisation une propriété matérielle sur les fichiers, opposable à ceux qui souhaiteraient les réutiliser. Ce placage étrange du concept de « propriété matérielle » sur des objets pourtant par définition immatériels constituerait alors une nouvelle couche d’enclosure sur le domaine public numérisé, avec une puissance sans doute redoutable étant donnée la force avec laquelle le droit de propriété est reconnu dans notre droit. Lire la suite

Français, encore un effort si vous voulez que les logiciels de l’administration deviennent libres !

En fin de semaine dernière, la Commission d’Accès aux Documents Administratifs (CADA) a rendu un avis remarquable, dans lequel elle reconnaît que le code source d’un logiciel développé par l’administration doit en principe être communiqué aux administrés en faisant la demande. En l’espèce, une personne demandait au Ministère de l’économie d’avoir accès au code source d’un logiciel simulant le calcul de l’impôt sur le revenu des personnes physiques à des fins de recherche. Cette décision est particulièrement intéressante, notamment par la manière dont elle articule le droit d’auteur et le droit d’accès aux documents administratifs, en faisant primer le second sur le premier.

delacroix
La liberté d’accès aux documents administratifs guidant le peuple.

Si cet avis consacre une forme « d’Open Source par défaut » pour les logiciels de l’administration, il n’implique pas cependant que les-dits logiciels passent ipso facto sous licence libre. En effet, une fois le code source communiqué, la réutilisation du logiciel se fait dans les limites de la loi du 17 juillet 1978 sur l’accès aux documents administratifs et la réutilisation des informations publiques. Or l’administration peut s’appuyer pour ce texte pour fixer des licences et des redevances, qui continueront à impliquer un formalisme préalable et un paiement en cas de réutilisation, toutes choses incompatibles avec les libertés du logiciel libre. Par ailleurs, l’avis de la CADA n’implique bien sûr en rien que les administrations cessent d’acheter et d’utiliser des logiciels propriétaires pour passer au libre.

Néanmoins avec le développement de l’Open Data, la réutilisation des informations publiques tend de plus en plus à s’inspirer et à se rapprocher des principes du Libre. Les administrations sont déjà soumises par décret à une obligation relativement large de rendre leurs informations réutilisables sous licence ouverte. L’avis de la CADA ouvre donc la possibilité d’étendre à présent cette politique d’ouverture aux logiciels produits par l’administration. Plus encore, avec la loi sur le numérique annoncée pour cette année, un passage par défaut à l’ouverture des informations publiques devrait s’opérer, ce qui ferait de l’Open Data leur mode de diffusion principal, en cantonnant la réutilisation payante à des cas exceptionnels et limités. En assimilant les logiciels à des documents administratifs contenant des informations publiques, la CADA a fait en sorte qu’une telle avancée législative – si elle a bien lieu – se répercutera logiquement sur les logiciels et les soumettra à un régime de réutilisation proche des licences libres (bien que reposant sur un fondement différent). Lire la suite

Données culturelles : alerte rouge pour le principe de réutilisation !

Voilà plusieurs années à présent que j’écris sur ce blog sur le sujet de la réutilisation des données culturelles. Le moins que l’on puisse dire, c’est que cette problématique n’aura pas été un long fleuve tranquille, mais un jugement rendu cette semaine par la Cour d’Appel de Bordeaux dans un litige opposant la société NotreFamille.com aux Archives départementales de la Vienne vient d’allumer sur le tableau de bord un gros voyant rouge, tant il est porteur d’un risque de régression en la matière.

Image par Dieselducy, Andrew R. CC-BY-SA. Source : Wikimedia Commons

Cette décision vient confirmer un jugement de première instance publié l’an dernier par le Tribunal administratif de Poitiers, auquel j’avais consacré une analyse en tirant déjà la sonnette d’alarme. Pour faire simple, le juge avait accepté que les Archives de la Vienne s’opposent à une demande de réutilisation commerciale de documents numérisés d’état civil et de recensement, en invoquant leur droit de producteur de la base de données constituée par leurs soins.

Lire la suite

Les données culturelles deviendront-elles des « données d’intérêt général » ?

C’est un point qui n’a pas fait l’objet encore de commentaires particuliers, mais qu’il faudra surveiller attentivement en 2015. A la fin du mois de novembre dernier, le site Contexte publiait un article se faisant l’écho des premiers travaux interministériels concernant la future loi sur le numérique, portée par Axelle Lemaire.

Un des volets de cette loi concernera l’ouverture des données publiques et l’on peut lire chez Contexte que les premiers éléments envisagés pour le texte portent sur les points suivants :

Ouverture des données

Le premier chapitre du texte porte sur la politique d’ouverture des données publiques, avec la transposition de la directive « Public sector information » (PSI) et la réaffirmation des principes d’ouverture, de gratuité et d’interopérabilité.

La Commission d’accès aux documents administratifs (Cada) deviendrait une véritable autorité des données publiques. Un statut des données dites « d’intérêt général », avec un régime juridique spécifique, serait créé. Cela concerne des secteurs aussi divers que la santé, les transports, l’énergie, la culture ou le logement.

Voir les données culturelles envisagées comme des candidates au statut de données « d’intérêt général » est assez surprenant, mais aussi potentiellement une chose positive. En effet, jusqu’à présent dans la loi française, les données culturelles ont déjà été soumise à un régime juridique spécifique, appelé (à tort) « exception culturelle ». Selon l’article 11 de la loi du 17 juillet 1978, les « établissements, organismes ou services culturels » conservaient la faculté de « fixer les conditions dans lesquelles les informations peuvent être réutilisées ».

Lire la suite

Richard Prince et la loyauté de l’usage transformatif

L’artiste contemporain Richard Prince, célèbre pour la manière dont il s’approprie de manière spectaculaire et souvent controversée des oeuvres préexistantes, a remporté cette semaine un procès qui l’opposait au photographe Patrick Cariou.

Ce jugement rendu aux Etats-Unis est important, car il précise les frontières du fair use (usage équitable) dans un sens favorable à la réutilisation des oeuvres protégées pour un usage transformatif. Mais s’agissant d’un artiste comme Richard Prince, il ouvre aussi peut-être la porte à des formes d’usage « déloyal » des oeuvres, car ce ténor de l’art contemporain n’est pas réputé pour son « fair play » envers les artistes auxquels il emprunte des oeuvres pour ses propres créations.

A gauche, une des photographies originales de Patrick Cariou. A droite, ce qu'en a fait Richard Prince.
A gauche, une des photographies originales de Patrick Cariou. A droite, ce qu’en a fait Richard Prince.

En matière d’usages transformatifs (ceux de l’art contemporain, mais aussi les mashup et remix sur Internet) où fixer la limite et comment réorganiser les règles du droit d’auteur pour favoriser la réutilisation, sans pour autant sacrifier les principes élémentaires du respect dû à autrui ? Ce procès permet de se pencher sur cette question épineuse, dans la perspective particulière du droit américain, mais aussi en interrogeant la rigidité du droit français, qui fonctionne selon des principes différents.

Échec au Prince en première instance

Richard Prince a réutilisé pour réaliser une série de peintures et de collages intitulée Canal Zone des photographies de Patrick Cariou tirées du recueil Ya Rasta, sur lequel il a visiblement travaillé pendant 10 ans pour aller photographier des Rastafaris en Jamaïque. En première instance l’an dernier, Richard Prince avait été condamné devant les juges de manière assez cinglante, qui l’avaient reconnu coupable de contrefaçon et avaient même ordonné la destruction de ses oeuvres.

Il faut dire que la superstar de l’art contemporain avait justement joué au « Prince » et s’était montré particulièrement arrogant lors de l’audience. Richard Prince a aucun moment n’avait pris la peine de créditer Patrick Cariou comme auteur des photographies originales et pendant le procès, il a continué à refuser de prononcer son nom, en le désignant seulement par un « him » méprisant…

Mais Prince s’était juridiquement tiré une balle dans pied par cette attitude hautaine, car il avait aussi refusé d’invoquer le fair use pour se défendre, en prétendant que son art ne « véhiculait aucun message » et qu’il n’avait pas eu l’intention de faire spécialement un usage « transformatif » des oeuvres de Cariou.

Les juges de première instance l’avaient alors condamné en estimant que le fair use nécessitait d’une manière ou d’une autre de « commenter, se référer au contexte ou se référer de manière critique aux oeuvres originales« , un peu à la manière dont fonctionne en France notre exception de courte citation ou l’exception de parodie, pastiche ou caricature.

Autres images extraites de la série Canal Zone de Richard Prince.

L’usage transformatif et ses limites

Le problème, comme le souligne très bien le site Techdirt, c’est qu’une telle conception du fair use, aurait fortement limité le champ d’application de la notion, en la rabattant sur des usages de type commentaires, critiques et parodies. Face à cette conception restrictive, les juges d’appel ont réaffirmé que le fair use permet bien les usages transformatifs au sens propre :

La loi n’impose pas qu’une oeuvre constitue un commentaire sur l’original ou son auteur pour être considérée comme transformative et une oeuvre secondaire peut être reconnue comme un usage équitable même si elle vise d’autres buts que ceux inscrits dans la loi (critique, commentaire, information, enseignement, études et recherche). Au lieu de cela, la Cour Suprême ainsi que les décisions d’autres cours de justice ont insisté, pour retenir la qualification d’usage équitable, sur le fait qu’une oeuvre transformative devait modifier l’original de manière à produire une nouvelle expression, un nouvelle signification ou un nouveau message.

Les juges ont alors appliqué ces principes aux collages et peintures produits par Richard Prince à partir des photographies de Cariou, pour en conclure qu’il s’agissait bien d’un usage transformatif :

Ces 25 créations de Prince manifestent une esthétique entièrement différente de celles des photographies de Cariou. Là où Cariou a produit des portraits et des paysages sereins et délibérément équilibrés, traduisant la beauté naturelle des Rastafaris et de leurs lieux de vie, les oeuvres crues et discordantes de Prince sont au contraire nerveuses et provocantes.

Mais les juges ont dans le même temps indiqué que toute forme de modification ne suffisait pas pour que l’oeuvre soit « transformative » :

Nos conclusions ne doivent cependant pas être interprétées comme suggérant que le moindre changement apporté à des photographies serait suffisant pour constituer un usage équitable. Une oeuvre dérivée peut modifier l’original sans être « transformative ». Par exemple, une oeuvre dérivée qui se contente de reprendre les mêmes contenus, mais en les présentant sous une autre forme façon, comme la publication en livre du synopsis d’une émission de télévision, n’est pas « transformative ».

Les juges américains introduisent par là une distinction intéressante entre l’adaptation (passage d’une oeuvre d’un média à un autre), qui relève pleinement du monopole reconnu à l’auteur parce qu’elle « parasite » son exploitation, et la transformation qui peut être couverte par le fair use.  Néanmoins, le maniement de tels critères s’avère complexe à l’usage, car dans cette affaire, les juges admettent que pour 5 oeuvres de Richard Prince, ils ne sont pas en mesure de déterminer « avec certitude » si les modifications apportées aux photographies sont suffisantes pour établir si l’oeuvre est transformative (c’est notamment le cas pour la première image qui illustre ce billet).

Intéressant montage, qui a laissé uniquement les ajouts de Richard Prince sur une des photographies de Patrick Cariou. Nouvelle transformation par soustraction cette fois…

Une approche plus ouverte que celle du droit français

Il est intéressant de mettre cette décision en relation avec les principes du droit français et de réfléchir à ses répercussions sur les pratiques numériques de transformation, comme le remix ou le mashup.

Ce qui est particulièrement remarquable avec le fair use américain, c’est qu’il accorde une prime à la créativité, justement grâce à cette notion d’usage « transformatif ». Ce que les juges cherchent à savoir, c’est si le réutilisateur a produit quelque chose de nouveau, qui n’entrera pas en concurrence directe avec l’original, y compris d’un point de vue économique. Les juges ont d’ailleurs rappelé dans cette décision que le fair use n’exclut pas l’usage commercial et que l’usage transformatif admet l’emprunt de larges portions d’une oeuvre.

En France, la situation est complètement différente, puisque la transformation d’une oeuvre sera au contraire considérée dans la plupart des cas comme une altération violant le droit moral de l’auteur, et notamment son droit au respect de l’intégrité de son oeuvre. Le droit de citation est limité à l’emprunt de courts extraits et il doit viser des buts précis (critique, polémique, pédagogique, scientifique ou d’information), parmi lesquels ne figure pas la finalité purement créative. L’exception de parodie, pastiche ou caricature existe également, mais elle recouvre seulement certains usages créatifs, qui par exemple, ne correspondent sans doute pas à ce qu’a fait Richard Prince avec les photographies de Patrick Cariou.

La parodie, la caricature ou le pastiche sont par ailleurs adaptés pour certains types de remix ou de mashup, mais c’est loin d’être le cas pour tous. Par exemple, la vidéo ci-dessous est un petit film d’animation de 60 secondes qui condense tout l’épisode IV de Star Wars.

Malgré l’humour dont elle fait preuve, cette vidéo ne constitue pas selon moi une parodie, un pastiche ou une caricature et je doute fort qu’un juge français puisse la considérer comme légale. C’est la raison pour laquelle je trouve que l’approche par l’usage transformatif du droit américain est excellente, dans la mesure où elle pourrait servir de fondement aux nouvelles formes de la créativité numérique.

Quelles conditions pour un usage loyal des oeuvres ?

Néanmoins, il y a quelque chose qui me dérange profondément dans le fait que les juges aient pu estimer que Richard Prince avait fait un usage « équitable » des oeuvres de Cariou. On a l’habitude de traduire fair use par usage équitable, mais aussi par usage « loyal ». Or l’attitude de Richard Prince n’a pas été à mon sens « loyale » envers Patrick Cariou, d’abord parce qu’il a omis de le créditer comme auteur des originaux réutilisés, mais aussi par son attitude méprisante lors du procès.

Le droit français pour le coup comporte des obligations qui sont à même de garantir un minimum de fair play en cas de réutilisation des oeuvres, et notamment l’article L.122-5 indique que les exceptions de courte citation et de parodie ne peuvent s’exercer que : « Sous réserve que soient indiqués clairement le nom de l’auteur et la source« .

Finalement en mélangeant la notion d’usage transformatif tirée du droit américain, tout en maintenant les marques de respect pour l’auteur original qui figurent dans le droit français, n’arriverait-on pas à un régime équilibrée et apte à épouser les contours des nouveaux usages numériques ?

Domaine public et sérendipité : le fabuleux destin d’un flocon de neige

Lors de l’audition pour SavoirsCom1 de la semaine dernière à l’Assemblée nationale, à propos de l’affaire des Accords BnF, Frédéric Reiss, l’un des députés de la Commission des affaires culturelles a relevé l’expression « dissémination des contenus culturels » que nous avions employée, Silvère Mercier et moi. Visiblement, ce terme l’a quelque peu inquiété :

Vous avez parlé de dissémination des œuvres sur internet. Qu’est-ce que cela signifie ? S’agit-il de diffusion immédiate ou d’éparpillement ? Que craignez-vous ? Quel serait le délai adéquat de l’exclusivité ? Quel serait le bon tempo ?

Sérendipité, le fait de découvrir des choses par accident. (Serendipity. Par Alex Drennan. CC-BY-NC-ND. Source : Flickr)

Le mot « dissémination » n’est certainement pas très beau, mais il exprime une réalité forte à propos du domaine public numérisé. Une fois que des oeuvres anciennes sont mises en ligne, elles acquièrent une valeur d’usage nouvelle qui peut conduire à ce qu’elles voyagent sur la Toile de manière complètement imprévisible.

Lire la suite

Open Glam – Recommandations pour l’ouverture des données et des contenus culturels

Aujourd’hui paraît un document important, synthétisant les réflexions d’un groupe de travail Open GLAM, rassemblé à l’initiative de Wikimedia France et de l’Open Knowledge Foundation, pour examiner les blocages à l’ouverture des données et contenus culturels en France et proposer des solutions.

J’ai eu l’occasion d’exposer dans S.I.Lex que l’Open Data accusait un retard certain en France dans le secteur culturel ou encore de dénoncer, ce week-end encore, la lente érosion que subit le domaine public à l’occasion de sa numérisation. L’ouverture présente certainement des difficultés particulières dans le domaine de la Culture, à cause notamment de l’enchevêtrement des problématiques juridiques. Mais cette situation n’est pas une fatalité et des solutions peuvent être mises en oeuvre pour faciliter la diffusion en ligne des contenus et données culturelles.

Lire la suite

Fêter le patrimoine, mais laisser disparaître le domaine public ?

Ce week-end, nous célébrons donc les Journées européennes du patrimoine, et vous serez des milliers et des milliers à aller visiter des monuments et des lieux de culture en France.

Il faudrait sans doute s’en réjouir, mais je n’y arrive pas. Vraiment pas…

Car voyez vous, ces journées sont celles du Patrimoine, mais pas celles du domaine public.

Les deux choses sont liées, mais elles demeurent profondément séparées en France. Le patrimoine national est fêté, protégé, valorisé et légitimé par le discours des pouvoirs publics. Le domaine public, quant à lui, est largement ignoré comme enjeu essentiel, et pire encore, dans sa version numérique, il subit une érosion croissante qui fait craindre pour sa disparition prochaine pure et simple.

Dans la plus grande indifférence…

Le domaine public est une notion liée à la propriété intellectuelle. Il correspond à cet état des oeuvres de l’esprit qui advient lorsque les droits patrimoniaux – de reproduction et de représentation – s’éteignent à l’expiration de la durée de protection (vie de l’auteur plus 70 ans, en principe). L’oeuvre devient alors librement utilisable par quiconque, y compris à des fins commerciales.

Source : Sketchtlex. CC-BY-NC-ND.

Il y a eu une Journée du domaine public, cette année, organisée le 26 janvier dernier par les associations Wikimedia France et Creative Commons France, à l’image du Public Domain Day, que le réseau européen Communia a mis en place le 1er janvier de chaque année pour célébrer l’entrée dans le domaine public de nouvelles oeuvres. C’était la première fois en France et j’avais eu l’honneur d’être invité pour participer à la conférence donnée en soirée. Je me souviens que j’avais néanmoins ressenti  un pincement, car nous n’étions qu’une maigre poignée…

Au moment de la clôture de la conférence, j’avais dit que j’espérais qu’un jour les Journées du Patrimoine soient transformées en Journées du Patrimoine ET du Domaine public.

Quelques mois plus tard, voici donc ces Journées du patrimoine qui reviennent. Le gouvernement a changé ; la nouvelle ministre de la Culture fait des annonces à propos d’une loi consacrée au patrimoine, qui verrait le jour en 2013, comportant plusieurs mesures intéressantes et positives. Très bien.

Mais le domaine public reste toujours désespérément absent du radar, et pire encore, plusieurs évènements ont eu lieu cette année qui font entrevoir des atteintes gravissimes en préparation, avec peut-être un point de non-retour pour le domaine public numérisé.

J’ai trop longtemps repoussé la rédaction de ce billet, en raison des contraintes qui pesaient sur ma liberté d’expression, du fait du devoir de réserve auquel j’étais soumis. Aujourd’hui, je l’écris, en espérant qu’il permettra d’attirer l’attention et de provoquer une réaction avant qu’il ne soit définitivement trop tard.

Lire la suite

Réutilisation des données publiques : l’exception culturelle balayée en une phrase…

Dans le litige qui oppose le département du Cantal à la société NotreFamille.com, la Cour Administrative d’Appel de Lyon vient de rendre une décision importante, qui contrairement au jugement en première instance du Tribunal Administratif de Clermont-Ferrand, donne raison au premier au détriment de la seconde.

Mais le droit est une matière subtile et ne nous y trompons pas : cette décision ne constitue nullement un revirement de jurisprudence par rapport à la solution consacrée par le TA  concernant la portée de l’exception culturelle en matière de réutilisation des données publiques.

Car il n’aura fallu à la Cour qu’une seule phrase – cinglante –  pour écarter cet argument et réaffirmer que les données culturelles sont bien soumises au principe général de la liberté de réutilisation.

La CCA de Lyon a consacré avec force que l’exception culturelle était une impasse pour les établissements qui cherchaient à se protéger en l’invoquant. (par askal.bosch. CC-BY-NC-ND)

Cette décision s’avère importante pour la diffusion des données culturelles en général et pour la mise en place de l’Open Data dans ce secteur, dont la portée restait à ce jour limitée (euphémisme !) en raison des incertitudes qui pesaient sur la signification de cette exception.

Lire la suite

Quelles évolutions juridiques pour l’Open Data en France et en Europe ?

Les premiers bilans de l’Open Data en France, 6 mois après le lancement du portail data.gouv.fr, oscillent entre la reconnaissance des efforts consacrés par les administrations publiques à l’ouverture des données et le constat de lacunes persistantes, que ce soit au niveau technique ou de retombées réelles pour les citoyens.

Mais en matière d’Open Data, la dimension juridique est également essentielle et c’est ce que vient de rappeler le Conseil National du Numérique (CNNum), en publiant cette semaine un avis qui recommande d’apporter des modifications substantielles au cadre législatif français.

C’est la loi CADA du 17 juillet 1978, qui pose les grands principes en la matière, modifiée à l’issue de la transposition en 2005 d’une directive européenne concernant la réutilisation des informations du secteur public.

OOF Sparkles. Par {pranav}. CC-BY. Source : Flickr.

Longtemps, le débat en France a tourné autour des questions de licences employées par les administrations pour libérer leurs données et de leur compatibilité, à la fois avec les principes de l’Open Data qu’avec les exigences de la loi du 17 juillet 1978. Cette question contractuelle tend aujourd’hui à passer au second plan, l’essentiel des initiatives françaises ayant choisi d’opter soit pour la Licence Ouverte d’Etalab, soit pour l’ODbL proposée par l’Open Knowledge Foundation.

Néanmoins, comme l’indique le Conseil national du Numérique dans son avis, c’est sans doute au niveau législatif que les questionnements pourraient à présent glisser, et au-delà au niveau communautaire, puisqu’une proposition de révision de la directive sur les informations du secteur public a été avancée par la Commission européenne en décembre 2011.

Il est intéressant de confronter les recommandations du CNNum avec les orientations possibles de la future directive européenne, pour essayer de cerner les différents chemins juridiques qui s’ouvrent pour l’Open Data.

Conforter le droit à la réutilisation des informations publiques

La première recommandation du CNNum consiste à imposer progressivement aux administrations l’obligation de publier d’elles-mêmes leurs données, alors que la loi de 1978 les oblige seulement à les communiquer sur demande. Il s’agirait en effet d’une avancée indiscutable, mais en la matière, il faut cependant voir que la France est en quelque sorte en avance au sein de l’Union européenne, car la loi de 1978 reconnaît un véritable droit au profit des citoyens à la réutilisation des informations publiques, dès lors que les documents qui les contiennent sont accessibles.

La directive européenne de 2003 n’allait pas si loin, dans la mesure où elle laissait la possibilité aux Etats ou aux administrations de décider quelles informations elles souhaitent rendre réutilisables ou non. Comme le dit Katleen Janssen dans une analyse d’avril 2012, la directive « ne créait donc pas un droit plein et entier à la réutilisation » et cette limitation a pu constituer un frein important à la réutilisation des données publiques en Europe.

Pour lever cet obstacle, la Commission recommande une modification de la directive qui exigera que toutes les informations accessibles puissent être réutilisées aussi bien à des fins non-commerciales que commerciales. Les seules restrictions qui persistent concerneront la protection des données personnelles ou des droits de propriété intellectuelle de tiers. D’une certaine façon, l’Union européenne s’aligne en la matière sur des principes que la France a déjà mis en oeuvre dans sa législation dès la transposition de 2005 et il faut reconnaître que notre droit avait déjà franchi cette étape.

La gratuité comme objectif

En ce qui concerne la question de la gratuité, le CNNum et la Commission ont des approches un peu différentes, mais qui tendent toutes les deux à étendre le champ de la réutilisation gratuite des données.

En France, comme le rappelle le CNNum, la gratuité a été fixée comme un principe par la circulaire du 26 mai 2011 qui a créé le portail data.gouv.fr. Ce texte  demande aux Ministères et aux établissements publics relevant de leur tutelle de diffuser leurs données via le portail unique de l’Etat , en recourant à la Licence Ouverte qui permet la réutilisation gratuite, y compris à des fins commerciales.

Selon cette même circulaire, les administrations ne pourront plus après le 1er juillet 2012 instaurer d’elles-mêmes une redevance pour la réutilisation des données. Cela ne sera possible que par le biais d’un décret du Premier Ministre et à condition de pouvoir avancer des « éléments dûment motivés » considérés comme pertinent par le Conseil d’Orientation de l’Edition Publique et de l’Information Administrative (COEPIA). Pour renforcer encore cette dynamique de gratuité, le CNNum propose d’appliquer également cette procédure aux redevances instituées avant le 1er juillet 2012, afin de réexaminer leur bien-fondé au regard des évolutions actuelles.

La proposition de directive européenne ne va pas de son côté jusqu’à proclamer un principe de gratuité en matière de réutilisation des informations publiques. Elle laisse, comme c’est le cas actuellement, la faculté aux administrations de décider d’instaurer des redevances, mais elle introduit des principes plus stricts que jusqu’alors en matière de calcul des tarifs. En principe, les redevances ne devront pas excéder « le coût marginal de reproduction et de diffusion« , ce qui empêchera aux administrations de rechercher à dégager des bénéfices importants et peut les inciter fortement à autoriser la réutilisation gratuite des données. Comme le relève le CNNum, ces préconisations sont plus restrictives que l’actuelle loi française qui permet aux administrations de tenir compte des coûts de collecte et de production, mais aussi d’inclure dans la redevance « une rémunération raisonnable de ses investissements« .

Bubbles. Par ntr23. CC-BY-NC-SA. Source : Flickr

Licences ouvertes ; formats moins…

En ce qui concerne la question des licences, la proposition de directive européenne contient une consécration de cette démarche contractuelle inspirée des licences libres, alors que certains avaient pu douter un temps qu’elle soit vraiment compatible avec le régime légal de la réutilisation des données.

La Commission indique que « les organismes du secteur public peuvent autoriser la réutilisation sans conditions ou poser des conditions, telle qu’une indication de la source, le cas échéant par le biais d’une licence« . Cette modification ouvre la voie à l’adoption de licences très ouvertes, telle la Creative Commons Zéro (CC0) et conforte la licence ouverte créée par Etalab.

En ce qui concerne les formats en revanche, on peut regretter un manque de volontarisme aussi bien du côté de la directive que du CNNum. La proposition de révision de la directive impose l’obligation de diffuser les données dans des formats « lisibles par des machines », mais elle n’indique pas que ces formats doivent être libres et non propriétaires. Pareillement, le CNNum propose que soit mis en place un Référentiel Général de Réutilisabilité des données publiques, qui comportera des indications concernant les formats, mais ne donne pas de recommandation forte en faveur des formats ouverts.

Conjurer l’ #EPICFAIL en matière d’Open Data

En revanche, le CNNum fait preuve d’audace en s’attaquant à une des limitations les plus importantes au développement de l’Open Data en France. Il préconise en effet que le droit à la réutilisation des données publiques soit étendu à celles produites par des SPIC (Services Publics à caractère Industriel et Commercial), alors que la loi du 17 juillet 1978 considère pour l’instant qu’il ne s’agit pas d’informations publiques.

Or de nombreux EPIC (Établissements Publics à caractère Industriel et Commercial) disposent de données particulièrement intéressantes pour l’Open Data, comme c’est le cas de la SNCF, du CNES, de l’ONF, de l’IGN, de l’IFREMER et d’autres encore. La restriction de la loi de 1978 n’a pas empêché un établissement comme la SNCF de se lancer dans une démarche d’Open Data, mais elle l’a fait sur une base purement volontaire (et avec certaines frictions du côté des licences…).

Mais le régime particulier des EPIC a pu conduire aussi à des #EPICFAILS (;-), comme ce fut le cas en 2011 avec l’épisode rocambolesque du conflit entre la RATP et CheckMyMetro. On peut du coup se réjouir de la proposition faite par le CNNum, tout en restant conscient que la question de la tarification des réutilisations pourra néanmoins continuer à se poser.

L’épineuse question des données culturelles

C’est également une des prises de positions du CNNum les plus fortes que celles qu’il avance à propos des données culturelles. A l’heure actuelle, les données culturelles relèvent elles aussi d’un régime dérogatoire, dénommé « exception culturelle »,  qui découle de la directive européenne. J’ai déjà eu l’occasion sur OWNI de montrer que ce régime d’exception soulève de réelles difficultés et qu’il provoque une véritable marginalisation des données culturelles au sein du mouvement d’Open Data en France.

Le CNNum partage cette analyse et déplore la sous-exploitation des données culturelles, qui sont pourtant par leur richesse particulièrement propices à la réutilisation. Considérant que leur nature ne justifie pas qu’elles soient traitées à part, il recommande que l’exception culturelle soit purement et simplement levée et que les données culturelles réintègrent le régime général de la loi de 1978.

Mieux encore, le CNNum condamne une des dérives les plus criantes de l’emploi du droit des données publiques en France. En effet, certains établissements culturels utilisent ce droit pour empêcher la réutilisation à des fins commerciales des oeuvres du domaine public qu’ils numérisent, à moins de payer une redevance. D’autres utilisent le droit de la propriété intellectuelle pour « reprivatiser » le domaine public en s’arrogeant un droit sur les images scannées. Le CNNum déplore ces pratiques et c’est sans doute la première fois en France qu’une position officielle s’élève aussi nettement en faveur de la défense du domaine public.

Mais hélas, en matière de données culturelles, la proposition de révision de la directive européenne s’avère plus décevante et elle pourrait même conduire à une régression en France. En effet, en apparence, la nouvelle directive propose également de considérer les données des bibliothèques, des musées et des archives comme des informations réutilisables, ce qui supprime la fameuse exception culturelle. Mais plus loin, et de manière assez contradictoire, le texte réintroduit des règles spécifiques en ce qui concerne les données produites par ces établissements, et elles ne vont pas dans le sens de l’ouverture.

Par exemple, pour les informations sur lesquelles les bibliothèques, musées et archives détiennent eux-mêmes des droit de propriété intellectuelle, ces établissements pourraient toujours continuer à décider de permettre ou non a priori la réutilisation des données. De telles dispositions appliquées en France constitueraient une régression, car la  jurisprudence administrative a déjà décidé que l’exception culturelle ne permettait pas par exemple à un service d’archives de s’opposer à la réutilisation de données numérisées par une entreprise.

Par ailleurs, la proposition de directive indique que par dérogation avec les principes généraux qu’elle énonce, les établissements culturels pourraient continuer à fixer des tarifs de réutilisation des données supérieur « aux coûts marginaux de reproduction et de diffusion » qu’elle fixe comme limite aux autres administrations. Il n’y a pas pire signal à envoyer aux établissements culturels, qui cèderont sans doute à la tentation de monétiser leurs données, ce qui continuera à les couper de l’Open Data. La CADA avait pourtant déjà interdit aux services d’archives de fixer des tarifs trop élevés et là aussi, la nouvelle directive constituerait une forme de régression.

Le CNNum pointe également à juste titre le problème des droits d’auteur des agents publics, qui peuvent constituer une lourde entrave à la libération des données, et ce, même lorsque les institutions sont prêtes à embrasser une politique d’Open Data. Là encore, la proposition de directive est susceptible de causer davantage de problèmes qu’elle n’apportera de solutions, car elle comporte un article précisant que « les dispositions de la présente directive sont sans préjudice des droits économiques ou moraux dont les employés des organismes du secteur public peuvent bénéficier en vertu des réglementations nationales.« 

On peut franchement déplorer le manque de cohérence de la proposition de révision de la directive en matière de données culturelles et espérer que ces aspects soient modifiés avant son adoption.

Glass Ball. Par MissMae. CC-BY-NC. Source : Flickr

Les données publiques, des biens communs ?

Il y a une question relative à l’Open Data qui n’est abordée ni par le CNNum, ni par la proposition de révision de la directive et qui me paraît pourtant correspondre à un véritable enjeu.

Le cadre juridique n’envisage pour l’instant, ni au niveau européen, ni au niveau national, la possibilité d’appliquer une clause de partage à l’identique (Share Alike) en cas de réutilisation de données publiques, à l’image de ce qui caractérise le Copyleft dans le domaine du logiciel libre. Une clause de ce type impose à celui qui réutilise des éléments de placer ses propres enrichissements sous la même licence, afin de conserver le caractère ouvert et réutilisable prévu par la licence initiale.

Appliquée aux données publiques, une telle démarche signifie qu’une firme qui produit une base dérivée à partir de données sous Share Alike serait obligée de placer sa réalisation sous une licence ouverte et de permettre elle aussi la réutilisation des données en les reversant à une sorte de « pot commun » où d’autres pourraient venir puiser.

Certaines administrations françaises, au niveau local, ont déjà opté pour cette logique du partage à l’identique, en choisissant de placer leurs données sous la licence ODbL, qui comporte une telle clause virale. Mais au niveau des administrations centrales, cette démarche est pour l’instant impossible, car la Licence Ouverte de data.gouv.fr n’impose pas le Share Alike, mais seulement la mention de la source.

Certains estiment que le partage à l’identique serait nécessaire pour constituer les données publiques en biens communs et empêcher qu’elles soient réappropriées de manière définitive par des acteurs privés. On évoluerait ainsi vers une approche moins « libérale » de l’Open Data et des rapports économiques plus équilibrés entre le public et le privé.

Force est de constater que cette dimension ne figure ni dans les recommandations du CNNum, ni dans la proposition de directive, mais la situation pourrait être modifiée si le partage à l’identique était au moins proposé commune option dans la Licence Ouverte de data.gouv.fr.

Doit-on faire de l’Open Data la règle ?

Dans une chronique précédente, j’avais évoqué les recommandations du réseau européen Communia, qui préconisait de faire de l’Open Data un principe général applicable par défaut au données publiques. Pour ce faire, Communia recommandait : 1) de recourir à des licences les plus ouvertes possibles, afin de rapprocher au maximum le régime juridiques des données publiques du domaine public ; 2) de rendre obligatoire la diffusion des données dans des formats ouverts, lisibles par des machines ; 3) d’affirmer un principe de gratuité en matière de réutilisation des données publiques.

Les recommandations du CNNum et la proposition de révision de directive contiennent des orientations fortes en ce sens, mais ils ne vont ni l’un, ni l’autre jusqu’à consacrer l’Open Data comme un principe général.

Cela signifie que l’Open Data restera encore dans les années à venir avant tout une question de volonté politique et non la simple conséquence d’une obligation juridique.