L’ouverture des brevets de la recherche, un tabou pour l’Open Science ?

Le concept d’Open Science tend à prendre aujourd’hui de plus en plus d’importance, en devenant progressivement le nouveau paradigme de référence de diffusion des résultats de la recherche. Il est notamment poussé par l’Union européenne dans le cadre du programme « Horizon 2020 » et en avril 2016, un appel solennel à été lancé depuis Amsterdam pour inciter les Etats-membres à initier des actions en faveur de la Science Ouverte. Si la définition du concept d’Open Science est parfois assez fluctuante, sinon fuyante, on s’accorde à y voir un « au-delà » de l’Open Access, s’inspirant de la même philosophie générale, mais s’appliquant à d’autres objets que les publications scientifiques. L’Open Science concerne aussi les logiciels utilisés par les chercheurs pour conduire leurs recherches (Open Source), ainsi que les données sur lesquelles ils s’appuient (Open Data). D’autres dimensions du processus de recherche sont parfois incorporées à la notion, comme on peut le voir sur le schéma ci-dessous, proposé par le programme européen FOSTER.

L’article de Wikipédia consacré à l’Open Science suit à peu près la même logique, en déclinant le concept des six principes : Open Data, Open Source, Open Methodology, Open Peer Review, Open Access, Open Educational Resources.

Mais quelque chose me frappe toujours dans ces modélisations de l’Open Science : elles laissent de côté une dimension pourtant essentielle du processus de recherche (au moins dans certaines disciplines), à savoir la question de la gestion des droits sur les inventions et le dépôt de brevets. C’est comme si la Science Ouverte s’arrêtait toujours aux portes de la propriété industrielle et que la question de l’ouverture et de la libre réutilisation des inventions restait une sorte de tabou.

En 2016, le CNRS a publié un livre blanc intitulé « Une Science ouverte dans une République numérique« , remarquable dans l’ensemble, mais qui porte la marque de ces contradictions. Si le texte se prononce très clairement en faveur de l’Open Access, de l’Open Source et de l’Open Data, il se montre par contre beaucoup moins hardi lorsqu’il est question des brevets :

Les frontières de la valorisation et de la science ouverte

Lopen science ne doit pas faire obstacle aux enjeux économiques de la recherche.

La mise à disposition des données scientifiques sur des plateformes open science ne doit pas aller à l’encontre :

  • de la valorisation des données notamment par brevet ;
  • du respect des secrets et des dispositions spécifiques telles que les Zones à Régime Restrictif ;
  • du respect des règles contractuelles de confidentialité.

Pourtant, une autre façon de voir les choses existe et ce sont les universités du Danemark qui montrent qu’il est parfaitement possible d’inclure les brevets dans le processus de l’Open Science. Traditionnellement, les laboratoires de recherche nouent des partenariats avec des entreprises privées afin que celles-ci participent au financement de travaux avec, en contrepartie, un partage des résultats et des dépôts de brevets venant sécuriser les droits de propriété intellectuelle sur les inventions découvertes. Mais l’université d’Aarhus a mis en place une initiative, justement intitulée « Open Science », pour inverser ces rapports avec les partenaires privés et faire évoluer le sens de ces partenariats de recherche :

L’initiative de l’université d’Aarhus, intitulée Open Science, prévoit que ni l’université ou ni les entreprises impliquées dans les projets ne pourront breveter les découvertes effectuées au cours du processus de recherche et, à la fin, les résultats sont mis à la disposition de tous – même à d’autres entreprises – sur une plateforme sans restriction liée à la propriété industrielle.

[…]

Kim Daasbjerg, un professeur de chimie qui a lancé et dirigé l’initiative, a déclaré qu’au cours des 10 à 15 dernières années, les universités avaient pratiqué une politique de dépôt de brevets sur leurs découvertes et qu’elles étaient même encouragées à «obtenir autant de brevets que possible».

« Je ne pense pas que ce soit le rôle de l’université de faire cela », a-t-il déclaré. «Notre compétence, notre apport à la société, c’est la recherche fondamentale».

Jusqu’à présent, six grandes entreprises, dont Lego, ont mis de l’argent sur la table pour financer la recherche sur des matériaux intelligents, tandis que d’autres petites entreprises ont promis du temps et de l’expertise, a-t-il déclaré. Une vingtaine de chercheurs travaillent maintenant dans le cadre de la nouvelle plate-forme, dont six de l’Université d’Aalborg et trois de l’Université de Copenhague.

On peut se demander pourquoi des entreprises iraient collaborer à des projets de recherche et y consacrer des moyens si elles ne peuvent s’assurer en bout de course d’une exclusivité, au moins temporaire, sur les résultats obtenus. Mais ce changement d’approche fait écho à des évolutions dont j’ai déjà eu l’occasion de parler dans ce blog, aux termes desquelles on commence à voir des entreprises de premier plan, comme Tesla ou Toyota, choisir de renoncer aux brevets qu’elles avaient obtenus sur certaines technologies afin de les promouvoir et de les faire évoluer vers des standards. La « guerre des brevets« , qui a frappé des secteurs comme celui des smartphones et des tablettes, aura visiblement laissé des traces, et si des secteurs comme celui des voitures autonomes pourraient à présent connaître des embrasements similaires, d’autres industriels semblent commencer à percevoir les vertus d’une approche « Open ». C’est typiquement sur ce genre de stratégies que les universités pourraient s’appuyer pour développer des partenariats d’un nouveau genre avec les entreprises.

Il faut savoir que cette tendance des universités à déposer des brevets est en réalité relativement récente. Elle date des années 80 et ce sont les Etats-Unis qui ont initié le mouvement dans le cadre de la mise en place d’une « économie de la connaissance », avec de fortes conséquences sur l’activité même de recherche comme l’explique ci-dessous Hervé le Crosnier :

Ce changement de l’état d’esprit de la recherche découle d’une loi de 1980, le Bayh-Dole Act qui a permis aux universités des États-Unis de déposer des brevets. Cela conduit ces dernières à créer des « services de valorisation » et à s’engager dans des stratégies de recherche à finalité directe. Étant donné le poids de la recherche en provenance des États-Unis, ce phénomène s’est étendu sur toute la planète. Et les chercheurs critiques, ou dont les travaux pouvaient mettre à mal certaines sources de revenus des universités, ont été marginalisés, à l’image d’Ignacio Chiapela, renvoyé de l’université de Berkeley en 2001 parce que ses travaux montraient l’existence de contamination OGM au Mexique, alors que l’université qui l’employait avait des contrats avec Syngenta, grande multinationale de l’agro-alimentaire technologique. La discussion scientifique elle-même pâtit de cet alignement des universités sur la recherche de revenus. La façon dont a été traité le chercheur Gilles-Éric Séralini, dont un article opposé aux OGM a été retiré d’une revue suite à la pression de Monsanto, et dont les travaux ont été dénigrés avec des arguments provenant des public-relations et non dans le cadre normal des controverses scientifiques, est un exemple récent de ce phénomène.

Les dépôts de brevets par les universités font partie intégrante de que l’on appelle la deuxième vague d’enclosure des Communs, celle qui a frappé la Connaissance selon les mots du juriste américain James Boyle, après que les terres aient été concernées à partir de la fin du XVIIIème siècle. La propriété intellectuelle, concept qui n’apparaît vraiment qu’après la Seconde guerre mondiale, s’est saisie peu à peu de la plupart des ressources produites par l’esprit humain et cette forme de « privatisation » n’a pas épargné les universités, qui sont même devenues un des rouages essentiels de ce système.

Le parallèle est d’ailleurs assez intéressant entre ce qui s’est passé pour les articles scientifiques et les dépôts de brevets par les instituts de recherche et les universités. On sait que pour les articles, un système d’accaparement s’est mis en place autour des revues scientifiques, propriétés de quelques grands éditeurs mondiaux, qui se font céder les droits d’auteur des chercheurs pour revendre ensuite aux universités l’accès aux résultats de la recherche. On est typiquement devant un processus de constitution d’une « fausse marchandise » au sens où l’entend l’économiste Karl Polanyi. C’est cette forme d’enclosure sur la connaissance que le mouvement de l’Open Access a entrepris de combattre en promouvant, selon diverses formules, la libre diffusion des écrits scientifiques sur Internet.

Pour les brevets, on est face à une logique similaire, dans la mesure où ce que l’on nomme de manière très ambiguë « valorisation des résultats de la recherche » aboutit en réalité à un transfert de propriété du public vers le privé. Mais l’analogie avec les articles scientifiques n’est pas parfaite. En effet, l’équilibre entre le privé et le public paraît à première vue plus équitable en ce qui concerne les inventions. Les brevets, par définition, sont en « Open Access », car on ne peut obtenir un tel titre de propriété intellectuelle auprès de l’INPI ou d’une autre institution habilitée qu’à la condition de révéler son invention pour permettre à tous d’en connaître la teneur. Le système des brevets a été mis en place pour lutter contre la pratique du secret en « récompensant » ceux qui acceptent de révéler leurs inventions par un monopole d’exploitation limité dans le temps (20 ans). Avec les inventions, on n’est donc pas confronté à ces paywalls derrière lesquels les éditeurs scientifiques mettent sous séquestre la connaissance, pour des durées beaucoup plus longues qui plus est (70 ans après la mort de l’auteur…). Par ailleurs si, dans l’immense majorité des cas, les chercheurs ne sont pas payés par les éditeurs pour la publication de leurs articles (c’est même l’inverse qui est en train peu à peu de se généraliser…), ce n’est pas le cas pour la réutilisation des brevets des universités par les entreprises qui font généralement l’objet d’accords de licence impliquant le versement de redevances.

La situation est donc différente du scandale aberrant qui frappent les articles scientifiques, pour lesquels le public paye deux fois : une première fois à l’origine avec le salaire des chercheurs publics pour la production des articles et une seconde fois pour acheter le droit d’y accéder auprès des éditeurs privés. Avec les brevets, il y a bien un flux d’argent en provenance du privé vers le secteur public. Mais en réalité, le problème est ailleurs et l’effet d’enclosure provient essentiellement de la sous-utilisation des ressources qui survient à cause de l’application systématique de droits exclusifs. C’est ce qu’expliquent bien les promoteurs du projet danois cité plus haut, qui critiquent la rationalité économique du dépôt de brevets par les universités :

Une analyse des bureaux de transfert de technologie dans les universités américaines réalisée par le cabinet Brookings en 2013 a conclu que, malgré une augmentation spectaculaire du nombre de ces bureaux depuis la fin des années 1980, les 10 pour cent les plus élevés ont pris environ les trois quarts du revenu. Sur 155 bureaux, 130 fonctionnaient à perte. Le professeur Daasbjerg estiment que les brevets constituent souvent de «mauvaises affaires».

Adam Stoten, directeur général d’Oxford University Innovation, qui aide les universitaires possédant des brevets à gérer les questions de propriété intellectuelle, reconnaît que «de nombreux bureaux de transfert de technologie ne sont pas rentables».

Les droits exclusifs liés aux brevets sont donc rarement profitables pour les universités et ceux qui verraient là un moyen de réaliser le fantasme des fameuses « ressources propres » des universités risquent une cruelle déception. Néanmoins, les brevets, même improductifs sur le plan économique, jouent comme une barrière à la réutilisation des inventions qu’ils « protègent », en raison des coûts de transaction à régler pour avoir accès aux ressources. Du coup, une proportion élevée des brevets déposés par les universités ne sont tout simplement jamais réutilisés et l’on aboutit à ce que Michael Heller a appelé une « tragédie des anti-Communs », c’est-à-dire une situation sous-efficace du point de vue économique où une ressource ne peut trouver son utilité du fait de l’accumulation de droits dont elle fait l’objet.

L’initiative de l’université d’Aarhus montre néanmoins qu’il n’y a pas de fatalité et qu’il est possible de concevoir des dispositifs, finalement très proches des archives ouvertes, pour renverser le sens des relations entre la recherche et le monde de l’entreprise. On notera que cela passe par la mise en place de nouveaux systèmes de conventions, qui au lieu de mettre systématiquement en avant « la propriété des résultats de recherche » prévoient au contraire qu’aucun partenaire ne cherchera à se les approprier pour qu’ils puissent faire l’objet d’une libre diffusion et réutilisation. C’est la condition pour que les traditionnels partenariats Public-Privé deviennent ce que l’on appelle des partenariats Public-Privé-Communs.

Là où le projet danois est également intéressant, c’est qu’il pointe un autre des travers du système actuel : si les chercheurs déposent des brevets, bien que cela soit coûteux et alors même qu’ils savent très bien que dans la majorité des cas aucune licence ne sera ensuite signée, c’est parce que les brevets ont été détournés de leur fonction initiale pour devenir des systèmes de publication des résultats de la recherche, ainsi qu’un moyen d’évaluer les projets. Les chercheurs mettent dans leur CV les brevets déposés, au même titre que leurs publications d’articles, comme autant de « marqueurs » qui serviront ensuite aux agences d’évaluation.

Toute la difficulté pour l’Open Science est d’arriver à découpler le processus de publication de celui de l’attribution de droits exclusifs. Il faut que la publication d’écrits en Open Access, de logiciels en Open Source, de jeux de données en Open Data, et donc aussi d’inventions sans dépôt de brevet, puissent « compter » dans l’évaluation des chercheurs, sans quoi la Science ouverte a peu de chances de dépasser un petit cercle de convaincus.

Quel statut pour les données de la recherche après la loi numérique ?

Ce billet est le troisième d’une série que j’ai entamée au début de la semaine pour cerner les répercussions de la loi « République numérique » sur le secteur de l’Enseignement supérieur et de la Recherche. Après avoir commencé lundi à passer en revue le volet Open Access de la loi, je me suis penché sur la question de l’ouverture des données publiques et sur la manière dont les universités ont été intégrées dans le principe « d’Open Data par défaut » instauré par le texte. Cela concerne au premier chef les données administratives de ces établissements- celles produites par leurs services centraux et communs -, mais je terminais en posant la question de savoir dans quelle mesure les données de la recherche allaient être impactées (ou non) par ces nouvelles obligations de publication en Open Data.

data

C’est ce sujet que je vais traiter dans ce troisième billet, en élargissant la perspective pour essayer de montrer en quoi la loi « République numérique » a commencé à mettre en place un statut juridique spécifique pour les données de la recherche. Vous allez voir que les répercussions potentielles de la loi sont profondes en la matière, même si le texte contient quelques zones d’ombre qui rendent encore assez imprévisibles ses effets à long terme.

Par « données de la recherche » – notion complexe à définir -, je n’entendrai pas les données sur la recherche (qui cherche sur quoi ? avec quels financements ? etc.), qui relèvent des données administratives et donc du nouveau principe d’Open Data par défaut, mais les données résultant directement des activités de recherche, produites par les chercheurs.

L’ébauche d’un statut spécifique pour les données de recherche

Il faut faire une lecture combinée de plusieurs articles de la loi numérique pour apercevoir dans le texte l’ébauche d’un statut juridique des données de recherche. L’article 38 – celui qui consacre une nouvelle exception au droit d’auteur en faveur du Text et Data Mining – contient à ce propos une précision intéressante. Le texte aborde en effet la question de la conservation des fichiers qui sont produits dans le cadre de ce type d’activités de recherche et il prend la peine d’indiquer la chose suivante :

[…] ces fichiers constituent des données de la recherche.

Cette phrase peut paraître à première vue assez anodine, mais elle signifie en réalité que les « données de la recherche » vont à présent constituer une nouvelle catégorie juridique au sens propre du terme, avec des conséquences en terme de régime applicable. C’est un premier indice  qui nous montre que la loi a introduit un « statut » spécifique pour les données de la recherche, même si comme vous allez le voir, il faut produire un effort d’interprétation conséquent pour cerner exactement en quoi il consiste.

Une protection puissante contre la captation par les éditeurs

A l’article 30 de la loi numérique – celui consacré à l’Open Access -, on trouve les premiers éléments de réponse. C’est là que la loi consacre un nouveau « droit d’exploitation secondaire » au profit des chercheurs leur garantissant la possibilité d’auto-archiver leurs écrits, en dépit des clauses des contrats d’exclusivité qu’ils auraient pu signer avec des éditeurs, au terme d’un délai de 6 à 12 mois selon les disciplines.

 Mais le texte contient aussi un passage sur les données de la recherche, qui instaure un mécanisme de protection contre leur captation par les éditeurs scientifiques :

L’éditeur d’un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication.

Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite.

Ce passage répond à une inquiétude grandissante dans les milieux académiques face aux pratiques des éditeurs vis-à-vis des données de recherche. Ces derniers – et notamment les plus puissants du secteur, type Elsevier ou Springer – ont commencé à inciter ces dernières années les chercheurs à publier non seulement le texte de leurs publications, mais aussi des matériaux complémentaires (complementary material), constitués en général par les jeux de données brutes ayant permis d’élaborer les résultats faisant l’objet de la publication. Grâce à leur position dominante, ces acteurs étaient donc en mesure d’emmagasiner peu à peu de grands volumes de données de recherche, soumises aux mêmes clauses d’exclusivité que les articles. Dès lors, le même phénomène de privatisation qui a frappé les écrits scientifiques était en train de se reproduire pour les données de recherche, avec à terme le risque pour les universités d’avoir à racheter aux éditeurs l’accès aux données que la communauté des chercheurs avaient produites.

Pour parer à ce danger, la loi numérique a prévu un mécanisme de protection assez similaire à celui du droit d’exploitation secondaire sur les écrits, même si on va voir qu’il est en réalité plus puissant dans ses effets. Le principe sera dorénavant que l’éditeur ne pourra plus « limiter la réutilisation des données de la recherche rendue publiques [accompagnant un écrit] dans le cadre de sa publication« . Cela signifie que, quand bien même des contrats contenant des clauses d’exclusivité seraient signés par les chercheurs, celles-ci seraient privées par la loi de toute validité. Plus encore, si l’éditeur rassemble ces informations fournies par les chercheurs dans une base de données, les Conditions Générales d’Utilisation (CGU) – qui ont une valeur contractuelle – ne pourront pas non plus empêcher la réutilisation des données de recherche. Elles doivent pouvoir en être librement extraites pour réutilisation. Sur ce dernier point, il faudra cependant attendre pour y voir plus clair les dispositions du décret d’application de l’article 38 de la loi sur le Text et Data Mining, qui doit déterminer les « conditions dans lesquelles l’exploration des textes et des données est mise en œuvre« .

On a donc ici un puissant mécanisme contre la captation à titre exclusif des données de la recherche par les éditeurs scientifiques, et on notera que par rapport au droit d’exploitation secondaire sur les écrits, ce dispositif de neutralisation des clauses contractuelles possède un effet immédiat. Il n’y a pas de durée d’embargo destinée à garantir une période d’exploitation commerciale exclusive pour l’éditeur. Les donnés de recherche sont en quelque sorte « immunisées » dès leur publication à toute tentative d’enclosure (pour employer un terme tiré de la théorie des Communs).

Puissante dans ses effets, cette disposition est cependant limitée dans son périmètre d’application. Notamment, elle n’est opposable qu’aux « éditeurs » d’un écrit scientifique auquel des données sont associées. Or on aurait aimé qu’elle puisse l’être également à des acteurs comme les réseaux sociaux numériques, type Academia ou Research Gate qui, déjà avides des données personnelles des chercheurs, pourraient très bien à terme aussi développer un appétit pour les données de la recherche. Et on sait aussi que certaines plateformes de diffusion des données de recherche sont contrôlées en réalité par des éditeurs (comme Figshare par exemple, qui est la propriété de Macmillian Publishers). Il aurait donc mieux valu que la protection conférée par l’article 30 soit formulée de manière plus générale pour être opposable à n’importe quel type d’acteurs, et pas uniquement aux éditeurs.

Mais moyennant ces réserves, on peut considérer que la loi numérique a posé des garde-fous précieux contre ce qui pourrait constituer dans les années à venir un grave problème pour l’écosystème de la recherche. Les éditeurs pourront tout à fait continuer à développer des activités autour des données de la recherche, mais ils devront fonder leurs modèles économiques sur de véritables services à valeur ajoutée. Ils ne pourront pas se contenter d’utiliser leur position dominante pour en revendre l’accès (à condition toutefois que se développe en parallèle une véritable politique publique d’infrastructures pour l’archivage et la diffusion des données scientifiques pour empêcher la constitution d’un monopole de fait. Mais c’est justement ce que la loi rend possible, en interdisant aux éditeurs de s’approprier en amont les données à titre exclusif).

Des données de recherche « libres » dès la publication

Pour revenir à l’article 30, on va voir à présent qu’il va créer une « condition juridique »originale pour les données de recherche et très différente de celle des articles scientifiques.

On sait en effet que les chercheurs constituent des agents publics qui ont la particularité de conserver pleinement leur droit d’auteur sur les œuvres qu’ils produisent dans le cadre de leurs fonctions (contrairement aux autres agents publics, dont les droits patrimoniaux sont exercés par leurs tutelles et dont le droit moral est réduit au droit à la paternité).

Une des conséquences secondaires de cette titularité individuelle des droits pour les chercheurs sur leurs écrits est que ceux-ci ne deviennent pas automatiquement réutilisables lorsqu’ils choisissent de les publier en ligne dans des archives ouvertes ou sur un site personnel. Le droit d’auteur qui s’applique à eux est pleinement maintenu lors de la diffusion sur Internet. C’est le cas par exemple pour un article déposé par un chercheur sur HAL ou dans une archive ouverte institutionnelle : par défaut, si le chercheur ne fait rien d’autre que le déposer, l’article sera librement accessible, mais pas librement réutilisable. Il ne le deviendra que si le chercheur choisit d’opter par un acte positif pour une licence Creative Commons (ce que la plate-forme HAL permet depuis le passage à la v3).

Cet état de fait justifie aux yeux de certains que l’on fasse une distinction entre « l’Accès ouvert »  et « l’Accès libre », les deux expressions renvoyant à deux réalités différentes. C’est notamment une précision que rappelle régulièrement Marin Dacos (et encore récemment dans la préface de la traduction d’un ouvrage de Peter Suber, dont voici un extrait)  :

Le terme open signifie « ouvert », et non « libre ». Il implique donc que le texte d’un article en open access est ouvert en lecture, sans barrière juridique, technique ou commerciale. Mais il ne dit rien des possibilités de réutilisation du document. Par conséquent, stricto sensu, l’open access lève les barrières à l’accès et maintient toutes les protections du droit d’auteur sur les textes, ce qui signifie qu’ils ne peuvent être reproduits ou modifiés qu’après une autorisation explicite, dans le cadre d’un contrat de cession de droit.

Or c’est précisément une distinction qui n’aura à présent plus de sens à propos des données de la recherche : des données publiées par un chercheur ou un établissement deviendront instantanément réutilisables librement, si bien que l’accès ouvert sera aussi synonyme d’accès libre.

C’est ce qui ressort notamment de ce passage de l’article 30 de la loi :

Dès lors que les données issues d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités territoriales, des établissements publics, des subventions d’agences de financement nationales ou par des fonds de l’Union européenne ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu’elles ont été rendues publiques par le chercheur, l’établissement ou l’organisme de recherche, leur réutilisation est libre.

« Leur réutilisation est libre ». La formule peut paraître lapidaire, mais elle n’en a pas moins d’importantes conséquences sur le plan juridique. Ces termes doivent être pris au sens de la lettre : la réutilisation est complètement libre, à toutes fins (y compris commerciales) et sans condition (pas même celle de citer la source). 

On peut en déduire (et c’est assez révolutionnaire) que la loi numérique va rendre inutile le recours aux licences libres pour la diffusion des données de la recherche. On sait que pour encadrer l’ouverture des données publiques en France, l’Etat a créé la Licence ouverte / Open Licence (qui permet la réutilisation des informations  à toutes fins, à condition d’en citer la source). D’autres licences, comme l’ODbL ou les licences Creative Commons, sont également utilisables en matière d’ouverture de bases de données. Or pour les données de recherche, de tels instruments sont à présent inutiles, car c’est la loi directement qui instaure à leur sujet un droit de libre réutilisation dès lors qu’elles sont publiées. 

On peut même aller plus loin en disant qu’il ne faut pas utiliser ces outils pour diffuser des données de recherche, car ces différentes licences comportent des conditions de réutilisation plus restrictives que le droit de libre réutilisation totale prévu par la loi. Or ces clauses (BY/NC/ND/SA) n’auront plus d’effet utile en raison du caractère d’ordre public des dispositions de l’article 30. La seule licence dorénavant compatible avec le régime légal des données de recherche est la CC0 

En cela, ce texte innove réellement, car c’est à ma connaissance un des seuls cas où la loi française va créer du « libre à l’état natif », sans avoir besoin de recourir à des licences pour opérer cette libération. Les dispositions de la loi se déclenchent automatiquement par l’acte de publication (et vous noterez d’ailleurs que le texte ne parle pas de publication « en ligne », mais simplement de publication, ce qui couvre des hypothèses plus larges, comme la diffusion via une base de données commerciale).

Quelles limites à la libre réutilisation ?

Néanmoins, il faut immédiatement préciser que l’article 30 a prévu de limiter son périmètre d’application, en excluant certains types de données de cet effet de « libération immédiate ». Il indique en effet que la réutilisation est libre , sauf si les données « sont protégées par un droit spécifique ou une réglementation particulière« .

Cette précision peut paraître à première vue assez sibylline, mais elle est en réalité parfaitement logique. On peut en effet penser à des données correspondant à des informations à caractère personnel, qui sont protégées par une « réglementation particulière ». Si c’est le cas, alors bien évidement, leur réutilisation ne sera pas libre, mais soumise à ce que prévoit la législation en la matière.

On peut aussi penser également au droit à l’image des personnes, qui constitue un « droit spécifique ». Celui-ci ne cédera pas du fait que des matériaux serait utilisés à des fins de recherche. Il est donc normal que le législateur ait prévu ces restrictions à la libre réutilisation des données de recherche, qui permettent de concilier des principes d’égale valeur.

Quid de l’articulation avec les droits de propriété intellectuelle ?

Mais la question devient plus épineuse si l’on entend par « droits spécifiques » des droits de propriété intellectuelle. Cela entre d’ailleurs manifestement dans l’intention du législateur, puisque ces droits sont visés dans l’exposé des motifs de la loi :

Le II spécifie que la réutilisation de données issues d’activité de recherche financées majoritairement sur des fonds publics est libre, dès lors que ces données ne sont pas protégées par un droit spécifique, comme par exemple un droit de propriété intellectuelle, et qu’elles ont été rendues publiques par le chercheur ou l’organisme de recherche.

Si par droit de propriété intellectuelle, on entend le droit d’auteur, alors les choses sont somme toute logiques encore, notamment afin de préserver les droits des tiers. Imaginons qu’un corpus de recherche contienne des documents protégés par des droits d’auteur (par exemple, un ensemble de textes littéraires). Si ce corpus est publié, alors bien entendu, il ne peut devenir ipso facto librement réutilisable. Pour être plus exact, il sera réutilisable dans une certaine mesure, sur le fondement de l’exception  Text et Data Mining prévue à l’article 38 de la loi, mais pas sur celui du droit de libre réutilisation des données de la recherche figurant à l’article 30.

Le vrai problème que pose l’articulation de cet article 30 avec les droits de propriété intellectuelle se situe en fait au niveau du droit des bases de données. Imaginons qu’un chercheur ou un établissement publie un jeu de données sur lequel porte un droit sui generis de producteur de base de données. On a alors bien affaire à un objet protégé par un « droit spécifique » et dans ce cas, ce jeu ne devrait pas devenir « librement réutilisable », si l’on s’en tient à la seule lecture de l’article 30.

Si l’on admet une telle interprétation,  la portée de ce droit de libre réutilisation des données de la recherche serait en réalité bien limitée, car dès lors que des jeux de données sont un peu conséquents, la protection du droit des bases de données leur sera sans doute applicable. Par ailleurs, l’application de l’article deviendrait aussi très incertaine, car le droit de producteur des bases de données est souvent aléatoire dans sa mise en œuvre. La jurisprudence est en effet  fluctuante sur la question et il n’est pas simple a priori de déterminer si telle ou telle base bénéficie ou non de la protection.

Mais vous allez voir l’obstacle à la libre réutilisation que pourrait constituer le droit des bases de données n’est en réalité pas insurmontable.

Qui est réellement titulaire des droits sur les données de recherche ?

Pour démêler cette question, il faut se demander à qui appartient réellement la propriété sur les données de recherche. Et le raisonnement à suivre pour répondre est là encore complètement différent de celui applicable aux articles.

En effet, pour les écrits scientifiques, les chercheurs sont incontestablement titulaires du droit d’auteur. Ce qui signifie que même si un chercheur produit des écrits sur son temps de travail et avec les moyens fournis par une université, il reste entièrement maître du droit sur ses créations, et c’est lui qui décide où et comment publier ses écrits.

Or pour les bases de données, les choses sont différentes. Même si ce sont les chercheurs qui produisent les données figurant dans ces bases, la titularité des droits peut – et même va dans la plupart des cas – leur échapper. En effet, le Code de propriété intellectuelle prévoit que la notion de producteur d’une base de données ne s’entend pas des personnes physiques qui collectent et traitent les informations, mais de la personne – physique ou morale – qui « prend l’initiative et le risque des investissements correspondants » et en retour « bénéficie d’une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d’un investissement financier, matériel ou humain substantiel« .

C’est donc vers le financeur et le fournisseur de moyens qu’il faut se tourner pour déterminer qui est titulaire des droits sur une base de données de la recherche. Dans la plupart des cas, ce seront donc les établissements auxquels les chercheurs sont rattachés qui bénéficieront de ces droits et non les chercheurs. Contrairement à ce qui prévaut pour les articles et autre écrits scientifiques, les bases de données appartiennent donc en principe aux institutions de recherche.

Sans doute faut-il nuancer quelque peu cette affirmation. Imaginons un chercheur qui publie un article dans une revue et qui lui adjoint un tableau de données brutes lui ayant servi à arriver aux résultats faisant l’objet de la publication. Dans ce cas, il est possible que le chercheur soit la personne qui a réalisé les « investissements » nécessaires –  sur ses propres forces – pour produire ces données. Mais quand bien même, il est fort improbable que de tels investissements individuels soient considérés comme « substantiels » au sens de la jurisprudence et ce tableau ne constituera vraisemblablement pas une base de données protégée. Donc il y a peu de chances qu’un chercheur isolé puisse être considéré comme un « producteur de base de données », au sens juridique du terme.

Imaginons à présent une base de données produite collaborativement et maintenue par les chercheurs d’un laboratoire ou une base de données développée spécifiquement dans le cadre d’un projet de recherche majoritairement financé par de l’argent public. Alors c’est l’employeur des chercheurs qui sera vraisemblablement titulaire des droits de producteur de base de données, car c’est lui qui assure les investissements nécessaires à la production de la base.

Or si c’est l’université qui est titulaire ab initio des droits sur une base de données scientifiques, cela aura d’importantes  conséquences du point de vue de la loi numérique. Pour le comprendre, il faut vous reporter au billet précédent que j’ai écrit sur l’Open Data et les universités, car vous allez voir que cette question rejoint en définitive celle des données de la recherche.

Le droit des bases de données des universités est neutralisé par défaut

En effet, l’article 11 de la loi numérique contient une disposition qui neutralise le droit des bases de données dont pourrait bénéficier les administrations soumises au principe d’Open Data par défaut (ce qui est le cas des universités) :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Donc on peut en déduire que si une université est titulaire d’un droit de producteur de base de données scientifiques, alors elle ne peut opposer ce droit à la réutilisation des informations qu’elle contient. Cela revient dès lors à dire que la réutilisation de ces données de recherche, nonobstant le droit de producteur de base de données, est bien « libre ».

Et nous rebouclons ici avec l’article 30 et son droit de libre réutilisation des données de recherche. De tout ce qui précède, nous pouvons conclure que l’article 30 nous dit bien que le droit de libre réutilisation des données de recherche ne vaut pas lorsque celles-ci sont protégées par un « droit spécifique », mais comme je viens de le montrer, cela ne peut concerner le droit de producteur de base de données qui, de toutes façons, est neutralisé en vertu de l’article 11 et ne peut être opposé à la libre réutilisation.

La conclusion est donc la suivante : des données de la recherche publiées par un chercheur ou un établissement seront donc bien librement réutilisables, sous réserve de respecter la législation sur les données personnelles ou le droit à l’image, ainsi que le droit d’auteur des tiers.

Reste alors une ultime question à considérer, car en définitive le seul moyen pour des chercheurs ou une institution d’empêcher la libre réutilisation de leurs données pourrait consister tout simplement à ne pas les publier. Mais vous allez voir qu’en réalité, ce choix-là n’existe pas non plus en vertu des dispositions combinées de la loi.

L’Open Data par défaut est applicable aux données de la recherche

Pour le comprendre, il faut revenir au principe d’Open Data par défaut que j’ai décrit dans le billet précédent. La loi numérique soumet dorénavant les administrations à l’obligation de publier de manière proactive et de rendre librement réutilisables un ensemble conséquent de documents et de données. C’est l’article 6 de la loi qui liste les informations concernées :

Sous réserve des articles L. 311-5 et L. 311-6 et lorsque ces documents sont disponibles sous forme électronique, les administrations mentionnées au premier alinéa de l’article L. 300-2, à l’exception des personnes morales dont le nombre d’agents ou de salariés est inférieur à un seuil fixé par décret, publient en ligne les documents administratifs suivants :
« 1° Les documents qu’elles communiquent en application des procédures prévues au présent titre, ainsi que leurs versions mises à jour ;
« 2° Les documents qui figurent dans le répertoire mentionné au premier alinéa de l’article L. 322-6 ;
« 3° Les bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent et qui ne font pas l’objet d’une diffusion publique par ailleurs ;
« 4° Les données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental.

Comme vous le voyez, la loi impose la publication en ligne des « bases de données ». Cela signifie que si l’université est titulaire du droit de producteur de bases de données scientifiques développées en son sein (et nous avons vu dans la partie précédente que ce sera généralement le cas), alors elle devra les mettre en ligne en Open Data (à la seule réserve de la protection des données personnelles).

L’article précise aussi que les données présentant un intérêt « économique, sociétal, sanitaire ou environnemental » entrent dans le principe d’Open Data par défaut. Cela laisse une large marge d’interprétation  pour déterminer ce qui rentre dans ce périmètre. Mais une recherche serait bien insignifiante si les données qu’elle produit ne comportant pas a minima un intérêt « sociétal » et dans certains secteurs, ces informations revêtiront aussi un intérêt économique, environnemental ou sanitaire.

La conclusion de tout ceci – et je pense que les autorités de la recherche sont très loin de l’avoir suffisamment perçu -, c’est que la loi numérique va avoir des effets de levier très puissants sur la diffusion des données de la recherche en France. Là où les chercheurs ont gardé la faculté de décider s’ils publient ou non leur écrits en Open Access, ils l’ont manifestement perdue pour les données la recherche. Les universités dont ils dépendent ont à présent l’obligation de publier en ligne les données de la recherche produites en leur sein, et une fois publiées, ces données deviennent ipso facto librement réutilisables (sous la réserve – importante – de la protection des données personnelles et du respect des autres droits éventuels des tiers).

Dans l’hypothèse où les universités (ou les chercheurs) opposeraient une certaine inertie et ne respecteraient pas ces obligations de publication en Open Data, la loi n’a pas directement prévu de sanctions, mais il existera un mécanisme correctif assez facilement actionnable.

Le texte a en effet instauré un dispositif d’Open Data « à la demande » connecté au droit à la communication des documents administratifs. Si un individu, une association (ou même une entreprise) savent qu’un jeu de données de recherche existe, mais n’a pas encore fait l’objet d’une publication en Open Data, ils peuvent faire une demande de communication sur la base de la loi CADA. Si cette demande est fondée, l’université devra communiquer le document, mais aussi (s’il existe sous forme numérique), le mettre en ligne  et rendre librement réutilisables les informations qu’il contient dans un format ouvert lisible par les machines.

Au cas où les établissements de recherche n’agiraient pas d’eux-mêmes pour se conformer aux obligations de la loi, il existera donc un moyen de faire bouger les lignes par le biais de demandes de communication.

Conclusion : Données de la recherche et Communs de la connaissance

Pour conclure, je voudrais revenir sur la généalogie de la phrase « leur réutilisation est libre » figurant à l’article 30 de la loi numérique, qui joue un rôle central dans ce nouveau statut des données de la recherche créé par le texte.

A l’origine, le gouvernement avait l’ambition  d’introduire en droit français la notion de « domaine commun informationnel », en rattachant un certain  nombre d’informations et de données à la notion de « choses communes » issue de l’article 714 du Code civil :

Il est des choses qui n’appartiennent à personne et dont l’usage est commun à tous.

Il se trouve que les aléas politiques – et une bonne dose de lâcheté gouvernementale – ont entraîné l’abandon de l’article 8 de la loi qui manifestait cette ambition. Mais après la phase de consultation en ligne, le texte a été réécrit et ce sont les données de la recherche que le gouvernement a voulu qualifier de « choses communes » :

Les données de la recherche rendues publiques légalement issues d’une activité de recherche financée au moins pour moitié par des fonds publics et qui ne sont pas protégées par un droit spécifique sont des choses communes, au sens de l’article 714 du code civil.

Le Conseil d’Etat s’est alors prononcé sur cette version et il a émis un avis défavorable à propos de cette rédaction (au motif qu’aucune étude d’impact n’avait été réalisée sur ce point précis…).

L’argument était bien faible, mais il a suffi à ce que le texte du projet de la loi soit encore été remanié, avant l’introduction au Parlement, et c’est là qu’est apparue la rédaction qui y figure encore : « leur réutilisation est libre« .

Le rattachement explicite des données de la recherche aux choses communes a donc été gommé au fil des versions successives, mais si l’on y réfléchit bien, le résultat final est exactement le même du point de vue des conséquences juridiques que cela emporte.

Car en effet, on peut tout à fait dire à présent que les données de la recherche « n’appartiennent à personne » : elles n’appartiennent pas aux chercheurs, car ce sont les universités qui détiennent généralement le droit de producteur de base de données sur elles. Mais celui-ci est neutralisé par l’article 11 de la loi, qui impose par ailleurs la mise en ligne proactive. Donc concrètement, les données ne sont soumises à aucun droit de propriété efficace.

Et j’ai montré que l’article 30 avait pour conséquence qu’une fois les données de la recherche publiées, leur usage devient pleinement libre et donc « commun à tous » (sous réserve de la préoccupation légitime de protéger les données personnelles et les droits des tiers).

Par ailleurs, ces données sont non seulement rendues librement réutilisables par l’effet de la loi, mais aussi protégées contre les phénomènes d’enclosure, comme je l’ai montré dans la première partie du billet à propos des mécanismes de défense vis-à-vis de la captation par les éditeurs. La liberté d’usage donnée par la loi ne peut être reprise par quiconque.

Donc la conclusion à laquelle nous devons aboutir, c’est que la loi numérique a bien créé un statut juridique remarquable pour les données de la recherche : elle en a fait des Communs de la connaissance.

 

Les universités françaises et l’Open Data après la loi numérique

Ce billet est le second d’une série de trois que je vais publier sur ce blog cette semaine pour examiner les répercussions de la loi « République numérique » sur le secteur de l’enseignement supérieur et de la recherche. Après un premier billet publié lundi à propos de l’impact de la loi en matière d’Open Access, je vais à présent me pencher sur le volet « Open Data » et la façon dont il va affecter les universités. Ce n’est pas l’aspect qui a été le plus commenté jusqu’à présent, mais vous allez voir que les changements à attendre pour ces établissements sont substantiels par rapport à la situation antérieure.

opendata
Image par Auregann. CC-BY-SA. Source : Wikimedia Commons.

Pour saisir complètement la portée de cette réforme, il faut prendre en considération, outre la loi « République numérique », la loi du 28 décembre 2015 relative à la gratuité et aux modalités de la réutilisation des informations du secteur public (dite aussi « loi Valter »), ainsi que son décret d’application paru en juillet dernier.

Je colle ci-dessous une présentation qui résume les grandes lignes de la question que je vais développer dans le billet par la suite.

Fin du régime dérogatoire des établissements d’enseignement supérieur et de recherche

Pour comprendre ce qui va changer pour les universités en matière d’ouverture des informations publiques qu’elles produisent, il faut remonter un peu en arrière et rappeler le cadre juridique qui leur était applicable avant l’entrée en vigueur de la loi numérique.

En 2005, la loi CADA (relative à l’accès aux documents administratifs) a été modifiée de manière à consacrer un principe de libre réutilisation des informations publiques des administrations. Néanmoins, la portée de cette règle était assez limitée, car si les administrations ne pouvaient en théorie refuser de faire droit à une demande de réutilisation de leurs données, elles n’étaient pas obligées de les mettre en ligne de manière pro-active et elles avaient aussi la possibilité de rendre la réutilisation payante par le biais de redevances.

A partir de 2011, un mouvement en faveur de l’Open Data a commencé à se dessiner en France, au niveau des administrations centrales, qui ont été obligées par le biais de décrets de mettre en ligne sur la plateforme data.gouv.fr un nombre croissant de jeux de données en les plaçant sous la Licence Ouverte / Open Licence (laquelle autorise la libre réutilisation y compris à des fins commerciales, à la condition de citer la source des données). Les ministères ont été les premières entités concernées par cette nouvelle politique et celui de l’Enseignement Supérieur et de la Recherche a publié à ce jour 55 jeux de données en Open Data.

Cependant les universités et les établissements de recherche sont restés de leur côté en dehors de ce mouvement d’Open Data, dans la mesure où ces administrations bénéficiaient d’un régime dérogatoire dans la loi CADA. Le texte comportait en effet un article 11 contenant les dispositions suivantes :

Par dérogation au présent chapitre, les conditions dans lesquelles les informations peuvent être utilisées sont fixées, le cas échéant, par les administrations […] lorsqu’elles figurent dans des documents produits ou reçus par :

a) des établissements et institutions d’enseignement et de recherche ;

b) des établissements, organismes ou services culturels.

Cet article signifiait que les établissements bénéficiaires (universités et institutions de recherche, mais aussi côté culture, bibliothèques, archives et musées) restaient libre de déterminer les conditions de réutilisation des informations qu’ils produisaient, et donc (pour simplifier) de ne pas autoriser les réutilisations. Cette forme de « privilège » a fait que ces administrations n’ont pas été concernées par les décrets de 2011 ayant initié la politique d’Open Data en France. Pour être exact, il ne leur était pas interdit d’ouvrir leurs données dans le cadre d’une politique d’Open Data, mais elles n’y étaient pas obligées et elles gardaient entièrement la faculté de déterminer quels jeux elles souhaitaient rendre librement réutilisables.

C’est précisément sur ce point que la loi « République numérique » va avoir un fort impact sur les universités, dans la mesure où le régime dérogatoire dont bénéficiaient les établissements d’enseignement supérieur et de recherche est supprimé. Ces derniers seront à présent intégrés au principe « d’Open Data par défaut » instauré par ce texte et qui en constitue une des principales innovations.

Les universités dorénavant incluses dans le principe « d’Open Data par défaut »

Pour comprendre en quoi consiste ce principe d’Open Data par défaut, il faut se reporter à l’article 6 de la loi « République numérique » :

Sous réserve des articles L. 311-5 et L. 311-6 et lorsque ces documents sont disponibles sous forme électronique, les administrations mentionnées au premier alinéa de l’article L. 300-2, à l’exception des personnes morales dont le nombre d’agents ou de salariés est inférieur à un seuil fixé par décret, publient en ligne les documents administratifs suivants :
« 1° Les documents qu’elles communiquent en application des procédures prévues au présent titre, ainsi que leurs versions mises à jour ;
« 2° Les documents qui figurent dans le répertoire mentionné au premier alinéa de l’article L. 322-6 ;
« 3° Les bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent et qui ne font pas l’objet d’une diffusion publique par ailleurs ;
« 4° Les données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental.

Contrairement à la situation antérieure, les administrations (sauf quelques exceptions maintenues notamment par la loi Valter) sont désormais obligées de publier en ligne et de rendre réutilisables un large ensemble de jeux de données, dont l’article 6 définit plusieurs catégories. Et la nouveauté, c’est que les universités ne bénéficient plus à présent d’un régime dérogatoire qui leur permettraient de se soustraire à cette obligation d’ouverture des informations publiques. Celui a été en effet explicitement supprimé par la loi Valter en octobre 2015.

Parmi la liste figurant à l’article 6, on trouve notamment les « bases de données, mises à jour de façon régulière, qu’elles produisent ou qu’elles reçoivent […] ». Cela concerne notamment les bases de données composant le système d’information de l’administration centrale des universités, qui leur servent à gérer des aspects comme le budget, le personnel, leurs bâtiments et les flux associés, les formations dispensées ou les activités de recherche des laboratoires rattachés à l’établissement.

Le texte impose aussi (alinéa 2) la mise en ligne des documents listés dans un Répertoire des Informations Publiques (RIP), qu’en vertu de l’ancien article 17 de la loi CADA, toutes les administrations sont tenues de mettre en place. Le RIP consiste en un registre mis à disposition des usagers dans lequel figure la liste des « principaux documents » comportant les informations produites par l’établissement. A ma connaissance, aucune université française n’a encore rempli cette obligation légale de mise en place d’un RIP (ce qui pourrait leur être reproché), mais avec la loi numérique, elles seront aussi tenues de rendre réutilisables les documents qu’elles y feront figurer.

La loi numérique est plus floue lorsqu’elle évoque l’obligation de mise en ligne des « données, mises à jour de façon régulière, dont la publication présente un intérêt économique, social, sanitaire ou environnemental« . Les universités garderont ici une marge de manoeuvre pour déterminer quelles informations parmi celles qu’elles produisent présentent un tel intérêt. Mais elles ne pourront cependant pas faire l’économie d’une démarche d’inventaire des jeux qu’elles détiennent et d’une sélection en vue d’une diffusion ouverte. L’idéal serait d’ailleurs que les universités se concertent entre elles pour libérer des jeux similaires.

A noter d’ailleurs qu’un mécanisme « d’Open Data à la demande » a été instauré par la loi république numérique, qui permettra assez facilement de forcer la mise en ligne de jeux de données au cas où une université ne procéderait pas d’elle-même à sa diffusion. L’alinéa 1 de l’article 6 indique en effet que les administrations doivent mettre en ligne « les documents qu’elles communiquent en application des procédures prévues au présent titre« . Cela signifie que les administrations seront obligées de mettre en ligne les documents qui leurs sont demandés par les usagers dans le cadre d’une procédure CADA d’accès aux documents administratifs. Si un document entre dans le périmètre (somme toute assez large) de cette loi, alors l’université ne pourra s’opposer à la communication (sous peine d’un recours à la CADA) et lorsque le document est communiqué, l’administration devra ensuite le mettre en ligne et rendre réutilisable les informations qu’il contient. Tout ceci fait que si une université fait preuve d’inertie dans la mise à disposition de données couvertes par l’article 6, il suffira qu’un citoyen, une association ou même une entreprise en fassent la demande auprès d’elle pour qu’elle soit obligée de les mettre en ligne.

On le voit ce principe « d’Open Data par défaut » est relativement puissant, et s’il n’est pas sans limite, il va sans doute produire des changements considérables dans la manière dont les universités diffusent les documents et les données qu’elles produisent.

Quelles limites à la réutilisation des données des universités ?

Le principe d’Open Data par défaut de la loi « République numérique » a beau être large, il n’est cependant pas sans limite. La première concerne l’impératif de protection des données personnelles et de la vie privée, qui devra naturellement continuer à être respecté et sur lequelle l’article 6 de la loi met l’accent :

Sauf dispositions législatives contraires ou si les personnes intéressées ont donné leur accord, lorsque les documents et les données mentionnés aux articles L. 312-1 ou L. 312-1-1 comportent des données à caractère personnel, ils ne peuvent être rendus publics qu’après avoir fait l’objet d’un traitement permettant de rendre impossible l’identification de ces personnes. Une liste des catégories de documents pouvant être rendus publics sans avoir fait l’objet du traitement susmentionné est fixée par décret pris après avis motivé et publié de la Commission nationale de l’informatique et des libertés.

Ce passage signifie que si des informations correspondent à des données à caractère personnel, alors les administrations ne doivent pas les mettre en ligne et les rendre réutilisables, à moins de rendre impossible l’identification des personnes concernées ou après avoir obtenu leur consentement. On notera qu’il ne suffit pas simplement d’anonymiser les données, mais de « rendre impossible l’identification des personnes« , ce qui va plus loin (notamment pour empêcher les identifications par recoupements de données).

Cet aspect risque d’être très compliqué à gérer pour les administrations en général et pour les universités en particulier. Car les établissements vont se retrouver pris entre deux exigences contradictoires : d’une part une soumission au principe d’Open Data par défaut, qui implique la publication de nombreux documents et jeux de données ; d’autre part l’impératif de protection des données personnelles qui reste toujours aussi fort. Pour prendre un exemple concret, une université sera dorénavant obligée de mettre en ligne les informations relatives au personnel qu’elle emploie ou aux étudiants inscrits, mais à la condition d’anonymiser ces données et de rendre impossible l’identification par recoupement, ce qui peut s’avérer très complexe à réaliser. La CNIL a annoncé qu’elle préparait un « pack de conformité » à destination des acteurs publics pour la mise en oeuvre de la loi République numérique et on attend à présent avec impatience ce document qui permettra sans doute d’y voir plus clair sur la manière de jongler avec ces exigences contradictoires.

Une autre limitation au principe d’Open Data par défaut concerne la protection des droits de propriété intellectuelle détenus par des tiers à l’administration. L’article L. 321-2 du Code des relations entre le public et les administrations prévoit ainsi que :

Ne sont pas considérées comme des informations publiques […] les informations contenues dans des documents […] sur lesquels des tiers détiennent des droits de propriété intellectuelle.

Dans le contexte d’établissements comme des universités, de nombreux documents couverts par des droits de propriété intellectuelle sont produits, que l’on songe par exemple aux cours et aux publications des enseignants-chercheurs, aux diverses productions des étudiants (copies d’examen, travaux, mémoires, etc), aux ressources pédagogiques à distance, etc. Tous ces contenus sont naturellement exclus du périmètre des documents soumis à l’obligation de mise en ligne définie à l’article 6 de la loi. Pour ce qui concerne le cas spécifique des publications des chercheurs, il est traité à l’article 30 de la loi, à travers les dispositions de faveur de l’Open Access dont j’ai parlé dans un précédent billet, mais le principe demeure que les chercheurs restent pleinement titulaires du droit d’auteur sur leurs productions et sont à ce titre libres de décider s’ils souhaitent les publier en ligne ou non.

A propos de cette question de l’articulation entre l’Open Data et les droits de propriété intellectuelle, il faut noter que la loi « République numérique » a cependant apporté une clarification importante relative au droit des bases de données des administrations. Il était arrivé dans le passé que des administrations (notamment des services d’archives) opposent leur droit de producteur de base de données à une demande de réutilisation. Après quelques flottements, la jurisprudence administrative avait fini par leur donner raison, ce qui signifiait que ces établissements pouvaient neutraliser le principe de libre réutilisation des informations publiques en s’appuyant sur le droit des bases de données. Or la loi numérique contient un article 11 qui va complètement changer la donne en la matière :

Sous réserve de droits de propriété intellectuelle détenus par des tiers, les droits des administrations mentionnées au premier alinéa de l’article L. 300-2 du présent code, au titre des articles L. 342-1 et L. 342-2 du code de la propriété intellectuelle, ne peuvent faire obstacle à la réutilisation du contenu des bases de données que ces administrations publient en application du 3° de l’article L. 312-1-1 du présent code.

Cette phrase signifie que les administrations ne peuvent dorénavant plus opposer un droit de producteur de base de données à une demande de réutilisation des informations publiques qu’elles détiennent, et cela s’appliquera aux universités comme aux autres.

Quid de la faculté à fixer des redevances de réutilisation ?

Contrairement à la situation qui prévalait antérieurement dans laquelle les administrations pouvaient discrétionnairement mettre en place des redevances pour la réutilisation de leurs données, la loi Valter a consacré un principe général de gratuité. L’article 15 de la loi prévoit néanmoins une dérogation possible à titre exceptionnel pour les administrations dont le financement est substantiellement assuré par des ressources propres :

La réutilisation d’informations publiques est gratuite. Toutefois, les administrations mentionnées à l’article 1er peuvent établir une redevance de réutilisation lorsqu’elles sont tenues de couvrir par des recettes propres une part substantielle des coûts liés à l’accomplissement de leurs missions de service public.

Un doute pourrait poindre ici à propos des universités, car il s’agit typiquement d’établissements auxquels il est demandé de dégager des ressources propres pour assurer une part d’auto-financement. Néanmoins, le décret d’application de la loi Valter, paru en juillet dernier, a clairement défini un seuil minimal de 25% de ressources propres en dessous duquel les administrations ne sont plus autorisées à exiger des redevances de réutilisation :

Sont seuls autorisés à établir des redevances de réutilisation en application de l’article L. 324-1 les services de l’Etat et les autres personnes mentionnées à l’article L. 300-2 dont l’activité principale consiste en la collecte, la production, la mise à disposition ou la diffusion d’informations publiques, lorsque la couverture des coûts liés à cette activité principale est assurée à moins de 75 % par des recettes fiscales, des dotations ou des subventions.

Or si l’on en croit ces chiffres tirés de l’Observatoire KPMG 2015 des Universités et des Ecoles, les universités en France dégagent en moyenne 18% de ressources propres, ce qui les placent en dessous du seuil fixé par le décret de la loi Valter.

ressources

Ceci étant dit, on pourrait imaginer qu’une université arrive à dépasser ce seuil des 25% et l’étude KPMG précité indique que les Ecoles et Instituts de recherche atteignent en moyenne plutôt des taux d’autofinancement de 32%. Néanmoins, cela ne permettra toujours pas à ces établissements de recherche de lever des redevances de réutilisation sur la réutilisation de leurs données.

Car le décret de la loi Valter précise bien que seuls disposent de cette faculté les administrations dont « l’activité principale consiste en la collecte, la production, la mise à disposition ou la diffusion d’informations publiques » et il faut par ailleurs que les subventions qui leur sont versées servent directement à couvrir les coûts de cette activité principale liée aux données. Or ce n’est pas le cas des universités et établissements de recherche, dont les missions sont bien plus larges que la seule production d’informations publiques.

On en déduit donc que les universités sont strictement astreintes au respect du principe de gratuité et qu’elles ne pourront plus établir de redevances de réutilisation des données, sous peine de se mettre dans l’illégalité.

Conclusion : les universités françaises doivent à présent passer à l’Open Data

On le voit, la loi « République numérique » va avoir un impact important sur les universités en les soumettant, comme les autres administrations au principe d’Open Data par défaut qu’elle instaure. C’est la fin d’une situation dérogatoire qui s’appliquait aux universités et établissements de recherche dans la législation antérieure. Cela signifie qu’un grand nombre de documents et de jeux de données devront être mis en ligne dans les années à venir par les universités, ce qui implique des défis organisationnels non négligeables à surmonter. Il me semble d’ailleurs que les conséquences de ce texte n’ont pas été assez clairement perçus par ces acteurs, qui se sont beaucoup focalisés sur le volet Open Access de la loi sans voir que la partie Open Data les concernait également.

La loi fixe aux administrations plusieurs délais (de 6 mois à deux ans selon les catégories de données) pour se conformer à ces nouvelles obligations, échéances qui vont arriver très rapidement à présent. Il faut cependant noter qu’un décret est encore attendu qui va fixer un seuil d’agents au-delà duquel une administration sera soumise au principe d’Open Data par défaut. Mais les universités étant généralement des établissements employant un nombre conséquent d’employés, il serait surprenant qu’elles ne soient pas comprises dans les administrations concernées.

Dans ce billet, j’ai surtout insisté sur les données produites par les universités en tant qu’établissement administratif. Ce sont les informations produites par les services centraux et les services communs de ces établissements qui sont au premier chef concernées par le passage en Open Data (y compris d’ailleurs celles des Services Communs de la Documentation, c’est-à-dire les bibliothèques universitaires). Néanmoins, une autre question importante est de savoir si les données de la recherche, en tant que telles, sont comprises ou non dans ce principe d’Open Data par défaut. Au cas où la réponse serait positive, cela signifie qu’il y aurait également obligation de les mettre en ligne et de les rendre réutilisables, moyennant la protection des données personnelles.

C’est une interrogation à laquelle j’essaierai de répondre dans le troisième billet de cette série consacrée aux répercussions de la loi numérique sur le secteur de l’enseignement supérieur et de la recherche. J’y étudierai la manière dont le texte met en place un nouveau « statut » des données de la recherche.

En attendant, les commentaires sont ouverts si vous souhaitez poser des questions ou laisser des observations à propos de ce nouveau tournant de l’Open Data qui attend les universités.

Open Access : quelles incidences de la loi « République numérique » ?

La semaine dernière, on célébrait l’Open Access Week et j’ai eu l’occasion de donner plusieurs interventions à propos des incidences de la loi « République numérique » sur le Libre Accès aux publications scientifiques. On sait en effet que la Loi Lemaire, qui est entrée en vigueur le 8 octobre dernier, a consacré un nouveau « droit d’exploitation secondaire » au profit des chercheurs, afin de faciliter notamment le dépôt en archives ouvertes de leurs publications. Mais l’article (30) qui contient ces nouvelles dispositions n’est pas de lecture facile et il contient même plusieurs points assez délicats à interpréter. J’ai reçu ces dernières semaines de nombreuses questions de collègues qui cherchaient à avoir des précisions ou à lever des ambiguïtés, et j’ai profité des interventions à l’Open Access Week pour essayer d’apporter quelques clarifications.

open-access

De manière à ce que cela puisse profiter au plus grand nombre, je publie mon support d’intervention ci-dessous. Par ailleurs, je vais détailler certains des points abordés à travers une FAQ, de manière à mieux faire le tour de la question de manière aussi complète que possible. Si jamais vous avez besoin d’un éclaircissement complémentaire ou si une question ne vous paraît pas traitée, n’hésitez pas à le faire savoir dans les commentaires et j’en profiterai pour compléter ce billet.

Je vais suivre un canevas simple (Qui ? Quoi ? Quand ? Où ?) dans cette FAQ pour aborder les différentes dimensions du nouveau « droit d’exploitation secondaire » consacré par la loi République numérique : Qui peut déposer ? Quels types de publication sont couvertes par le texte ? Quand le dépôt est-il possible ? Où peut-on déposer ?

Lire la suite

La France a-t-elle la pire exception pédagogique d’Europe ?

J’ai déjà consacré plusieurs billets (ici ou ) à l’exception pédagogique et de recherche reconnue en France par le Code de Propriété Intellectuelle, pour en critiquer la complexité et les limites (notamment par rapport aux usages numériques).

class
                               Image par Alan Levine. CC-BY. Source : Flickr

Il se trouve que l’association Communia, qui agit au niveau européen pour la réforme du droit d’auteur, a publié le mois dernier une série de trois billets (1, 2, 3) particulièrement intéressants qui dressent un bilan de la situation en Europe. Le second notamment a été réalisé à partir de témoignages de correspondants issus de cinq pays de l’Union européen, pointant chacun une lacune de leur législation nationale qui empêche les enseignants et les élèves d’utiliser des oeuvres protégées dans un contexte pédagogique.

Aucun des exemples évoqués dans cet article ne concene la France. Du coup, il est intéressant de reprendre chacun des usages décrits et de se demander s’ils seraient licites ou non selon la loi française. C’est un bon test pour savoir si notre exception pédagogique est satisfaisante ou si elle devrait être révisée. Cette comparaison présente aussi l’intérêt de pointer du doigt le défaut d’harmonisation du droit d’auteur au niveau européen, car on constate que des usages sont autorisés dans certains pays, tandis qu’ils restent interdits dans d’autres. La Commission européenne a d’ailleurs annoncé à la fin de l’année dernière une révision du droit d’auteur et la question des usages pédagogiques et de recherche figure bien parmi les pistes de travail auxquelles elle veut accorder la priorité.

Je vous propose donc ci-dessous une traduction en français des exemples problématiques figurant dans le billet de Communia, suivie d’une comparaison avec l’état du droit en France.
Lire la suite

Le PEB des thèses électroniques : un exemple de régression numérique (et comment en sortir)

La numérisation des contenus devrait normalement faciliter les usages, en favorisant une meilleure circulation de la culture et du savoir. Or force est de constater que c’est loin d’être toujours le cas. On nous a vendu par exemple l’idée que les eBooks seraient des « livres augmentés », alors que comme j’ai déjà eu l’occasion de l’écrire, ils constituent trop souvent au contraire des « livres diminués » par rapport à leurs équivalents papier.

Il existe un autre objet pour lequel le passage en version numérique paraît constituer une régression plutôt qu’un progrès : ce sont les thèses de doctorat. En fin d’année dernière, un billet publié par Olivier Legendre sur le blog de la bibliothèque numérique de Clermont-Ferrand avait bien montré l’absurdité de la situation. Les doctorants sont traditionnellement tenus de déposer des exemplaires de leur thèse auprès de la bibliothèque de leur université afin qu’elle en assure la conservation, le signalement et la diffusion. Pendant des décennies, lorsqu’un usager d’une bibliothèque voulait accéder à une thèse conservée dans un autre établissement, il avait la possibilité de se la faire envoyer par le biais du service du PEB (Prêt entre Bibliothèques).

Lire la suite

Le statut juridique des données de la recherche : entre droit des bases de données et données publiques

Le mois dernier, j’ai été invité à intervenir à la Maison Européenne des Sciences de l’Homme et de la Société (MESHS) de Lille, dans le cadre d’un cycle d’un cycle de conférences sur le « Droit d’auteur dans l’environnement numérique ». J’étais chargé de traiter de le thème du droit des bases de données, mais j’ai élargi un peu le propos pour examiner la question du statut juridique des données de la recherche, de manière générale (voir la présentation ci-dessous).

Lire la suite

Text et Data Mining : l’absence d’exception pénalise bien la recherche

Un article scientifique a été publié le 7 juin dernier qui démontre pour la première fois que les pratiques de Text et Data Mining (exploration de données) sont moins développées dans les pays où le niveau de protection par le droit d’auteur est le plus élevé et ne prévoit pas de mécanisme spécifique pour les sécuriser. Ecrit par Christian Handke, Lucie Guibault et Joan-Jospeh Vallbé, cet article s’intitule : « Is Europe Falling Behind Text et Data Mining : Copyright’s Impact On Data Mining In Academic Research » et il est disponible en Open Access ici. Il a également fait l’objet d’une communication à laquelle j’ai pu assister lors du dernier congrès de la Ligue des bibliothèques européennes de recherche (LIBER) qui s’est tenu la semaine dernière à Londres.

L’intérêt de ce travail de recherche réside d’abord dans sa méthodologie. Par une jolie mise en abyme, les trois chercheurs ont choisi de recourir au Text Mining pour vérifier si les rigidités du droit d’auteur avait ou non impact sur l’utilisation du TDM dans les activités de recherche. Ils ont eu pour cela l’idée de conduire une opération de fouille de texte au sein de l’outil Web of Science proposé par Thomson Reuters, qui recense des milliers de journaux académiques. Ils ont ainsi pu constater que sur une période s’étendant de 1992 à 2014 le nombre des articles utilisant le mot clé « Data mining » dans leur description s’accroît constamment pour atteindre un total de 18 441 travaux publiés par des chercheurs dans le monde.

tdm
Evolution du nombre d’articles scientifiques recourant au TDM en fonction du temps (le « creux » constaté en 2007 s’explique par une modification de l’abonnement à Web of Science contracté par l’université où la recherche a été conduite).

Lire la suite

Nouvel accord sur l’exception pédagogique : quelques avancées, mais un dispositif toujours inadapté

Le1er janvier dernier est paru un nouveau protocole d’accord sur l’utilisation des livres, des œuvres musicales éditées, des publications périodiques et des œuvres des arts visuels à des fins d’illustration des activités d’enseignement et de recherche. Conclu entre le Ministère de l’Éducation nationale, de l’Enseignement supérieur et de la Recherche, la Conférence des Présidents d’Universités et les représentants des titulaires de droits intéressés, cet accord est important dans la mesure où c’est lui qui va à présent conditionner l’application de l’exception pédagogique introduite dans le droit français en 2006 par la loi DADVSI.

Image par Geralt. Public Domain.
Image par Geralt. Public Domain.

Le dispositif français a jusqu’à présent fait l’objet de vives critiques, en raison de sa rigidité et de sa trop grande complexité. Plusieurs missions d’experts, comme le rapport Fourgous en 2012 ou plus récemment la mission Lescure, avaient d’ailleurs appelé à une réforme du système, notamment pour mieux épouser les usages numériques. En 2013, la loi Peillon est venue retoucher le texte de l’exception dans la loi, mais de manière limitée seulement, sans aller jusqu’à opérer une véritable refonte du dispositif.

Le nouveau protocole contient quelques avancées, notamment une simplification des notions employées et un élargissement des usages autorisés qui sont les bienvenus. Mais l’exception française reste fortement handicapée par la manière dont elle a été conçue à l’origine. Il en résulte des lourdeurs procédurales qui la rendront encore difficilement applicables par les communautés d’enseignants, de chercheurs et d’apprenants. Par ailleurs depuis 2006, la pédagogie sous forme numérique a beaucoup évolué, avec par exemple le développement des MOOC, et dans un tel contexte, l’exception française reste encore trop limitée. Au final, la France demeure en retrait par rapport à d’autres pays, notamment anglo-saxons comme les États-Unis, le Canada ou le Royaume-Uni où des réformes récentes ont créé un contexte plus favorable aux usages pédagogiques et de recherche.
Lire la suite

Exploration de données : un environnement juridique en évolution

Mardi dernier, l’ADBU et AEF organisaient une journée d’étude sur le thème « Quelle(s) stratégie(s) de recherche face à la nouvelle massification des données ?« . Dans ce contexte, on m’avait demandé de faire un point concernant l’évolution du cadre juridique des pratiques d’exploration de données (Text et Data Mining). Je poste ci-dessous ma présentation, qui étant donné le temps qui m’était imparti n’avait pas vocation à traiter le sujet en profondeur, mais à rappeler les points essentiels.

Lire la suite

Le Royaume Uni sanctuarise les pratiques de data mining par une exception au droit d’auteur

Le gouvernement britannique est actuellement en train de mettre en oeuvre une réforme du droit d’auteur, en agissant sur les exceptions permettant de réaliser certains usages d’œuvres protégées en conformité avec la loi. Le Royaume Uni, par certains côtés, rattrape un retard qu’il pouvait accuser par rapport à certains autres pays d’Europe. La loi anglaise ne comportait pas par exemple d’exceptions en faveur des citations, des copies privées ou des parodies, alors que ce sont des mécanismes que l’on retrouve dans la plupart des pays de l’Union. Sur ces points, le gouvernement anglais va donc aller dans le sens d’une harmonisation avec le reste des pays européens. Mais cette réforme comporte aussi des éléments réellement innovants, comme l’introduction d’une exception en faveur du text et data mining.

data
Dans la nuit des images. Par Dalbera. CC-BY. Source : Flickr.

Lire la suite

Digital Humanities, Propriété intellectuelle et Biens communs de la connaissance

Le 28 mai dernier, j’avais été invité à intervenir lors d’une journée d’étude organisée par les doctorants de l’Université Toulouse II Le Mirail, sur le thème « Les Digital Humanities : Un renouvellement des questionnements et des pratiques scientifiques en SHS-ALL ? ».

On m’avait demandé de traiter des aspects juridiques des Digital Humpanities et voici l’angle d’attaque que j’avais choisi d’aborder :

Le Manifeste des Digital Humanities affirme un engagement en faveur de « l’accès libre aux données et aux métadonnées », ainsi qu’une volonté d’œuvrer pour « la diffusion, à la circulation et au libre enrichissement des méthodes, du code, des formats et des résultats de la recherche ». Pour autant, la production du savoir par les communautés scientifiques en SHS-ALL s’inscrit dans un arrière-plan juridique qui saisit les connaissances à travers le prisme de la propriété intellectuelle. Cours, articles, ouvrages, images relèvent du droit d’auteur ; données de recherche et métadonnées relèvent du droit des bases de données et du régime des informations publiques. L’activité de recherche elle-même s’inscrit dans le cadre juridiquement contraint d’exceptions au droit d’auteur, conçues de manière restrictives en France. Des mouvements comme ceux de l’Open Access ou l’Open Data permettraient de mettre en œuvre les idéaux de partage et de diffusion des savoirs qui sont au cœur des Digital Humanities. Mais l’Open Access a toujours eu plus de difficultés à se développer dans le domaine des SHS que dans celui des sciences dures. L’Open Data en matière de données scientifiques tarde par ailleurs à produire des résultats concrets. Et les tensions autour de la question du plagiat et du « pillage » des résultats de recherche révèlent des rapports complexes et parfois ambigus entre les chercheurs et la propriété intellectuelle.

Face à ces obstacles, ne peut-on pas rapprocher les idéaux des Digital Humanities avec la problématique plus large des Biens Communs de la Connaissance ? Une telle convergence peut-elle permettre de dépasser ce que James Boyle a appelé le « Second Mouvement des Enclosures » qui a profondément modifié le statut de la connaissance ? Au-delà des réformes juridiques et institutionnelles, un tel effort passe sans doute avant tout par une nouvelle éthique de la recherche.

Voici-ci dessous le support que j’avais utilisé :

Et la capture vidéo de l’intervention :

Les vidéos de la journée sont disponibles à partir à cette adresse, et un blog a été ouvert par les organisateurs du colloque pour prolonger la réflexion sur les Humanités numériques.

Je vous recommande notamment cette intervention de Philippe Aigrain « Comment articuler l’économie et les communs numériques dans les humanités ».

Merci à Marc Lavastrou en particulier pour l’invitation !

Vers une réforme minimaliste de l’exception pédagogique dans la loi Peillon ?

C’était aujourd’hui que Vincent Peillon et Fleur Pellerin présentaient à la presse le plan du gouvernement pour le numérique à l’école et le Ministre de l’Éducation nationale a évoqué ce matin sur France Inter sa stratégie globale sur la question.

Le Ministre a orienté son discours sur le développement des usages numériques à l’école, mais on peut s’étonner qu’il ne soit aucunement fait mention d’une révision de l’exception pédagogique et de recherche, alors même que l’on sait que des discussions sont en cours sur le sujet. Cela avait été confirmé notamment lors du Forum SGDL qui s’est tenu le 25 octobre dernier, au cours duquel Aurélie Filippetti avait indiqué que le Ministère de la Culture était lui aussi associé à ces réflexions.

Bonnet d’âne. Par Tintin44 – Sylvain Masson. CC-BY-NC-ND. Source : Flickr.

Lire la suite

Déverrouiller l’exception pédagogique et de recherche ? C’est possible !

J’ai déjà eu l’occasion d’écrire en avril dernier un billet pour attirer l’attention sur les difficultés posées par le système de l’exception pédagogique et de recherche en France.

D’autres que moi sont également intervenus récemment pour critiquer la manière problématique dont le respect du droit d’auteur est articulé dans notre pays avec les missions d’enseignement : Rémi Mathis, Michèle Battisti ou Alexandre Moatti.

En fin de semaine dernière, c’est Cédric Manara, un autre juriste spécialisé dans les questions de propriété intellectuelle, qui a formulé des critiques semblables envers le fonctionnement de cette exception, par le biais de ce diaporama, présenté lors des Journées du e-Learning de Lyon.

La démonstration est parfaitement claire et elle fait ressortir toute l’absurdité du régime actuel (Cliquez sur l’image ci-dessous pour voir la présentation et vous pouvez également la consulter ici en vidéo).

 

Cliquez sur l’image pour voir la présentation de Cédric Manara : « Exception pédagogique contre e-Learning » (Blackboard Cupcakes. Par Sh4rp_1. CC-BY. Source : Flickr).

Ce constat d’un déséquilibre choquant paraît nettement établi à présent et on se demande combien de temps il faudra encore pour que la réforme de ce système soit enfin mise à l’ordre du jour…

Lire la suite

La licence Etalab, un atout pour la diffusion des données culturelles et de recherche

Les données culturelles ou celles qui concernent la recherche occupent une place particulière parmi les données publiques. Elles restent de fait encore en retrait au sein du mouvement d’Open Data qui se développe en France.

Dandelion illustration. Par Thomas Rockstar. CC-BY-NC-SA. Source : Flickr

Pas tout à fait des données comme les autres…

En effet, un statut juridique particulier a été fixée par la loi sur la réutilisation des informations publiques, pour les données produites par « des établissements et institutions d’enseignement ou de recherche » ou par des « établissements, organismes ou services culturels« . Ce régime particulier, dit « exception culturelle », permet à ces établissements de fixer les conditions de la réutilisation de leurs données, tandis que les autres administrations relèvent du régime général de cette loi, qui instaure un droit à la réutilisation des informations publiques au profit des citoyens.

Jusqu’à présent, les institutions culturelles et de recherche se sont plutôt servies de cette exception pour restreindre la réutilisation de leurs données, ce qui a pu faire dire que la culture constituait le « parent pauvre de l’Open Data en France« . Des tensions sont même apparues entre certains services culturels, comme des archives,  et des entreprises à qui  la réutilisation des données a été refusée. Les institutions culturelles (bibliothèques, musées, archives) et les institutions de recherche sont pourtant détentrices de données de grande qualité, dont l’apport pourrait être décisif pour le mouvement de l’Open Data

Lire la suite