L’exception TDM dans la loi numérique : mérites, limites et perspectives

Je poste dans ce billet le support d’une intervention que j’ai été invité à donner lors du colloque « La loi numérique, et après ? » à l’occasion d’un atelier consacré à la question des pratiques de Text et Data Mining.

Je ne vais pas avoir le temps de développer les réflexions figurant dans cette présentation, mais j’en donne ci-dessous les lignes principales. La loi République numérique a consacré une nouvelle exception au droit d’auteur et au droit de producteur de bases de données visant à permettre la « fouille » ou « l’exploration » de « textes ou de données incluses ou associées à des écrits scientifiques ».

Le texte de l’exception est issu d’un compromis qui fut très délicat à trouver au Parlement et il en porte les stigmates. Affecté de plusieurs lacunes et incohérences, il soulève des questions d’interprétation épineuses et il manque encore un (ou deux décrets) pour que l’exception soit réellement applicable. On a pu apprendre lors du colloque que ces décrets étaient actuellement en cours de rédaction au niveau du Ministère de l’Enseignement Supérieur et du Ministère de la Culture.

Lorsqu’on la compare à la situation en Angleterre et aux Etats-Unis, l’exception française paraît au premier abord limitée dans sa portée. Elle permet de faire des reproductions d’oeuvres en vue d’opérations de TDM, mais seulement pour des textes, laissant de côté les images et les oeuvres musicales ou audiovisuelles. Par ailleurs, en ce qui concerne les données, l’exception n’est mobilisable que si les informations sont incluses ou associées à des écrits scientifiques. Cela rendra inopérante l’exception TDM pour traiter des données qui ne seraient pas associées à des publications scientifiques (pensons à des bases de statistiques ou à des données circulant en ligne sur le web). 

Par ailleurs (contrairement aux Etats-Unis ou au Japon), l’exception ne peut pas être utilisée à des fins commerciales, ce qui va exclure son application pour des projets co-financés par des entreprises ou s’effectuant dans le cadre de partenariats publics-privés. Il est même plus que probable que les opérations de TDM ne pourront pas être confiées par des équipes de recherche à des sous-traitants privés contre rémunération. 

Ce que j’ai essayé de montrer dans cette intervention, c’est que les décrets vont avoir une importance décisive pour déterminer si l’exception sera réellement applicable ou non. Il reste en effet un grand flou pour savoir dans quelle mesure elle sera opposable à des restrictions contractuelles ou techniques que des fournisseurs de bases de données continueraient à imposer à des extractions en vue de faire du TDM.

Il manque dans le texte un élément crucial : la précision que cette mesure présente un caractère d’ordre public, à l’image de ce que l’on trouve par contre à l’article 30 de la loi (celui sur le Libre Accès aux publications scientifiques). Ce type de mécanismes garantit que des clauses contractuelles qui seraient contraires à l’exception seront nulles d’effets et il paraît déterminant que le décret mentionne explicitement que c’est le cas, faute de quoi les titulaires de droits risquent de retrouver un pouvoir de contrôle non négligeable sur les pratiques.

Par ailleurs, il y a également des questions d’articulation avec les Mesures Techniques de Protection (MTP) que les fournisseurs de base de données ou les éditeurs pourraient continuer à maintenir pour limiter, ou même supprimer, les possibilités de faire du TDM sur leurs contenus. La jurisprudence française n’est pas favorable aux exceptions dans la balance avec les Mesures Techniques de Protection (voir la fameuse décision Mullholland Drive de la Cour de Cassation, qui a permis à un titulaire de droits de supprimer la possibilité de faire une copie privée en implantant un DRM sur un DVD). L’exception TDM ne figure  par ailleurs même pas dans la liste de celles pour lesquelles la Hadopi peut être saisie pour effectuer une régulation, ce qui privera les communautés scientifiques d’un recours en cas de verrouillage excessif. Le décret devrait donc aussi se pencher sur cette question des limitations techniques, sans quoi des problèmes importants se poseront immanquablement à l’avenir en pratique. 

Enfin, un autre enjeu des décrets d’application sera de déterminer comment les fichiers produits pour effectuer les opérations de TDM pourront être conservés et communiqués. L’exception ne parlant que de reproduction et pas de « représentation », on est hélas certain sur les chercheurs ne pourront pas afficher des extraits des textes reproduits lors de la publication des résultats de recherche (sauf peut-être dans la limite – étroite – de l’exception de courte citation). 

Le texte de loi prévoit par ailleurs que des organismes de conservation seront désignés pour recevoir les « archives du TDM », c’est-à-dire les fichiers produits par reproduction d’oeuvres ou de bases, qui auront servi à effectuer les opérations de fouille. Il a été dit lors du colloque qu’une institution comme la BnF s’est déjà positionnée pour jouer ce rôle de « tiers de confiance », mais d’autres établissements pourraient aussi intervenir (l’INIST par exemple ? Ou le CINES ?). 

Or là aussi, il faudra rester très vigilant, car ce dispositif ressemble beaucoup à celui qui a été mis en place pour la consultation des archives du web à la BnF. On sait que pendant longtemps, ces archives,  pourtant très précieuses pour la recherche,  sont restées accessibles uniquement sur place dans les emprises de la BnF. Ce n’est que récemment que plusieurs bibliothèques supplémentaires en région ont été désignées pour servir également de points de consultation. Si la communication des archives des projets de TDM devait aussi uniquement se faire sur place dans un ou deux établissements en France, autant dire que le bénéfice de l’exception serait relativement limité. Il faut que le décret prévoit des marges de manœuvre pour que les tiers de confiance puissent recommuniquer ou offrir des accès à distance à ces fichiers, pour favoriser de nouvelles recherches. 

Même si l’exception a une portée limitée, elle peut quand même avoir une utilité non négligeable. Par exemple, elle va sécuriser la possibilité de faire du TDM à partir de contenus textuels librement accessibles en ligne, notamment des sites comme des archives ouvertes institutionnelles, HAL, Persée, Revues.org ou Hypothèses (ce qui était impossible avant, sauf pour les contenus places volontairement par les auteurs sous Creative Commons). Reste à favoriser au maximum le TDM à partir de ces sources, ce qui passe par la mise en place de moyens techniques (API, formats ouverts, etc) et devrait faire l’objet d’une politique concertée. 

Je précise pour terminer qu’un autre enjeu important se profile pour l’exception TDM à moyen terme : celui de l’adoption de la prochaine directive sur le droit d’auteur. Dans la proposition dévoilée par la Commission européenne en septembre dernier figure bien une exception en faveur du TDM, dont la transposition serait obligatoire pour tous les Etats-Membres. La formulation retenue présente le mérite par rapport à l’exception française de s’appliquer à tous les types d’oeuvres et de données. Elle couvre les activités de recherche scientifique, mais reste valable dans le cadre de partenariats impliquant des acteurs commerciaux. Par ailleurs, elle prévoit explicitement que les clauses contractuelles contraires seront inopérantes. En revanche, il persiste une marge de manoeuvre laissée aux titulaires de droits pour fixer des restrictions techniques aux opérations d’extraction, avec un appel aux Etats pour déterminer à leur niveau les bonnes pratiques en la matière.

Au final, il faut bien sûr se réjouir de l’adoption de cette exception dans la loi numérique, qui a été arrachée de haute lutte grâce à la mobilisation de la communauté des chercheurs et des professionnels de la documentation. Mais il serait naïf de croire que la partie est définitivement gagnée. Beaucoup de ce qui a été obtenu par la loi pourrait hélas être repris dans les décrets et cela reste au niveau européen que persiste l’enjeu décisif, car c’est la directive (dont l’adoption peut encore prendre deux ans) qui déterminera au final le cadre applicable.

Affaire à suivre…

Text et Data Mining : l’absence d’exception pénalise bien la recherche

Un article scientifique a été publié le 7 juin dernier qui démontre pour la première fois que les pratiques de Text et Data Mining (exploration de données) sont moins développées dans les pays où le niveau de protection par le droit d’auteur est le plus élevé et ne prévoit pas de mécanisme spécifique pour les sécuriser. Ecrit par Christian Handke, Lucie Guibault et Joan-Jospeh Vallbé, cet article s’intitule : « Is Europe Falling Behind Text et Data Mining : Copyright’s Impact On Data Mining In Academic Research » et il est disponible en Open Access ici. Il a également fait l’objet d’une communication à laquelle j’ai pu assister lors du dernier congrès de la Ligue des bibliothèques européennes de recherche (LIBER) qui s’est tenu la semaine dernière à Londres.

L’intérêt de ce travail de recherche réside d’abord dans sa méthodologie. Par une jolie mise en abyme, les trois chercheurs ont choisi de recourir au Text Mining pour vérifier si les rigidités du droit d’auteur avait ou non impact sur l’utilisation du TDM dans les activités de recherche. Ils ont eu pour cela l’idée de conduire une opération de fouille de texte au sein de l’outil Web of Science proposé par Thomson Reuters, qui recense des milliers de journaux académiques. Ils ont ainsi pu constater que sur une période s’étendant de 1992 à 2014 le nombre des articles utilisant le mot clé « Data mining » dans leur description s’accroît constamment pour atteindre un total de 18 441 travaux publiés par des chercheurs dans le monde.

tdm
Evolution du nombre d’articles scientifiques recourant au TDM en fonction du temps (le « creux » constaté en 2007 s’explique par une modification de l’abonnement à Web of Science contracté par l’université où la recherche a été conduite).

Lire la suite

Le Royaume Uni sanctuarise les pratiques de data mining par une exception au droit d’auteur

Le gouvernement britannique est actuellement en train de mettre en oeuvre une réforme du droit d’auteur, en agissant sur les exceptions permettant de réaliser certains usages d’œuvres protégées en conformité avec la loi. Le Royaume Uni, par certains côtés, rattrape un retard qu’il pouvait accuser par rapport à certains autres pays d’Europe. La loi anglaise ne comportait pas par exemple d’exceptions en faveur des citations, des copies privées ou des parodies, alors que ce sont des mécanismes que l’on retrouve dans la plupart des pays de l’Union. Sur ces points, le gouvernement anglais va donc aller dans le sens d’une harmonisation avec le reste des pays européens. Mais cette réforme comporte aussi des éléments réellement innovants, comme l’introduction d’une exception en faveur du text et data mining.

data
Dans la nuit des images. Par Dalbera. CC-BY. Source : Flickr.

Lire la suite