Le Royaume Uni sanctuarise les pratiques de data mining par une exception au droit d’auteur

Le gouvernement britannique est actuellement en train de mettre en oeuvre une réforme du droit d’auteur, en agissant sur les exceptions permettant de réaliser certains usages d’œuvres protégées en conformité avec la loi. Le Royaume Uni, par certains côtés, rattrape un retard qu’il pouvait accuser par rapport à certains autres pays d’Europe. La loi anglaise ne comportait pas par exemple d’exceptions en faveur des citations, des copies privées ou des parodies, alors que ce sont des mécanismes que l’on retrouve dans la plupart des pays de l’Union. Sur ces points, le gouvernement anglais va donc aller dans le sens d’une harmonisation avec le reste des pays européens. Mais cette réforme comporte aussi des éléments réellement innovants, comme l’introduction d’une exception en faveur du text et data mining.

data
Dans la nuit des images. Par Dalbera. CC-BY. Source : Flickr.

Le text et data mining au coeur des débats 

Les pratiques de recherche que constitue la fouille de texte et de données sont actuellement au coeur de discussions au niveau européen. Le processus initié par la Commission, « Licences for Europe« , avait en vain tenté l’an dernier de trouver un compromis entre éditeurs scientifiques et représentants des utilisateurs sur une base contractuelle. Depuis, la Commission européenne a abordé à nouveau ce sujet dans la consultation publique sur la réforme du droit d’auteur lancée à la fin de l’année dernière et dont elle doit à présent faire la synthèse sous la forme d’un livre blanc.

Beaucoup de représentants des chercheurs et des bibliothèques militent pour l’introduction d’une exception au droit d’auteur qui viendrait sécuriser ces pratiques innovantes de recherche, comme une extension du « droit de lire ». Mais dans le même temps, les éditeurs scientifiques ont bien compris qu’une partie de l’avenir de la recherche passait par les possibilités offertes par le text et data mining. Ils tentent d’imposer des formules contractuelles pour faire en sorte que ces pratiques restent bien soumises au droit d’auteur et puissent faire l’objet d’une tarification et d’un contrôle. C’est le cas par exemple d’Elsevier qui fait figurer dans les licences des bases de données scientifiques qu’il vend aux bibliothèques et instituts de recherche des clauses concernant le data mining.

En France, la question du data mining est en ce moment examinée par le CSPLA (Conseil Supérieur de la Propriété Littéraire et Artistique) qui doit prochainement remettre un rapport sur la question, dont l’enjeu principal sera sans doute de savoir si une nouvelle exception doit être introduite ou si des solutions contractuelles sont suffisantes. Le collectif SavoirsCom1 a été auditionné par cette mission et nous nous sommes résolument prononcés en faveur d’une exception législative et d’un rattachement du data mining au « domaine public de l’information ». Depuis, on a appris qu’Elsevier avait réussi à imposer au sein de la licence nationale conclue récemment avec le consortium Couperin pour la France des clauses relatives au data mining. Ce choix a soulevé des critiques sévères, car cela revient à accepter le principe même que les pratiques de data mining relèvent des droits exclusifs des éditeurs, alors que c’est précisément le point en discussion dans ce débat.

Position de SavoirsCom1 sur le data et text mining.

Comme on le voit, la question du statut juridique du data mining est complexe, et elle constitue un enjeu considérable pour l’avenir des pratiques de recherche, au sein desquelles les données prennent de plus en plus d’importance à mesure que les technologies offrent de nouveaux champs d’investigation.

Une nouvelle exception sur la base de l’utilisation équitable (fair dealing)

C’est donc dans ce contexte que l’Angleterre annonce la mise en place d’une exception au droit d’auteur en faveur du text et du data mining, faisant suite aux recommandations du rapport Hargreaves remis en 2011. La nécessité d’assouplir le droit d’auteur avait alors été mise en avant, afin de permettre davantage d’innovation.

Couverture du rapport Hargreaves.

La formulation de l’exception anglaise est intéressante. Elle repose sur le mécanisme du fair dealing (utilisation équitable), qui est une variante du fair use américain (usage équitable). Ce système, caractéristique de la plupart des pays du Commonwealth (Canada, Australie, Nouvelle Zélande, etc) reprend l’idée d’usage proportionné qui est au coeur du fair use, mais limite son champ d’application à des cas listés par la loi. Ici donc, la loi anglaise a ajouté un cas spécifique de fair dealing pour le data mining, conçu comme une extension de l’exception existant déjà en faveur des pratiques de recherche et d’enseignement. Voici ce qu’elle dit (je traduis) :

29 A – Copies effectuées à des fins de text et data mining dans le cadre de recherches non-commerciale

(1) La réalisation d’une copie d’une oeuvre par une personne ayant eu un accès à celle-ci en conformité avec la loi ne constitue pas une infraction au droit d’auteur, dans la mesure où :

(a) Cette copie de l’oeuvre est réalisée dans le but qu’une personne ayant eu accès à celle-ci en conformité avec la loi puisse effectuer une analyse computationnelle de tout élément figurant dans cette oeuvre dans le seul but de conduire une recherche non-commerciale.

(b) La copie s’accompagne de crédits suffisants (à moins que cela ne soit impossible pour des raisons pratiques ou autres).

(2) Lorsque qu’une copie de l’oeuvre a été effectuée en vertu de cette section, le droit d’auteur est enfreint si :

(a) La copie est transférée à une autre personne, à moins que ce transfert soit autorisé par le titulaire de droits, ou

(b) La copie est utilisée dans un autre but que celui qui figure à  la sous-section (1)(a), à moins que cet usage ne soit autorisé par le titulaire de droit.

Une consécration du « droit de lire »

Cette formulation est remarquable dans la mesure où elle cible bien la nature des opérations de text et data mining. En soi, l’extraction d’informations n’est pas saisie par le droit d’auteur, qui ne porte que sur l’usage des oeuvres originales et mises en forme. Vous pouvez par exemple relever à la main les occurrences de noms de personnes ou de lieux figurant dans un texte et vous aurez alors effectué une opération de text mining de manière purement mentale. Cet usage a toujours été complètement libre, sans interférence du droit d’auteur. Mais si vous voulez effectuer les mêmes opérations en étant assisté par une machine, alors vous devrez nécessairement réaliser une copie de l’oeuvre pour que des algorithmes puissent intervenir. Et c’est là que le droit d’auteur (copy-right) est susceptible de se déclencher.

L’exception anglaise consacre donc l’idée que les copies techniques nécessaires aux opérations de text et data mining n’entraînent pas l’application du droit d’auteur. Il s’agit donc bien d’une consécration du « droit de lire », réclamé par plusieurs représentants des usagers : l’extraction de données ou d’information est indissociable de l’acte de lecture et sa nature ne doit pas changer selon que cette lecture est effectuée par un humain ou par une machine.

data2
Server room of BalticServers. Par Fleshas. Licence CC-BY-SA. Source : Wikimedia Commons.

L’exception anglaise est néanmoins bornée dans la mesure où la copie réalisée doit être entièrement dédiée à l’opération de text ou data mining. Il ne s’agit pas de montrer, d’afficher ou de transmettre cette copie à des tiers ; ni de l’utiliser dans un autre but, à moins de pouvoir recueillir l’accord du titulaire de droit. Cet accord n’est cependant pas nécessaire pour les opérations de recherche effectuées dans un cadre non-commercial, ce qui paraît essentiel pour éviter de tomber dans le travers d’une « science autorisée », tributaire de l’approbation préalable d’acteurs comme les éditeurs scientifiques. L’approche par les licences ressurgis pour des opérations de text et data mining effectuées dans un cadre commercial (analyses marketing par exemple).

Au niveau du champ d’application, la loi précise bien que cette exception est valable pour le texte, mais aussi pour toutes autres formes d’oeuvres comme les images, les enregistrements sonores ou les contenus audiovisuels. Par ailleurs, comme il est indiqué que l’utilisateur doit avoir accédé à l’oeuvre « en conformité avec la loi », l’exception porte non seulement sur des contenus acquis, mais aussi à mon sens sur des oeuvres fournies par des bibliothèques ou même sur des contenus figurant en libre accès sur Internet (sources licites).

Enfin, et c’est un point essentiel, cette exception est gratuite. Elle n’entraîne pas de compensation au bénéfice des titulaires de droits. Les études d’impact réalisées par le gouvernement anglais considèrent que les bénéfices pour la société sont supérieurs au « préjudice » que pourraient encourir les titulaires de droits du fait de ces usages.

Quels enseignements pour la France ? 

Au final, l’Angleterre se dote d’une exception législative solide en faveur des pratiques innovantes de recherche. Elle rejoint par une autre voie les États-Unis où la jurisprudence récente a peu à peu étendu le fair use au text et data mining (voir la décision Google Books notamment). Un des aspects les plus intéressants de la démarche du Royaume Uni réside dans le fait que ce pays a décidé d’avancer dans son droit national, sans attendre que la législation européenne évolue. Normalement, les États européens ne peuvent pas introduire de leur propre chef de nouvelles exceptions au droit d’auteur. Ils doivent s’en tenir à une liste fermée figurant dans la directive de 2001, qui n’aborde pas explicitement la question du data mining. Ici on peut penser que le gouvernement anglais a considéré que l’exception déjà prévue en faveur de la recherche et de l’enseignement dans la directive pouvait être étendue aux pratiques de fouille de textes et de données. Par ailleurs, il a aussi estimé que le test en trois étapes (un mécanisme limitant la portée des exceptions au droit d’auteur) ne s’opposait pas à la mise en place d’une exception gratuite.

God Save The Fair Dealing ! ;-)

Ces éléments sont importants pour la France, et notamment pour les recommandations que doit rendre bientôt le CSPLA. On voit ici qu’il existe une opportunité pour introduire des exceptions en faveur du data et text mining au niveau national en Europe. Quoi qu’on y fasse, l’approche par les licences restera forcément bancale et lacunaire. Elle laissera une main mise trop importante des éditeurs scientifiques sur les pratiques de recherche, tout en étant inadaptée pour les usages en ligne, où il n’est généralement pas possible de recueillir des autorisations. En limitant son exception au cadre de la recherche non-commerciale, l’Angleterre montre qu’un équilibre satisfaisant peut être trouvé. La France peut-elle vraiment à présent rester en retrait, au risque d’hypothéquer l’avenir de sa recherche ?

Dès lors qu’une exception est envisageable, on ne peut que déplorer l’acceptation des clauses de data mining dans la licence nationale Elsevier qui a été conclue récemment entre cette éditeur et le consortium Couperin. Comme le dit fort justement Pier-Carl Langlais, Elsevier par ce système de licences a réussi à « faire sa loi » et ces clauses sont assimilables à une forme de copyfraud posé sur le « domaine public de l’information », alors qu’une exception législative aurait pu sécuriser une sphère d’usages libres et gratuits pour les chercheurs. Il faut espérer que cette soumission à l’approche contractuelle ne compromette pas à présent l’avenir. L’association LIBER, qui regroupe les bibliothèques de recherche en Europe, vient de publier une déclaration très critique vis-à-vis de ces licences proposées par Elsevier, qui ont pourtant été acceptées en France…

La loi anglaise va d’ailleurs sagement prévoir que des licences ne peuvent prévaloir sur l’exception pour restreindre les possibilités de faire du data mining. C’est peut-être d’ailleurs le passage le plus important du texte (je traduis) :

Dans la mesure où les clauses d’un contrat prétendraient empêcher ou restreindre la réalisation de copies qui, en vertu de cette section n’enfreindraient pas le droit d’auteur, ces clauses seraient réputées sans effet.

Les pratiques de data mining sont donc bien sanctuarisées au Royaume Uni et l’exception entrera en vigueur en juin prochain. Messieurs les anglais ont tiré les premiers et ils ont fait mouche ! Bravo à eux !

***

PS : d’autres aspects de cette réforme anglaise sont vraiment dignes d’intérêt. L’exception pour copie privée par exemple est elle aussi gratuite, y  compris pour les usages dans le cloud, et c’est aussi le cas pour l’exception pédagogique et de recherche (à l’inverse de ce qui existe en France où ces deux exceptions sont payantes). On peut globalement dire que le Royaume Uni commence à sortir du paradigme réducteur en vertu duquel toute forme d’usage d’une oeuvre constitue un préjudice devant être compensé. A méditer !


14 réflexions sur “Le Royaume Uni sanctuarise les pratiques de data mining par une exception au droit d’auteur

  1. C’est en effet une belle avancée, mais n’aurait-il pas été souhaitable de mieux définir « recherche non-commerciale » , surtout si l’on considère la récente définition très étroite du NC par un juge allemand ? Doit-elle être non-commerciale dans sa finalité ou de par l’endroit d’où elle est conduite ? Un doctorant CIFRE ou un chercheur travaillant dans une UMR CNRS-Privé (Comme l’UMR CNRS-Thalès) font-ils de la recherche non-commerciale ? Et si l’on va encore plus loin, un éditeur aura-t-il le droit de vendre un article reprenant une recherche non-commerciale ?
    Finalement, en quoi ce non-commercial est-il meilleur que le non-commercial imposé par Elsevier (en faisant abstraction, autant que possible, de toutes les objections déjà soulevées, notamment par Pierre-Carl Langlais http://scoms.hypotheses.org/98) ?

    1. C’est une question importante que tu poses là. Oui, peut-être aurait-il fallu mieux définir le champ de la recherche non-commerciale. Néanmoins, pour mettre en place une exception gratuite, je vois comment les anglais auraient pu faire sans passer par la notion de non-commercial.

      Ce non-commercial est néanmoins infiniment préférable à celui proposé par Elsevier, car il est inscrit dans la loi et il supprime l’autorisation préalable. Il s’applique à tous les contenus, même ceux en ligne, pour lesquels il peut être très difficile de trouver quelqu’un à qui demander une autorisation.

      Pour ce qui est de l’édition d’un article, cela ne pose à mon sens pas de problème. L’exception porte sur les copies réalisées pour faire la fouille de données. Mais les résultats de la recherche conduite ne sont pas « contaminés » par ce NC. Par contre, le corpus ayant servi à produire les résultats ne peut pas être publié. Mais les données résultats de son analyse oui, car elles sont séparables des copies.

      Ta question reprend des critiques habituelles adressées au NC, comme quoi il ne serait pas assez précis. Mais tous les concepts juridiques sont imprécis, parce que la réalité est mouvante et la loi ne peut que formuler des prescriptions générales, comportant un certain niveau d’abstraction. On peut toujours trouver des cas limites comme ceux que tu cites. Mais globalement pour la recherche, le NC sera opératoire et l’exception anglaise va sécuriser un champ important de pratiques scientifiques.

      En cas de doute, c’est à la jurisprudence de trancher et de poser des limites de manière plus fines. C’est le fonctionnement normal du droit.

      Par contre, la décision que tu cites du juge allemand concernant le NC des licences Creative Commons n’est pas du tout une bonne chose. Ce juge a défini le NC quasiment comme un usage « personnel » et ça pose un vrai problème. Cette définition doit à mon sens être rejetée. Mais il faut aussi dire qu’une partie de la faute repose aussi sur Creative Commons, qui a laissé une définition à mon sens trop floue dans ses licences et n’a pas réussi lors de la dernière élaboration de la V4 à rassembler un consensus dans la communauté pour mieux définir son NC.

      Donc pour moi, la formulation de cette exception est acceptable, moyennant peut-être un certain mamque de précisions du NC comme tu le pointes, mais ce n’est pas dirimant.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.