Text et Data Mining : l’absence d’exception pénalise bien la recherche

Un article scientifique a été publié le 7 juin dernier qui démontre pour la première fois que les pratiques de Text et Data Mining (exploration de données) sont moins développées dans les pays où le niveau de protection par le droit d’auteur est le plus élevé et ne prévoit pas de mécanisme spécifique pour les sécuriser. Ecrit par Christian Handke, Lucie Guibault et Joan-Jospeh Vallbé, cet article s’intitule : « Is Europe Falling Behind Text et Data Mining : Copyright’s Impact On Data Mining In Academic Research » et il est disponible en Open Access ici. Il a également fait l’objet d’une communication à laquelle j’ai pu assister lors du dernier congrès de la Ligue des bibliothèques européennes de recherche (LIBER) qui s’est tenu la semaine dernière à Londres.

L’intérêt de ce travail de recherche réside d’abord dans sa méthodologie. Par une jolie mise en abyme, les trois chercheurs ont choisi de recourir au Text Mining pour vérifier si les rigidités du droit d’auteur avait ou non impact sur l’utilisation du TDM dans les activités de recherche. Ils ont eu pour cela l’idée de conduire une opération de fouille de texte au sein de l’outil Web of Science proposé par Thomson Reuters, qui recense des milliers de journaux académiques. Ils ont ainsi pu constater que sur une période s’étendant de 1992 à 2014 le nombre des articles utilisant le mot clé « Data mining » dans leur description s’accroît constamment pour atteindre un total de 18 441 travaux publiés par des chercheurs dans le monde.

tdm
Evolution du nombre d’articles scientifiques recourant au TDM en fonction du temps (le « creux » constaté en 2007 s’explique par une modification de l’abonnement à Web of Science contracté par l’université où la recherche a été conduite).

Lire la suite

Spare Rib : un projet exemplaire de numérisation d’une revue orpheline

L’an dernier, j’avais consacré dans S.I.Lex un billet à la manière dont le Royaume-Uni a mis en place un système pour traiter le problème particulier des oeuvres orphelines. Ce dispositif découle d’une directive européenne adoptée en 2012, mais il va plus loin en organisant l’octroi de licences pour l’utilisation d’oeuvres toujours protégées par le droit d’auteur, mais dont on ne peut identifier ou localiser les titulaires de droits. L’Angleterre a fait le choix intéressant d’ouvrir une plateforme en ligne pour faciliter l’octroi de ces licences, en prévoyant des sommes modiques à verser pour les usages non-commerciaux, notamment lorsqu’ils sont effectués par des bibliothèques, archives ou musées.

Couverture du magazine féministe anglais Spare Rib de décembre 1972. Source : Wikimedia Commons

Les premiers retours sur l’efficacité de ce dispositif semblent assez concluants. Mais un nouvel exemple d’utilisation me paraît particulièrement intéressant pour montrer les marges de manoeuvre qui s’ouvrent à présent aux institutions culturelles anglaises. Il s’agit du projet de numérisation et de mise en ligne de la revue féministe Spare Rib, conduit par la British Library. Ce magazine paru de 1972 à 1993 soulevait des problèmes particuliers en matière juridique, car plus de 4000 collaborateurs ont participé à sa publication, créant un écheveau de droits particulièrement inextricable. Lire la suite

Qui a adopté les œuvres orphelines au Royaume-Uni ?

En novembre de l’année dernière, j’avais écrit un billet à propos du système ambitieux que le Royaume-Uni a mis en place pour régler le problème posé par les oeuvres orphelines (à savoir celles dont on ne peut identifier ou localiser les titulaires de droits afin de leur demander une autorisation préalable à l’usage). L’Angleterre s’est appuyée sur une directive européenne de 2012, qui a introduit une nouvelle exception au droit d’auteur pour traiter la question, mais la loi nationale est allée au-delà de ce que ce texte prévoyait, en mettant en place un dispositif à la portée plus large et plus simple d’utilisation.

orphan
Image par opensource.com. CC-BY-SA. Source : Flickr

La solution anglaise s’appuie sur un Orphan Works Register, permettant de soumettre en ligne des demandes de licence de réutilisation d’oeuvres pour lesquelles des recherches de titulaires de droits sont restées infructueuses. Il fonctionne depuis 6 mois à présent et le site « The 1709 Blog », spécialisé dans les questions de droit d’auteur au pays d’Albion, s’est plongé dans ce registre pour établir un premier bilan de son fonctionnement.

Lire la suite

Oeuvres orphelines : l’Angleterre se dote d’une solution satisfaisante. Et la France ?

Mercredi prochain, la Commission des Affaires culturelles de l’Assemblée nationale va examiner un projet de loi transposant trois directives européennes, dont celle portant sur les œuvres orphelines. Ces œuvres sont celles qui sont toujours protégées par le droit d’auteur, mais pour lesquelles il n’est pas possible d’identifier ou de retrouver le ou les titulaires de droits, afin d’obtenir une autorisation. Ce phénomène de « l’orphelinat » des œuvres est massif, notamment à cause de l’allongement continu de la durée des droits et on compte en dizaines de millions les œuvres se trouvant dans cette situation dans les collections des archives, musées et bibliothèques dans le monde.

Flag_-_Union_Flag
L’Angleterre a opéré une transposition ambitieuse de la directive sur les oeuvres orphelines, qui débouche sur un résultat utile. la France saura-t-elle faire de même ? (The Union Flag. Par Jza84. CC-BY. Source : Wikimedia Commons).

Une nouvelle exception au droit d’auteur à introduire en droit français

En 2012, le Parlement européen a adopté une directive visant à permettre certains usages des oeuvres orphelines par les institutions de type bibliothèques, musées, archives, ainsi que par les établissements d’enseignement et de recherche. Après avoir effectué une « recherche diligente », c’est-à-dire d’avoir tenté sans succès de trouver les titulaires de droits par une recherche approfondie, les institutions peuvent utiliser l’oeuvre orpheline, y compris pour la numériser et la mettre en ligne, sur le fondement d’une nouvelle exception au droit d’auteur. Mais la directive prévoit qu’en cas de réapparition d’un titulaire de droits, celui-ci pourra demander à faire cesser la diffusion de l’oeuvre, ainsi que revendiquer une « compensation raisonnable ».

Nombreux sont ceux qui ont estimé que cette directive, si elle constitue une avancée, ne permettra pas réellement de régler le problème des oeuvres orphelines, notamment à cause du cumul de l’obligation d’effectuer des recherches diligentes longues et complexes oeuvre par oeuvre et de celle de payer une compensation au titulaire de droits en cas de réapparition. C’est le cas par exemple de Michèle Battisti, qui en 2012 se demandait si cette directive n’avait pas été votée pour rien :

La recherche et l’indemnisation des ayants droit risquent fort de représenter un poste de coût écrasant. Est-ce justifié ? Est-ce même envisageable au regard de la mission d’intérêt public poursuivie par les établissements mentionnés dans la directive ? Le souci d’équilibre entre les intérêts des ayants droits et ceux de la société semble bien compromis.

Une transposition ambitieuse en Angleterre

Il est clair que cette directive n’apporte pas de solution miracle, notamment dans le cadre de la numérisation de masse des collections. Mais les États disposent d’une marge de manoeuvre appréciable pour la transposer et l’Angleterre vient de prouver qu’un mécanisme intéressant pouvait être mis en place dans un esprit d’équilibre pour favoriser la diffusion du patrimoine et des connaissances.

Le gouvernement anglais a en effet annoncé l’ouverture d’un dispositif qui selon lui, permettra la remise en circulation de 91 millions d’oeuvres orphelines (!!!). L’Angleterre a en effet transposé dans son droit national la nouvelle exception, mais dans un esprit constructif en instituant un système d’accompagnement qui favorisera grandement sa mise en oeuvre.

L’Angleterre a d’abord choisi de pallier au niveau national certaines lacunes de la directive, qui par exemple laisse de côté les images fixes et ne s’applique qu’aux textes, musiques et oeuvres audio-visuelles. Le législateur anglais a pourtant choisi d’inclure les images dans le dispositif, de manière à ce qu’aucune oeuvre ne soit tenue en dehors du champ de l’exception. Par ailleurs, alors que la directive européenne ne s’adresse qu’à des institutions culturelles pour des usages non-commerciaux (avec des possibilités limitées de lever des redevances), la loi anglaise a ajouté la possibilité d’utiliser les oeuvres orphelines pour des entités commerciales, comme des éditeurs ou des producteurs.

Des licences larges pour les usages non-commerciaux

Mais le plus intéressant dans ce dispositif ne se situe pas là. Les demandes d’utilisation des oeuvres orphelines doivent être adressées à l’IPO (Intellectual Property Office) qui a mis en place un formulaire en ligne pour faciliter la procédure. Ce formulaire exige de renseigner un certain nombre d’éléments comme le titre de l’oeuvre, ainsi que son type (texte, film, photo, musique, etc). L’utilisateur doit ensuite indiquer quel type d’usage il souhaite faire de l’oeuvre, en précisant s’il entend réaliser une exploitation commerciale ou non.

Sans titre

J’ai fait le test pour différents types d’œuvres et d’usages et au bout du processus, pour un exploitation non-commerciale, l’Intellectual Property Office délivre une licence à l’utilisateur, couvrant ces différents usages :

  • Free hand outs for live event, exhibition or similar
  • Use in a live event, exhibition or similar
  • In newsletter, bulletin, e-newsletter or e-bulletin
  • In non-commercial promotional material – print and digital
  • Digitise and make available on-line, including on social media
  • Preservation purposes
  • Use on stage or in performance
  • Educational purposes – use in learning/ training materials, including e-learning
  • Use in thesis/dissertation
  • Personal use

Pour que cette licence soit valable, la demande doit être soumise et validée par l’Intellectual Property Office, qui va vérifier si les recherches diligentes effectuées par le demandeur ont bien été accomplies de manière sérieuse. Des guides sont mis à disposition par l’IPO, qui indiquent des sources à consulter et comportent des fiches facilitant la production des preuves de ces recherches.

Ne plus considérer l’usage des oeuvres systématiquement comme un préjudice

Le dispositif en ligne de l’IPO calcule ensuite le coût que devra payer l’utilisateur et c’est là que les choses deviennent vraiment intéressantes. Pour un usage non-commercial de n’importe quel type d’oeuvres (j’ai refait plusieurs fois le test), le coût de la licence est de 0,10 livres sterling, soit environ 0,12 euros. A l’inverse, pour un usage commercial, le coût sera beaucoup plus élevé (variable selon les usages, mais de l’ordre de plusieurs centaines d’euros). L’IPO demande en plus de payer des frais de dossier d’un montant de 20 livres par demande, sachant qu’une demande peut porter sur plusieurs oeuvres.

Sans titre1

Avec ce système de tarification, la loi anglaise a mis en place un dispositif intéressant dans la mesure où il fait une distinction claire entre usage commercial et usage non-commercial. Pour ce dernier, le montant de la licence n’est certes pas nul, mais il est très faible. Cela signifie que le droit anglais considère que l’usage d’une oeuvre orpheline réalisée par une institution culturelle ne constitue pas un préjudice pour les titulaires de droits. C’est au contraire un service rendu à la société dans son ensemble et un apport au rayonnement du patrimoine culturel. Outre le coût des recherches diligentes à effectuer, les établissements culturels doivent également investir pour numériser et diffuser ces oeuvres. Il est donc normal qu’ils puissent bénéficier d’une garantie juridique importante. Si le titulaire de droits réapparait, il pourra demander à faire cesser la diffusion, mais il ne pourra exiger qu’une somme minime en compensation de l’usage réalisé. Les choses sont par contre différentes en cas d’usage commercial, où la compensation à verser est plus forte et permettra à un titulaire de droits d’obtenir une somme substantielle.

Sans titre2

C’est à mon sens un grand mérite de cette transposition anglaise d’avoir clairement distingué selon les usages et surtout d’avoir entériné que l’usage d’une oeuvre ne constitue pas nécessairement un préjudice. Par ailleurs, le système est bien pensé, dans la mesure où les institutions culturelles doivent certes verser une somme en amont (les frais de dossier + un forfait de 0,10 livres par oeuvre), mais qu’elles obtiennent en échange une licence leur donnant une forte sécurité juridique et la garantie qu’en cas de réapparition du titulaire de droits, elles n’auront rien de plus à payer que ce qu’elles ont déjà versé. Ce système reste difficile à utiliser pour de la numérisation de masse, car il est nécessaire de conduire des recherches diligentes oeuvre par oeuvre, mais il permettra sans doute de manière significative aux institutions culturelles anglaises de numériser plus largement leurs collections.

Vers un nouveau « trompe-l’oeil législatif » en France ?

La France de son côté s’apprête elle aussi à transposer la directive européenne sur les oeuvres orphelines. Le projet de loi qui va être examiné à l’Assemblée a été précédé par une consultation conduite par le Conseil Supérieur de la Propriété Littéraire et Artistique (CSPLA), à laquelle SavoirsCom1 a participé.

L’orientation retenue n’est pas celle qui a présidé à la transposition anglaise. La France est partie pour se contenter de se tenir au plus près du texte de la directive. Les établissements culturels devront effectuer des recherches diligentes oeuvre par oeuvre et les transmettre au Ministère de la Culture afin qu’il les envoie à une base de données européenne. Mais le Ministère ne jouera pas le même rôle que l’Intellectual Property Office en Angleterre. Il n’attribuera pas de licence aux établissements, ni ne leur garantira que leurs recherches ont été effectuées de manière conforme aux exigences de la loi. Certes, les établissements culturels n’auront rien à payer, mais en cas de réapparition du titulaire de droits, celui-ci pourra exiger une compensation qui devra être négociée avec l’établissement, sur la base du « préjudice » causé par la mise à disposition effectuée par l’établissement.

Cela signifie donc que les établissements resteront avec une épée de Damoclès au-dessus de la tête, sans savoir à l’avance combien ils auront à payer au cas où un titulaire de droits se manifesterait. Ce genre d’incertitudes est de nature à dissuader certains établissements de recourir au dispositif, là où le système anglais va au contraire les y encourager.

Depuis la loi DADVSI en 2006, la France s’est faite une spécialité de voter des « trompe-l’oeil législatifs » en matière d’exception au droit d’auteur. C’est le cas par exemple avec l’exception pédagogique et de recherche, effroyablement complexe à appliquer, qui n’offre pas un cadre satisfaisant au développement des usages alors même qu’elle fait l’objet d’une compensation financière de plusieurs millions d’euros par an. Assistera-t-on au même phénomène à propos des oeuvres orphelines ?

Plusieurs amendements au texte proposé par le gouvernement ont néanmoins été déposés, notamment par la députée Nouvelle Donne Isabelle Attard, dont un qui propose de fixer forfaitairement par décret le montant des compensations à verser par les établissements culturels. Sans égaler le système anglais, ce serait une manière d’introduire un peu de prévisibilité dans le dispositif et, si la compensation est minime, de favoriser les usages dans le sens de la diffusion des oeuvres au plus grand nombre.

***

L’Angleterre s’était déjà distinguée ces derniers mois en votant sans attendre l’Union européenne une exception gratuite permettant aux chercheurs d’effectuer des opérations de Text et Data Mining sur des contenus protégés. Avec cette transposition ambitieuse de la directive sur les oeuvres orphelines, elle reste dans le même esprit, en s’appuyant sur l’idée qu’il faut cesser de considérer que l’usage d’une oeuvre constitue systématiquement un préjudice à compenser. Au contraire, l’usage peut donner ou redonner de la valeur aux oeuvres et cela n’est jamais aussi vrai que pour les oeuvres orphelines.

Tintin au pays des usages transformatifs : la citation des images en question

Cette semaine, la Société Moulinsart, détentrice des droits sur l’oeuvre d’Hergé, a une nouvelle fois fait montre de la conception jusqu’au-boutiste du droit d’auteur qui la caractérise, en exigeant de la plateforme Tumblr le retrait de vignettes issues des albums de Tintin, que le microblog « Le petit XXIème » publiait chaque jour pour commenter l’actualité avec beaucoup d’inventivité (heureusement toujours visibles sur Twitter). Si l’on peut considérer qu’il s’agit d’un nouvel exemple de dérapage du droit d’auteur, la Société Moulinsart n’en reste pas moins dans son droit et l’usage des images que réalisait « Le Petit XXIème » était bien constitutif d’une contrefaçon, selon les termes de la loi française. Mais c’est précisément cela qui est intéressant dans cette affaire : comment un tel usage, créatif et inventif, s’inscrivant dans un cadre purement non-commercial et assimilable à un hommage, peut-il tomber aujourd’hui sous le coup de la loi sur la base d’un délit passible potentiellement de 3 ans de prison et 300 000 euros d’amendes ?

[tweet https://twitter.com/lepetitXXIe/status/448831620410134528]

Les réprobations dans la presse ont été nombreuses devant cet usage disproportionné du droit d’auteur par les ayants droit d’Hergé, mais cette réprobation ne doit pas s’arrêter aux agissements des héritiers : elle doit déboucher sur une critique de la loi française qui permet de tels comportements. Peut-on essayer de penser autrement l’articulation du droit d’auteur pour que de telles pratiques créatives soient sécurisées ? Vous allez voir que oui.

tintin
Triste spectacle du Tumblr « le Petit XXIème », privé des images issues des albums de Tintin qui l’illustraient. Un nouvel exemple de l’inadaptation du droit français en matière de citation des images.

Lire la suite

Verdict dans l’affaire Google Books : une grande leçon de démocratie ?

La nouvelle est tombée hier et elle fera date : après plus de 8 années de procédure d’une incroyable complexité, Google a finalement remporté le procès qui l’opposait à la Guilde des auteurs à propos de son programme géant de numérisation Google Books. Le juge Denny Chin, en charge de l’affaire, lui a donné raison sur la base du fair use (usage équitable), une disposition du droit américain qui permet dans certaines situations de se défendre de l’accusation de contrefaçon en cas d’usage d’oeuvres protégées.

The Google Book. Par Jim Barter. CC-BY. Source : Flickr

La défaite est cinglante pour la Guilde des Auteurs, qui restait seule en lutte contre Google après que les éditeurs américains aient décidé de conclure un accord en 2012 avec le moteur de recherche. Denny Chin a en effet rendu un summary judgment, ce qui signifie qu’il a estimé que la balance penchait tellement en faveur de Google qu’il pouvait recourir à une procédure simplifiée. La fermeté du jugement va rendre hasardeux pour la Guilde des Auteurs le fait de se pourvoir en appel, même si ses responsables ont déjà annoncé qu’ils avaient l’intention de le faire.

De quoi était-il exactement question dans ce jugement ? En mars 2011, le juge Chin avait refusé de valider un Règlement par lequel Google, la Guilde des Auteurs et l’Association des éditeurs américains avaient essayé de mettre fin à leur différend sur une base contractuelle. Ils avaient voulu mettre en place un système complexe qui aurait permis à Google, en contrepartie de 125 millions de dollars,  de commercialiser les livres épuisés numérisés par ses soins, sur la base d’un opt-out (option de retrait laissée aux titulaires de droits pour sortir du système). Chin avait refusé d’entériner cette solution, en estimant qu’elle risquait de conférer à Google un monopole de fait sur la numérisation à but commercial, en particulier pour les oeuvres orphelines faisant partie du corpus.

Google a donc été obligé de revenir à l’intention initiale du projet Google Books, à savoir scanner des ouvrages, y compris sous droits, mais uniquement pour en diffuser de courts extraits (snippets) répondant aux requêtes des utilisateurs. Pour aller plus loin (montrer des portions plus larges, vendre des ouvrages), Google doit passer par des accords volontaires, avec les éditeurs et les auteurs (opt-in).

Lire la suite

Après la Copy Party, une Copy Party Licence pour mettre en partage un scanner ?

Samedi dernier a eu lieu au Garage de la Quadrature du Net un atelier DIY Bookscanner, dont j’avais déjà parlé ici, dans le cadre du festival Villes en Biens Communs. Cet évènement a rencontré un beau succès, preuve que cette machine intrigue et intéresse, et vous pouvez vous en faire une idée à travers la série d’articles publiés par Actualitté (1,2,3), ainsi que sur le site de plusieurs participants (Jean-Noël Lafarge, Louise Merzeau, Romaine Lubrique). Merci à eux pour ces compte-rendus !

Bookscanner et numérisation de livres. Par Actualitté. CC-BY-SA. Source Flickr.

Évidemment, l’utilisation d’un tel appareil de reproduction soulève un certain nombre de questions juridiques, vis-à-vis du respect du droit d’auteur. Lorsque les ouvrages numérisés correspondent à des oeuvres du domaine public, il n’y a pas de difficultés, ni pour reproduire, ni pour mettre en ligne les fichiers ensuite. Mais dès que l’on touche à des livres encore protégés par le droit d’auteur, des obstacles commencent à surgir qui nous confrontent au régime juridique complexe de l’exception de copie privée.

Lire la suite