Google recherche domaine public désespérément.

L’affaire Google Book paraît au point mort, tant la machine judiciaire américaine semble s’être enlisée dans l’examen du second Règlement, qui devait mettre un terme aux poursuites dont Google faisait l’objet de la part des auteurs et éditeurs. Si ce n’était la parution d’une étude de fond par le professeur Pamela Samuelson "The Google Book Settlement as Copyright Reform", on pourrait penser que les choses sont redevenues complètement inertes sur ce front.

Pourtant il se passe des choses, mais pour une fois, ce sont moins les livres sous droits qui posent problème à Google que les livres du domaine public. A mesure que le contenu de sa bibliothèque numérique grandit, Google se trouve en effet confronté à un défi de plus en plus complexe pour déterminer si les ouvrages scannés appartiennent ou non au domaine public, afin de savoir s’il peut les diffuser dans leur intégralité ou seulement sous la forme d’extraits.

Le diagnostic juridique est plus simple à effectuer pour les Etats-Unis, car une règle veut que les oeuvres publiées avant 1923 appartiennent automatiquement au domaine public . Mais pour le reste du monde, Google est obligé de composer avec la variété des lois nationales en matière de durée du droit d’auteur et de déterminer l’identité des auteurs sur les ouvrages, ainsi que leurs dates exactes de décès. Comme ces informations sont loin d’être disponibles dans tous les cas, Google a  instauré une règle automatique de protection en bloquant la diffusion des ouvrages publiés après à 1870, quand leur statut juridique est indéterminée.

Des milliers et des milliers de livres doivent ainsi rester "congelés" dans la banquise de l’incertitude juridique et la situation peut même devenir épineuse pour Google lorsqu’il a affaire à des éditeurs un peu malins, qui profitent des lacunes de l’information juridique pour tenter de faire main basse sur le domaine public…

Combien d'ouvrages restent ainsi "gelés" par l'incertitude juridique dans Google Book ? Colorado 2005054. Par Michael (mx5tx). CC-BY. Source : Flickr

Google, victime du "coup du reprint" ?

C’est une tactique bien connue du monde de l’édition de tenter de faire renaître des droits d’auteur sur le domaine public à l’occasion d’un simple reprint (copyfraud !). Le site Techdirt nous apprenait au début du mois dernier qu’un éditeur américain, Kessinger Publishing, était en train de tenter cette manœuvre avec Google Book, avec un certain succès, semble-t-il. Son plan consiste à télécharger des ouvrages du domaine public à partir de la bibliothèque numérique ; à en faire des réimpressions et à se retourner contre Google en lui réclamant d’en bloquer l’accès, en se prévalant de droits sur les reprints.

Le pire, c’est que visiblement… ça marche ! Des utilisateurs se sont plaints sur le forum de Google Book d’avoir vu disparaître certains des ouvrages auxquels ils avaient accès et la manoeuvre de Kessinger Publishing concernerait plus de 97 000 ouvrages (!!!). L’éditeur est même allé jusqu’à déposer un ISBN pour mieux appuyer ses prétentions. De l’art de se servir de Google Book pour faire sortir des livres du domaine public et se les approprier…

La réaction de Google de bloquer ces ouvrages peut surprendre. Techdirt estime qu’il s’agit d’une sorte de "réflexe" de la firme, échaudée par une série d’affaires en justice à propos de sa bibliothèque numérique, qui préfère à présent retirer d’abord et examiner ensuite le bien-fondé des plaintes. On peut lire ici cependant dans cette autre discussion de forum, de la bouche d’un de ses employés, que Google a l’air de donner raison à l’éditeur et de considérer que ces reprints constituent bien des rééditions qui font renaître des droits…

Une telle attitude est vraiment étonnante (à tel point que certains en viennent à se demander si tout cela n’est pas un coup monté de toutes pièces par Google, qui agirait en sous-main à travers Kessinger Publishing pour reverrouiller les ouvrages du domaine public ! Bienvenu dans X-Files !)

Mais il y a quelque chose de plus troublant encore, qui me donne beaucoup à réfléchir…

Et si l’exclusivité commerciale de Google Book ne valait… rien !

Avant même d’avoir à juger si les revendications de Kessinger Publishing sur les ouvrages du domaine public étaient fondées, Google aurait pu répliquer en accusant l’éditeur d’avoir violé l’exclusivité commerciale qu’il revendique sur les ouvrages numérisés par ses soins. Car Kessinger Publishing fait bien commerce des ouvrages récupérés et réimprimés, par le biais d’Amazon. Cette exclusivité, Google y tient pourtant… C’est l’une des restrictions fortes que Google impose à ses bibliothèques partenaires, en leur interdisant pendant une durée variable de faire elle-même un usage commercial des copies qui leur sont remises ou de les transférer à une partenaire susceptible d’en faire un usage commercial.

Si Google n’a pas réagi en menaçant l’éditeur de poursuites, c’est peut-être tout simplement que cette fameuse exclusivité n’est pas si solide en droit. Peut-être n’a-t-elle même aucune valeur et ne constitue-t-elle qu’un moyen d’intimidation ? Techdirt le laisse clairement entendre :

Now, it’s important to note that Kessinger reprinting public domain books scanned by Google is perfectly legal [...]. There’s nothing infringing (at least in the US — elsewhere, it’s a bit unsettled) about taking someone else’s scan of public domain works and then publishing it yourself.

A bon entendeur, salut… et notamment toutes les bibliothèques partenaires de Google ! Il est peut-être temps de se demander si de simples clauses contractuelles ont vraiment le pouvoir de faire renaître des droits sur le domaine public….

La fameuse exclusivité commerciale qui apparaît dans les conditions d'utilisation des fichiers que l'on télécharge à partir de Google Book

L’autre explication possible, c’est que Google est bien en peine de déterminer si les ouvrages en question font ou non partie du domaine public…

L’intelligence collective à la rescousse…

Coïncidence ? La semaine dernière, le même site Techdirt relevait que Google avait lancé un appel sur le forum de Google Book pour inviter les utilisateurs à lui signaler les livres encore bloqués qui appartiendraient au domaine public, afin que leur statut puisse être éventuellement révisé. Plusieurs personnes se sont déjà manifestées pour apporter à Google de précieuses informations juridiques concernant des ouvrages.

Ce n’est pas la première fois que l’intelligence collective est ainsi appelée à la rescousse pour améliorer la gestion des droits. OCLC avait en effet lancé en 2008 une expérience en ce sens avec le Copyright Evidence Registry. Cette interface collaborative devait permettre aux bibliothécaires et professionnels de l’information partout dans le monde de partager des informations légales sur les livres, afin de compléter les métadonnées de Worldcat. Il était même prévu qu’à terme ces données puissent servir à bâtir un système automatique permettant de déterminer l’appartenance ou non d’un ouvrage au domaine public. Ce projet pilote devait durer 6 mois dans une première phase. Depuis son lancement, on n’a guère eu de nouvelles de son avancement et il est difficile de savoir où il en est aujourd’hui.

OCLC et Google ayant signé un accord pour permettre à ce dernier de réutiliser les données de Worlcat, on peut imaginer que les informations juridiques collectées par ce biais bénéficient d’une façon ou d’une autre à Google. Mais elles doivent être bien insuffisantes encore pour que Google, le géant de l’information, soit contraint d’ouvrir à ce sujet des discussions de forum !

Et certains exemples montrent la gestion des droits sur les livres numérisés restera certainement encore inextricable pendant longtemps.

Mais puisque je vous dis que c’est mon arrière-grand père !

Ce billet est l’occasion pour moi d’attirer votre attention sur un cas assez symptomatique de cette grande pagaille de la gestion des droits, qui m’avait été rapporté en mai dernier dans les commentaires d’un autre billet de S.I.Lex.

Un internaute, sous le pseudo de Bowatz, était venu me raconter que Google Books bloquait l’accès à plusieurs ouvrages dont son arrière-grand père était l’auteur, alors même qu’ils étaient manifestement dans le domaine public, l’aïeul étant décédé en 1914. Ces livres devenus rares et difficiles à trouver en France, Bowatz demandait à Google qui avait trouvé ses exemplaires dans des bibliothèques américaines, de les débloquer. Mais malgré plusieurs échanges de mails, Google semblait s’en tenir à sa règle automatique de 1870 et refusait paradoxalement de reconnaître qu’il avait le droit de diffuser ces livres ! Voyez la réponse que Bowatz avait bien voulu poster sur S.I.Lex :

Nous préférons nous montrer très prudents. C’est pourquoi nous diffusons uniquement de courts extraits jusqu’à ce que nous parvenions à déterminer si un livre est protégé ou non par des droits d’auteur.

Nous recherchons actuellement des solutions pour augmenter le nombre d’ouvrages consultables dans leur intégralité dans le monde entier. Notez que certains titres pouvant être téléchargés au format PDF dans certains pays peuvent ne pas l’être dans d’autres, selon la législation locale en matière de droits d’auteur. Notre objectif est de rendre Google Livres aussi utile que possible, ce qui signifie que nous intégrons un maximum d’ouvrages au lieu d’attendre d’avoir pu déterminer avec précision leur statut.

Seuls les livres relevant du domaine public (livres pour lesquels les droits d’auteur sont arrivés à expiration) peuvent être téléchargés. Pour les internautes se trouvant aux États-Unis, il s’agit en principe de tous les livres publiés avant 1923. Dans les autres pays, nous déterminons la date appropriée en fonction de la législation locale.
Comme pour toutes les décisions relatives au contenu de Google Livres, nous adoptons une attitude prudente tant dans la lecture de la loi sur les droits d’auteur que sur les faits connus concernant un livre donné. Cette fonctionnalité n’est pas disponible pour les livres sous droits d’auteur. Google respecte et protège en effet les droits d’auteur de tous les éditeurs.

Google ne partage pas les livres sous droits d’auteur. Notez que les ouvrages relevant du domaine public ne sont pas encore tous dotés de l’option « Télécharger ».

Nous travaillons actuellement à l’ajout de ce bouton sur tous ces ouvrages. Nous vous remercions de votre patience.

C’est alors qu’un autre lecteur de S.I.Lex, Bernard Majour, suggéra judicieusement d’aller demander aux bibliothèques partenaires de Google, qui ne devaient pas manquer d’avoir reçu un exemplaire numérisé. Bowatz identifia que les ouvrages de son arrière-grand père provenaient d’Havard et de Michigan, et il adressa à nouveau sa demande d’accès aux deux bibliothèques. De manière surprenante, le même principe de précaution lui fut opposé :

Réponse de Michigan (qui gère le Hathi Trust, l’entrepôt géant dans lequel les bibliothèques partenaires de Google déposent leurs copies) :

So the unfortunate news that I need to give you then is that for persons accessing works in HathiTrust from outside the US, we are only providing full text access to works published prior to 1870. We realize this is not ideal, but at this point we aren’t able to make individual determinations of copyright status of non-US works based on author death dates/on a country-by-country basis. We are hopeful that as the project progresses we will be able to revise this policy and/or do individual determinations on foreign works, but at this point we don’t have the staffing/expertise to do so. Google makes their own determinations about copyright status, but they use this same criteria. My understanding is that it is a blanket « safe » year/amount of time before which all foreign works are likely to be safely in the public domain.

Réponse d’Havard :

Depending on your location, definitely if you are within the U.S., you can download pdf files from Google Books directly, or via the HOLLIS Catalog. I believe the end results are the same.

Même en apportant la preuve que l’auteur était bien décédé depuis 70 ans, Bowatz ne pouvait pas obtenir accès à l’ouvrage de son arrière-grand père, alors qu’il aurait pu le faire s’il avait été aux Etats-Unis… Mais finalement, celui-ci ne se laissa pas démonter, et via un proxy américain, il réussit à berner Google Book et à télécharger les ouvrages tant désirés (ce qui au passage en dit long sur la fiabilité des protections mises en place par Google…).

Édifiant, non ?

Gestion des droits : à quand le deus ex machina ?

Les choses auraient peut-être été un peu différentes, si Bowatz avait cherché aujourd’hui à accéder à ces ouvrage. Il aurait tout d’abord pu fournir les informations dont il disposait à Google par le biais du forum et peut-être aurait-il eu gain de cause (cela vaudrait la peine d’essayer, pour voir). On également appris récemment que l’Université du Michigan avait lancé un système de gestion des droits, qui servira à établir des diagnostics automatiques du statut juridique des ouvrages dans Hathi Trust (CRMS : Copyright review Management System).

En Europe, c’est normalement le projet ARROW qui devrait servir à mettre en place une architecture de gestion des droits à l’échelle des pays de l’Union. Des progrès ont visiblement été accomplis la semaine dernière, avec la remise de documents d’étape importants à la Commission européenne, mais les résultats concrets se font toujours quelque peu attendre.

Sinon en France, il paraît que 750 millions d’euros devraient être consacrés à la numérisation du patrimoine culturel dans le cadre du grand emprunt. J’espère que quelqu’un a songé à proposer qu’une partie de cet argent finance la création d’un Registre du domaine public français, qui permettrait de tracer les contours juridiques de notre patrimoine.

Non, personne ? Il me semble pourtant au vu de tout ce qui précède ci-dessus que ce serait diablement utile…

À propos de Lionel Maurel (Calimaq)

Ce blog est tenu par : Calimaq - aka Lionel Maurel Juriste & Bibliothécaire. Contact : calimaq at gmail point com
Cette entrée, publiée dans Uncategorized, est taguée , , , , , . Bookmarquez ce permalien.

4 réponses à Google recherche domaine public désespérément.

  1. Pablo Iriarte dit :

    Bonjour,

    J’ai réalisé il y a quelques semaines que plus de 900’000 livres avaient été extraits à partir de Google Book Search et archivés sur http://www.archive.org. Ce "détournement" des documents du domaine public, scannés par Google à partir des fonds des bibliothèques m’a bien plu car c’est un joli cas d’arroseur arrosé… le même "fair use" évoqué par Google peu alors être utilisé par un autre organisme comme l’internet archive pour se justifier.

    Malgré le fait que les PDFs ne sont pas diffusés par l’archive (il y a toujours un lien sur la version de Google qui pourrait compenser l’abus) le full text est bel et bien proposé dans différents formats au téléchargement et à la consultation en ligne via son propre système.

    Selon la courte explication donné par Internet Archive sur la page http://www.archive.org/details/googlebooks :

    "Digitized books from many different libraries from the Google Book Search program. These digital files have been downloaded from the Google site and uploaded to the Internet Archive by users. While these books may be old enough to be in the public domain, but there is no guarantee by anyone of their legal status. These books have been made text searchable as a finding aid and downloading refers to Google’s site. Please refer to Google’s site for any rights issues or restrictions."

    Ils ont trouvé la parade qui va dans le même sens que celui montré dans ce billet: si les documents ont été extraits par les utilisateurs, cela exclue l’extraction par des moyens automatiques tant redoutée par Google. Cela me paraît très intéressant car, au final, si les utilisateurs se mettent à télécharger en masse les PDF de Google des œuvres du domaine publique, à faire tourner l’OCR dessus et rediffuser sa propre version en texte brut rien ne pourrait les empêcher.

    En regardant de près les 900’000 documents on voit très vite que c’est toujours le même utilisateur qui a fait le boulot, ce qui est encore plus surprenant!! mais tout s’explique quand on lit son code d’utilisateur : "TPB" (les pirates sont encore parmi-nous, hip-hip!)

    J’ai tenté de chercher des explications ou un semblent de partenariat de coté de Google ou ailleur et je n’ai rien trouvé pour le moment, jusqu’à la parution de votre billet qui ajoute une nouvelle lumière et un trou inattendu pour lequel ces documents peuvent retourner dans le domaine public. Le plus drole de l’histoire est que maintenant il y en a de livres pour lesquels la version européenne de Google Books ne donne que des extraits mais on peut le télécharger complètement via Internet Archive car ils ont exploité le texte intégral fourni par la version américaine du moteur, par exemple cette version des travaux de Charles Darwin publié en 1896 : http://www.archive.org/details/charlesdarwinsw03darwgoog qui dépasse la date fatidique de 1870 pour nous, pauvres européens : http://books.google.com/books?id=mOMab91llIMC

    Je me réjouis de voir la réaction de Google (si réaction il y en a…) mais je doute qu’ils tentent quelque chose contre ce détournement car ils attaqueraient le principe fondateur du fair-use qui équivaudrait à se tirer une balle dans le pied. Et finalement ce ne sont que 900’000 livres…

    Merci pour tous ces billets qui éclairent énormément les questions complexes du droit dans le monde mouvant et mouvementé de l’information.

    • calimaq dit :

      Merci beaucoup pour ce commentaire très intéressant ! Vous avez piqué ma curiosité et j’écrirai un autre billet pour mettre en avant votre trouvaille.

  2. Pingback: PabloG

  3. Pingback: Des « Robins des Bois  libèrent les livres de Google Book sur Internet Archive. « :: S.I.Lex ::

Laisser un commentaire - attention en laissant un commentaire sur ce blog, vous acceptez définitivement qu'il soit placé sous la licence CC0.

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s