Quand Wikipédia fait la Polis du droit d’auteur

Il y a quelques jours, un ami attirait mon attention sur le fait quelque peu incongru que l’article Open source de Wikipédia était soupçonné… d’enfreindre un droit d’auteur !

L'article Open Source soupçonné d'enfreindre le droit d'auteur ? Paradoxal, mais aussi très instructif quant à la manière dont la communauté des Wikipédiens s'est organisée pour apporter une réponse à ce type de problèmes. Ici la question qui se pose est de savoir si un extrait intégré à l'article est suffisamment bref pour cadrer avec l'exception de "courte citation" du droit français.

En creusant un peu, on découvre d’autres cas similaires (comme celui-ci – parfaitement de saison ! – qui a été résolu cette semaine) et plus largement, il est très intéressant de voir comment la communauté des wikipédiens s’est organisée et donnée des règles pour trouver des solutions aux problèmes des infractions au droit d’auteur, désignée par le terme de « copyvio » (mot valise dérivé de copyright et violation – voyez le wiktionnaire). C’est un exemple frappant de la manière dont une règle de droit fixée par la loi est « intériorisé » par une communauté d’utilisateurs et intégrée aux rouages de son fonctionnement (et à mon avis, un vrai sujet d’étude pour la sociologie du droit).

La question du plagiat dans Wikipédia peut être sensible et polémique. Nombreuses sont les accusations de pillage lancées à l’encontre de l’encyclopédie collaborative, parfois très virulentes (comme ici ou ). Ce n’est pas sur ce terrain que je souhaite me placer, mais je voudrais plutôt tenter de décrire ces mécanismes de régulation et relever quelques cas qui m’ont paru plus instructifs quant à la façon dont le droit d’auteur est « appliqué » à l’intérieur même du microcosme juridique que constitue Wikipédia.

Comprendre ces mécanismes est certainement une excellente manière de se débarrasser des images d’Epinal qui trop souvent s’attachent à l’encyclopédie. Wikipédia n’est pas un espace de non droit, bien au contraire. Son statut juridique particulier découlant du jeu des licences libres (GFDL et Creative Commons) conditionne complètement son organisation et son fonctionnement. Les réponses apportées au problème du Copyvio manifestent la nécessité pour ce système juridique autonome de s’inscrire dans le cadre légal qui l’englobe et dont il ne saurait s’abstraire.

Il existe de ce fait un véritable « système interne » d’application du droit dans Wikipédia, avec ses propres codes, sa doctrine, presque sa jurisprudence, fonctionnant à côté du système judiciaire institutionnel et j’y vois dans une certaine mesure une forme de « Polis » du droit d’auteur, réponse communautaire à un défi juridique que ne pourrait pas relever à eux seuls les moyens de « police » classique.

De l’importance du copyvio pour Wikipédia

Wikipédia est avant tout une communauté rassemblée autour de 5 grands principes fondateurs, parmi lesquels on trouve celui du caractère libre de l’encyclopédie, de nature essentiellement juridique. De ce principe découle les règles suivantes :

La prévention du copyvio (violation du droit d’auteur) est donc une garantie essentielle de la préservation du caractère libre de l’encyclopédie et de la possibilité pour tous d’en réutiliser les contenus.

Le copyvio fait l’objet de plusieurs définitions et présentations dans l’encyclopédie, qui décrivent en détail la procédure à suivre et notamment :

On peut également retrouver sur une page l’ensemble des pages soupçonnées de violation de copyright, ainsi qu’une archive, très intéressante à consulter, qui rassemblent tous les cas antérieurs. Le Bistrot de Wikipédia, espace de dialogue entre les utilisateurs, est également instructif, car il contient beaucoup de discussions en rapport avec le copyvio et permet de repérer des cas complexes intéressants. On peut aussi trouver des éléments sur Legifer, la page des discussions sur les problèmes juridiques rencontrés au cours de l’utilisation de Wikipédia.

Le copyvio, une question de responsabilité

La violation des règles du droit d’auteur par des utilisateurs de Wikipédia soulève un problème de responsabilité. Depuis 2007, Wikipédia s’est vu reconnaître par les juges français la qualité d’hébergeur au sens de la loi LCEN. Cela signifie schématiquement que la Fondation Wikimédia qui héberge le site sur ses serveurs bénéficie d’un régime de responsabilité allégée lui permettant de n’être tenue responsable qu’au cas où elle n’agit pas promptement pour retirer des contenus manifestement illégaux après en avoir été informée.

En cas de violation des règles du droit d’auteur, ce sont donc les utilisateurs de Wikipédia eux-mêmes commettant des actes de contrefaçon qui sont responsables en première ligne. La responsabilité de la fondation Wikimédia ne peut être engagée que de manière résiduelle.

Cependant, malgré ce régime plutôt favorable, la violation du droit d’auteur, si elle prend des proportions trop massives, peut finir par poser des problèmes graves à Wikipédia. En mars 2006, la déclinaison francophone de Wikiquote, un autre projet de la fondation Wikimédia visant à rassembler des citations, avait ainsi été contraint de fermer pendant plusieurs mois suite à la violation massive d’une base de données. Le projet avait contraint repartir de zéro quelques mois plus tard tellement son contenu avait été « corrompu » par ces éléments protégés.

Le plagiat massif existe aussi dans Wikipédia, au point que des projets spécifiques ont été ouverts pour « nettoyer » les parties de l’encyclopédie les plus touchées (voir ici ou ). On comprend dès lors que des ressources et des procédures aient été mises en place pour permettre à la communauté des utilisateurs de Wikipédia et à ses administrateurs de réguler les problèmes de copyvio. De cette manière, la Fondation Wikimédia n’agit pas directement, ce qui pourrait lui faire perdre son statut d’hébergeur. Et le respect des règles du droit d ‘auteur devient la responsabilité de tous, ce qui n’est peut-être pas un mal, comme nous le verrons plus loin.

Que faire en cas de copyvio ?

De manière schématique, la procédure de régularisation d’un copyvio passe par plusieurs étapes.

Lorsqu’un contenu de l’encyclopédie éveille un soupçon de violation d’un droit d’auteur (on verra plus loin comment ce premier repérage peut s’effectuer), il est identifié comme tel par le biais d’un bandeau particulier apposé en tête de l’article. Cette première opération peut être le fait d’un administrateur de Wikipédia ou d’un simple utilisateur de l’encyclopédie. Une page de discussion est alors ouverte indiquant la personne qui a repéré le copyvio et lui permettant d’indiquer les raisons qui ont éveillé ses soupçons. L’auteur du passage litigieux (qui peut être un utilisateur disposant d’un profil sur Wikipédia ou simplement identifié par le biais de son IP) est alors invité à se manifester pour fournir des explications (une sorte de procédure contradictoire somme toute, voir ici un exemple). Un bandeau « Copieur » peut même être apposée sur sa page personnelle de discussion pour l’inciter à venir se justifier (chose qui peut être assez mal vécue par l’intéressé). Se livrer à des actes de copyvio peut également finir par entraîner des sanctions et notamment le blocage d’un compte appliqué par les administrateurs de Wikipédia.

Le copyvio est une chose sérieuse et les sanctions "sociales" qu'il peut entraîner sont assez dissuasives (plus qu'un courrier de la Hadopi ?).

Au préalable, il est nécessaire de rassembler des preuves pour attester de la réalité de l’infraction au droit d’auteur. En général, il s’agit d’identifier la source qui a été copiée et de la comparer avec le passage de l’encyclopédie en cause. Certains cas relèvent du copier/coller pur et simple, mais les choses peuvent être bien plus complexes et dans toutes les hypothèses, il reste à apprécier s’il y a bien violation ou non d’une règle juridique, avec tous les problèmes d’interprétation que cela peut soulever. En cas de besoin, une autorisation peut être demandée auprès de l’auteur original du passage copié pour régulariser la situation, selon une procédure formalisée. Ces opérations doivent normalement se dérouler en une semaine.

La deuxième semaine, au cas où les soupçons sont confirmés (et seulement dans cette hypothèse, voir ici un exemple), l’article en cause devra soit être réécrit par un volontaire pour faire disparaitre l’infraction, soit toutes les versions problématiques devront être supprimées pour revenir à un état antérieur au copyvio. Ceci explique qu’il est important d’agir vite en cas de soupçon d’infraction, car si des développements ultérieurs sont apportés par d’autres utilisateurs à partir d’une version comportant un vice, il sera parfois nécessaire de les supprimer pour revenir à un état conforme au droit, avec un grande perte de matière pour l’encyclopédie (pour des exemples de « nettoyage difficile », voir ici ou ici). C’est aussi le rôle du bandeau signalant le copyvio d’avertir les utilisateurs de ne pas continuer à développer un article tant que le problème n’est pas réglé. Si les preuves ne sont pas suffisantes pour établir qu’un droit d’auteur a été enfreint ou si le soupçon est dissipé, le bandeau est retiré.

La troisième semaine, au cas où la violation a été établie et l’article modifié en conséquence, il reste encore à effectuer une opération que seuls les administrateurs de Wikipédia peuvent accomplir : purger l’historique de l’article pour faire disparaitre les versions affectées par un copyvio. Sans cela, ces versions pourraient à nouveau être affichées en consultant l’historique et la violation du droit d’auteur persisterait, malgré la modification de l’article.

De l’art de repérer le copyvio

Le repérage des violations au droit d’auteur dans Wikipédia est en soi une question intéressante. Comme le fait remarquer l’utilisateur R dans cette discussion, l’expérience joue un certain rôle :

« L’intuition est la meilleure technique pour détecter les violations de copyright ».

Visiblement, les utilisateurs expérimentés arrivent à repérer « à l’œil » des blocs qui ont été repris ailleurs par copier/coller, car ils présentent des défauts du point de vue de la syntaxe wiki (exemple ici). La section Astuces/Copyvio précise :

« Une copie enfreignant le droit d’auteur est souvent aisément identifiable : une grande quantité de contenu inséré en une seule fois, sans fautes d’orthographe, avec une mise en page inhabituelle pour Wikipédia, des titres et sous titres n’utilisant pas la syntaxe wiki et parfois numérotés, des phrases mal placées et encadrées ».

Parfois c’est une rupture de style dans le ton de l’article qui peut éveiller des soupçons.

Cette première étape de signalement des copyvio est essentiellement réalisée par des humains, mais elle peut être également le fait de robots automatiques qui vont lancer des recherches sur le net et marquer les pages en attendant la confirmation d’un humain.

Confirmer ou infirmer les soupçons de copyvio

La méthode principale pour confirmer un soupçon de copyvio consiste à utiliser un moteur de recherche en copiant le passage litigieux pour vérifier s’il ne figure pas ailleurs sur Internet.

Cette première opération ne suffit pas à elle seule à établir le copyvio. En effet, il arrive souvent que ce ne soit pas un utilisateur qui ait plagié un contenu extérieur, mais… l’inverse. Wikipédia est elle-même largement reprise par d’autres sites (et c’est même l’un de ses buts premiers que d’être librement réutilisable).

Cette reprise de contenus de l’encyclopédie ne facilite cependant pas la tâche de ceux qui cherchent à établir si un copyvio a été commis, car il faut être en mesure d’établir l’antériorité du site extérieur sur la version de l’article de Wikipédia en cause (exemples de cas difficiles ici ou). Pour lever les doutes, les Wikipédiens utilisent la Wayback Machine d’Internet Archive qui permet de fouiller dans les Archives du Web pour établir la date d’apparition d’une page (voir ici, ou ).

Il faut noter que si l’encyclopédie est libre et ses contenus réutilisables (y compris à des fins commerciales), il n’en reste pas moins que la licence de Wikipédia impose le respect d’un certain nombre de conditions (créditer les auteurs de l’article en faisant un lien vers la page d’historique ; indiquer que l’article repris provient de Wikipédia ; faire un lien vers la licence de Wikipédia). Une procédure de copyvio qui permet de repérer qu’un contenu de Wikipédia a été repris à l’extérieur sans respecter ces conditions peut être l’occasion de procéder à un rappel à l’ordre par le biais d’un courrier. Le problème du plagiat se pose dans les deux sens pour Wikipédia et l’actualité récente nous a montré des cas de reprise sauvage des contenus de l’encyclopédie par des médias traditionnels assez surprenants (voir ici ou ).

La vérification d’un copyvio peut être complexe lorsque la copie a été effectuée à partir d’un site internet, mais elle l’est plus encore quand c’est un ouvrage papier qui a été plagié. Le repérage du copyvio est alors plus ardu (exemple de cas identifiés ici, ou ) et la confirmation des doutes peut passer par une vérification en bibliothèque, pour laquelle la communauté s’est organisée afin de mutualiser le résultat des recherches.

Établir la réalité d’un copyvio par rapport à la loi

Une fois qu’il a été établi que le contenu d’un article de Wikipédia a été recopié depuis une source extérieur, il reste encore à déterminer si les règles fixées par le Code de la Propriété Intellectuelle ont bien été enfreintes, et c’est certainement l’étape la plus complexe.

Dans tous les cas, il est nécessaire de vérifier le statut juridique initial du texte repris pour savoir s’il ne permet pas légalement la reprise. Il pourra en être ainsi si le texte qui a été copié appartenait par exemple au domaine public (ce qui peut être difficile à établir) ou s’il était diffusé sous une licence libre compatible avec celle de Wikipédia.

En matière de copyvio, la question juridique qui revient le plus souvent concerne l’application de l’exception de courte citation prévue par le droit français. L’article L.122-5 du CPI indique que :

« Lorsque l’oeuvre a été divulguée, l’auteur ne peut interdire […] :

3° Sous réserve que soient indiqués clairement le nom de l’auteur et la source :

a) Les analyses et courtes citations justifiées par le caractère critique, polémique, pédagogique, scientifique ou d’information de l’oeuvre à laquelle elles sont incorporées ;

Simple en apparence, ces règles peuvent s’avérer à l’usage très délicates à appliquer, notamment parce que la loi ne définit pas avec précision à partir de quand une citation cesse d’être courte. Nombreux sont les cas de copyvio qui donnent lieu à des hésitations et à de longues discussions pour savoir si la reprise d’un contenu cadre avec la brièveté imposée par la loi (voir par exemple ici ou ).

Autre difficulté que l’on oublie trop souvent, les citations pour être légales même lorsqu’elles sont courtes doivent impérativement indiquer le nom de leur auteur (pour respecter le droit moral), ainsi que leur source, et ce sont parfois de telles lacunes qui sont en cause dans un copyvio.Plus rarement, c’est la manière d’utiliser le texte repris qui fait problème, parce qu’elle ne manifeste aucune intention d’illustrer, de critiquer ou d’informer, ce que la loi exige également pour admettre la citation (voir ici).

Mais les choses se compliquent encore lorsque ce ne sont plus seulement des copier/coller qui sont en cause, mais des emprunts plus subtils à des textes impliquant des reformulations ou des modifications plus ou moins importantes. On trébuche alors sur la question redoutable de savoir où s’arrête l’inspiration et où commence le plagiat (voir ici). L’exemple suivant montre que la frontière entre les deux peut être très difficile à établir :

L’article wikipedia est certes fortement inspiré par cette page mais ce n’est pas un simple copier/coller. L’auteur a synthétisé les informations, et, vu le manque de sources sur cet écrivain, c’est plus une question d’admissibilité qui me vient à l’esprit. Pour le copyvio, j’hésite : dans quelle mesure cette synthèse d’infos – maigres, donc forcément proche de la source originale – est-elle une violation du droit d’auteur ? P;ê une simple réecriture des passages qui te semblent trop identiques suffirait, non ? Cdlt. (Lautre02)

La question des limites entre citation et transformation d’un contenu peut aussi se poser lorsqu’un livre est résumé pour constituer le corps d’un article de l’encyclopédie (voir ici).

à mon avis la source est clairement le site http://dspt.club.fr/Holweck.htm. Le lien est d’ailleurs présent dès la création. Mais il ne s’agit ni d’un copié collé, ni d’un plagiat. plutôt d’un résumé. Je ne pense pas qu’on puisse parler de violation de copyright. On peut juste déplorer que l’article soit construit à partir d’une source unique. D’autres avis ? (HB)

La traduction est également un moyen par lequel Wikipédia se développe, les différentes communautés linguistiques traduisant les articles de l'encyclopédie dans leur propre langue. Or la traduction met en cause les droits exclusifs des auteurs et peut poser des problèmes de copyvio (cliquer sur l'image pour un exemple de discussion)

Incertitudes aux frontières du droit d’auteur

Le principe même d’une encyclopédie est de collecter des faits et des informations recueillies à partir de sources secondaires. Cette nécessité de sourcer soigneusement les articles fait même partie des règles fondamentales de Wikipédia et constituent une garantie de la neutralité de point de vue.

Théoriquement, le droit d’auteur ne protège pas les faits bruts, les informations ou les idées, mais seulement leur mise en forme originale. Néanmoins à regarder de près les archives des cas de copyvio, on se rend compte qu’il peut être très difficile de distinguer un plagiat d’une simple reprise d’informations.

Ici, à propos de l’article Pecari à collier, se pose la question de savoir si la reprise d’informations ou de faits comme la durée de vie, la taille de la portée, etc à partir d’une source relève ou non du plagiat. L’article Expressions marseillaises donne lieu à une discussion intéressante sur le fait de savoir si les expressions d’un langage peuvent faire l’objet d’une protection par le droit d’auteur lorsqu’elles sont décrites dans un dictionnaire. A propos de l’article Droit de la Guerre, une discussion assez vive a lieu pour déterminer jusqu’à quel point les idées de Grotius ou Puffendorf peuvent être reprises, lorsqu’elles sont commentées dans des sources secondaires :

il faudrait peut-être distinguer entre un article original qui présenterait une analyse inédite, ayant un auteur, et relevant des droits d’auteurs, à distinguer donc des textes du genre présentation d’un organisme , qui lui-même recopie des bouts d’histoires du droit ou / et de textes de droit /et d’histoire écrite précédemment par les philosophes ou les historiens et qui constituent des connaissances de notoriété publique. Grotius, Rousseau, Les Conventions de Genève n’appartiennent à personne et sont simplement tellement connus et tellement souvent cités que chacun peut s’y reconnaître mais serait mal fondé de se les approprier et de s’en prétendre l’auteur (La glaneuse)

Les listes constituent également un type de contenus qui soulèvent manifestement des problèmes juridiques particuliers en cas de reprise dans Wikipédia (voir cette discussion au Bistrot). Les faits qui sont listés ne peuvent pas être protégés en eux-mêmes, mais la présentation générale de la liste, la formulation, l’ordre, etc peuvent offrir prise à la protection par le droit d’auteur et une liste conséquente pourrait également être couverte par le droit des bases de données. Avec à la clé beaucoup d’incertitudes comme le montre cette discussion à propos de la reprise sous forme d’article dans Wikipédia de la liste des passagers du Titanic, tirée d’une encyclopédie, finalement considérée comme un copyvio.

Régulariser les problèmes de copyvio

La suppression des versions d’un article affectées par un copyvio constitue une sorte d’ultime recours pour éviter l’infraction, mais il existe d’autres moyens de régulariser une situation de copyvio.

Il est possible notamment de contacter l’auteur du contenu repris pour lui demander l’autorisation explicite d’intégrer son texte à l’encyclopédie (exemples de régularisations opérées par ce biais ici ou ). Une procédure particulière a même été formalisée de façon à ce que le consentement exprimé par l’auteur soit bien valide (et comporte l’acceptation de placer son apport sous la licence particulière de Wikipédia). Des courriers type sont prévus et un système de délivrance de tickets (OTRS – Open source Ticket Request System) permet de gérer automatiquement les licences obtenues. Si l’auteur ne peut pas être contacté ou ne répond pas, la situation ne peut pas être régularisée et la version de l’article doit être supprimée (cas proche de celui des oeuvres orphelines, voir ici). Ces demandes peuvent aussi aboutir au résultat que l’auteur accepte de faire passer son site sous licence libre afin de permettre légalement la reprise (comme ici).

Dans certains cas, il s’avère que le wikipédien soupçonné d’avoir commis un copyvio en reprenant un texte déjà publié s’avère être en définitive lui-même l’auteur de cette oeuvre qu’il a sciemment choisi d’intégrer à l’encyclopédie (voyez ici ou). On pourrait penser que les choses sont alors simples, puisque l’auteur en écrivant l’article parait ipso facto accepter la publication dans Wikipédia. Mais là aussi une procédure spéciale a été mise en place dite de republication qui permet de s’assurer que l’auteur dispose bien des droits sur son texte et qu’il accepte de le placer sous la licence libre de Wikipédia.

Une autre manière de régulariser une situation de copyvio peut tout simplement consister à réécrire le passage problématique de manière à conserver les éléments d’informations importants tout en changeant la formulation. Ce moyen permet de « sauver » l’article, mais il peut impliquer un travail long et complexe. Certains wikipédiens préfèrent traduire des articles issus d’une version étrangère de Wikipédia pour remplacer les passages mis en cause et menacés de suppression (voir ici ou ).

Le copyvio et le projet encyclopédique de Wikipédia

En se plongeant dans les archives du bistrot de Wikipédia, on tombe sur des discussions assez surréalistes à propos du copyvio. Ici un wikipédien remarque que l’article Belfort de l’encyclopédie contient des passages très largement repris de l’article Besançon et se demande s’il ne se produit pas une sorte de copyvio « interne », résultant de la reprise d’une page par une autre. La question n’est pas seulement théorique puisque si la réutilisation des contenus de Wikipédia est libre, elle implique que les contributeurs des pages soient cités en établissant un lien vers l’historique des articles pour respecter leur droit moral. Or si un wikipédien se contente de recopier le contenu d ‘un article dans un autre, il ne respecte pas cet exigence et provoque une sorte de plagiat… endogène !

Dans cette autre discussion, on parle d’un cas surréaliste dans lequel :

un utilisateur copie lui-même ses propres livres sur WP puis change d’avis, efface tout et vient nous accuser de ne pas respecter les droits d’auteurs parce qu’on reverte ses blanchiments non justifiés dans la partie « résumé ». (El Caro)

Et un wikipédien se demande :

si on copie une partie d’un article que l’on a soi-même écrite au sein d’un autre article, peut-on entamer des poursuites contre nous-même ? (Giovanni-P)

Wikipédia serait-elle en train de devenir une Polis du droit d'auteur ?

Plus sérieusement, on trouve des discussions passionnantes à propos du copyvio qui agitent la communauté des wikipédiens et qui touchent au coeur même du projet encyclopédique qui l’anime (voyez ici ou ).

Les règles de fonctionnement de Wikipédia la place certainement dans une position délicate vis-à-vis du droit d’auteur. L’un des principes constitutifs de Wikipédia est de ne pas admettre en son sein de travaux inédits. Ce critère d’admissibilité des articles garantit que les contenus de Wikipédia s’appuie bien sur des sources qui en assurent la vérifiabilité.

Dès lors, on comprend que la citation joue un rôle essentiel dans la rédaction des articles et que la reprise des contenus extérieurs, souvent dénoncée comme un pillage, est une nécessité inscrite au coeur même du projet encyclopédique de Wikipédia. Il est normal en ce sens que le copyvio fasse débat au sein de la communauté, car de sa définition dépend la capacité de Wikipédia à « s’arrimer » légalement aux sources extérieures qui en forment la substance. Voyez par exemple cette réflexion de Deansfa à propos d’un problème de copyvio sur un article de qualité (AdQ) :

Tout travail encyclopédique ne doit nullement être un travail personnel mais bien un travail de synthétisation de travaux déja existant, reformulés, compilés. Le troisième exemple que tu nous fournis (dans la page de violation de copyright) ne semble d’ailleurs pas constituer une violation de copyright mais une formulation différentes de travaux existants, et ceci, me semble-t-il, ne semble pas relever de la violation de copyright, puisque de plus cette formulation s’appuie sur la source de base. Bref, tout article de qualité s’appuie sur des ouvrages existants, relevant parfois du copyright, ceci est une condition sine qua non pour leur passage en AdQ. Le fait que tous les passages de l’article de la Tour Eiffel soient des compilations et des reformulations de travaux existants (copyrightés ou non) est donc quelque chose de totalement normal et indispensable.

Certains déplorent d’ailleurs la tendance à concevoir le copyvio d’une manière trop stricte qui pourrait bloquer la possibilité de sourcer convenablement les articles de l’encyclopédie.

Il faut en effet raison garder: un auteur n’a pas déposé un copyright sur les mots qu’il utilise. Quelqu’un disait quelque part: « Pour ce qui est de la copie de texte, à partir du moment où on copie, il y a copyvio. Qu’il s’agisse d’une phrase, de deux ou d’un texte entier, accepter cela c’est accepter le pillage des auteurs. » Le raisonnement semble pertinent, mais il est absurde. La même personne ajoutait: « Et où s’arrêterait la limite? ». Je répondrai qu’on ne saurait mieux dire. Où en effet? Pourquoi limiter la protection à une phrase? Tout groupe de mots devrait être digne de la même protection, donc même par exemple deux mots ? (Asavaa)

Mais d’autres au contraire mettent en garde contre l’abus des citations qui peut dénaturer tout autant les articles de Wikipédia :

un article encyclopédique ne peut pas être un recueil de citations brutes, démuni d’analyses, d’explications et de critiques. (Agrafian)

À vue de nez, facilement 9 citations sur 10 présentes dans Wikipédia ne sont pas justifiées. Les citations sont certes autorisées, mais ça ne veut pas dire qu’elles sont souhaitables. Les seules citations que je trouve acceptables sont celles situées en notes, comme justification d’une information encyclopédique sur ce que truc ou machin a dit. (Arnaudus)

Je serais d’avis de limiter au maximum les citations dans le texte des articles de Wikipédia. Une citation n’est pas un travail de synthèse encyclopédique, et je pense que l’article en question est typiquement un exemple de mauvaise citation. 1) Elle est trop longue, 2) Elle ne correspond pas vraiment à l’esprit du droit de citation (pas d’analyse), 3) Elle se substitue à une analyse encyclopédique.

Ces réflexions nous montrent que le copyvio touche à quelque chose de plus fondamental que le simple respect de la règle de droit. Derrière la question du plagiat, c’est le problème de la méthode de production du savoir encyclopédique à partir des sources qui est posée. Le plagiat ne résulte pas tant d’une volonté de piller que d’une difficulté à synthétiser et à reformuler les apports extérieurs pour les fondre dans le « style encyclopédique » de Wikipédia.

Et il est très intéressant de relever que la discussion sur le copyvio a débouché sur le projet de créer un guide méthodologique « Rédiger sans plagier » à l’attention des membres de la communauté.

Bien sûr, il ne s’agit pas de tomber dans l’angélisme. Le phénomène de plagiat existe dans Wikipédia : il suffit de regarder les archives du copyvio pour en avoir une idée et l’on ne peut s’empêcher de penser que ces cas ne constituent certainement qu’une partie des violations qui ont été repérées par les utilisateurs et les administrateurs de l’encyclopédie.

Néanmoins, les procédures mises en place pour remédier au problème du copyvio sont remarquables, peut-être autant par les débats qu’elle suscitent dans la communauté que par leurs résultats.

J’y vois une sorte de « Polis du droit d’auteur » dans laquelle les utilisateurs se réapproprient pleinement les règles juridiques au lieu de les ignorer ou de les subir passivement. Et ce nouveau rapport à la règle me parait infiniment plus sain, constructif et citoyen que les tartufferies gouvernementales qui ne raisonnent qu’en terme de répression et de « police du droit d’auteur ».

PS : Grand merci à tezo74 qui m’a donné l’idée d’écrire ce billet !




22 réflexions sur “Quand Wikipédia fait la Polis du droit d’auteur

  1. Excellent article qui m’a fait découvrir les coulisses de Wikipédia que je ne soupçonnais même pas. Le principe de l’autorégulation (d’autres diraient une « main invisible »…) semble être en place et ne fait que renforcer chez moi le sentiment que Wikipédia a une légitimité qui devient aussi grande que celle d’Universalis (plusieurs enquêtes ont, de toute façon, montré un taux d’erreurs identique entre Wikipédia et les encyclopédies papiers).

    Une question qui me vient à l’esprit serait de savoir si dans la version américaine, la plus fournie, il existe un système de contrôle identique ou si ce que tu viens de décrire est une création de la communauté française.

    1. Ce n’est pas une version américaine, mais une version anglophone. De la même manière que c’est la Wikipédia francophone dont on parle ici. La version anglophone utilise un système similaire d’autorégulation.

    2. Merci à Otourly pour la correction sur « anglophone ».

      Sinon, eh bien en règle générale, les anglophones ont même presque toujours un temps d’avance sur nous dans les procédures. Et en fait, maintenant que j’y pense, j’ai déjà fait supprimer de la version anglophone une page sur une série de romans, qui ne faisait que recopier les résumés d’Amazon.

  2. @Ludovic : il n’y a pas d’autorégulation sur Wikipedia mais un système complexe de règles et de procédures, de hiérarchies et de responsabilités. Certes le système est ouvert à tous mais il ne s’est pas créé tout seul ni spontanément.

    Voilà un autre article plus généraliste en complément de celui là:
    http://www.monde-diplomatique.fr/2009/04/O_NEIL/16985

  3. Très intéressante, cette étude en profondeur du copyvio sur Wikipédia. Je me suis permis de la citer sur le bistro de WP : http://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Le_Bistro/3_janvier_2010#Wikipedia_et_le_plagiat

    Une seule petite remarque : les sites que vous donnez en lien dans le 2e paragraphe (Nature & Culture, Alithia etc) ne sont malheureusement pas des sites « sérieux » et faisant une analyse indépendante et fiable sur le sujet. Je dirais plutôt que ce sont des lieux d’exutoire pour déçus de Wikipédia.

    Pour le reste, je vous remercie de cette étude vraiment approfondie et juste, qui montre que si la question du plagiat et de la violation de droits d’auteurs est bien réelle et problématique sur Wikipédia, elle a donné lieu à réflexion et à la création d’outils et de procédures pour y remédier, parce que la question du droit d’auteur est fondamentale quand on veut produire du contenu librement diffusable et réutilisable.

  4. @Ludovic, vous dites « plusieurs enquêtes ont, de toute façon, montré un taux d’erreurs identique entre Wikipédia et les encyclopédies papiers ».

    On connaît effectivement la comparaison faite il y a quelques années par le magazine Nature et l’Encyclopaedia Britannica, comparaison qui concernait une quarantaine d’articles scientifiques.

    Je serais très intéressé de savoir quelles autres enquêtes il y a eues, puisque vous parlez de plusieurs enquêtes. Y a -t-il eu aussi des comparatifs entre Wikipédia et d’autres encyclopédies françaises ?

    Jusqu’à présent je n’en ai pas vu d’autres, mais comme vous affirmez que que de telles enquêtes existent, on doit bien les trouvez quelque part, non ?

    A moins que vous affirmiez sans savoir…

    Des compléments d’informations seraient les bienvenus. Car comme on aime à dire sur wikipédia, il faudrait « sourcer » vos propos :-)

      1. Pour les étudiants de Pierre Assouline à Sciences-Po, ça n’était pas réellement une étude comparative. Plutôt une réflexion sur la notion d’encyclopédie et les processus d’édition sur Wikipédia, doublés d’ « expérimentations » douteuses (insertion de fausses informations dans WP pour voir en combien de temps elles seraient enlevées) qui ont mené, un temps, au blocage en écriture de l’institution sur Wikipédia pour vandalisme…

        Pas très glorieux donc.

        Sinon, il n’y a en effet pas réellement eu de comparaison, en France, entre Wikipédia et une autre encyclopédie de référence. Ceci dit, les objectifs et modes d’élaboration d’encyclopédie comme l’Universalis, par exemple, sont tellement éloignés de ceux de Wikipédia que je ne suis pas sûre que la comparaison soit réellement pertinente.

        À titre plus « léger », clubic.com a fait il y a quelques mois un comparatif de 6 encyclopédies en ligne, où Wikipédia sort plutôt bien : http://www.clubic.com/article-303120-1-comparatif-encyclopedies-ligne.html

        Mais on s’éloigne du sujet du billet de Calimaq, là :-)

  5. Lorsque vous dîtes que Wikipedia auto-régule ses pratiques pour éviter le plagiat, c’est une affirmation contredite par deux sites que vous citez, deux sites faits par des professeurs le site d’Alithia http://wikipedia.un.mythe.over-blog.com/article-34593983.html, qui montre qu’à Wikipedia on préfère piller en faisant de la paraphrase et du plagiat plutôt que reprendre des textes rédigés par des auteurs avec leur autorisation ou des textes rédigés par des auteurs pour Wikipédia, et le site musicologie.com http://www.musicologie.org/Biographies/a/adam_plagiat_wikipedia.html qui a vu nombreuses de ses pages pillées et à Wikipédia on a refusé de les retirer, site fait par un professeur qui rappelle que pour ce genre de faits les étudiants sont sanctionnés.
    Ce qui est dit là invalide vos affirmations.

    Deux professeurs et Serein dit que ce ne sont pas des sites sérieux.
    C’est Serein responsable haut gradée de Wikipédia qui n’est pas sérieuse.

    1. Bonjour à toutes les personnes qui ont laissé des commentaires sous ce billet.

      C’est la première fois dans S.I.Lex que je suis obligé de faire une telle intervention, mais après tout, je suis ici chez moi et je n’ai aucune envie que mon blog devienne une foire d’empoigne ! J’offre l’hospitalité depuis toujours à tout ceux qui veulent partager mes réflexions et contribuer à faire avancer le débat (ils sont nombreux et on ne dira jamais assez l’importance des commentaires dans la vie d’un blog).

      Mais cela ne m’oblige pas à accepter n’importe quoi.

      J’ai passé deux semaines dans Wikipédia à éplucher les archives du copyvio. Ce fut un travail certes passionnant, mais complexe et fastidieux. Mon intention était avant tout de faire oeuvre utile et de faire découvrir un aspect, je pense méconnu, du fonctionnement de Wikipédia. J’ai beaucoup appris en faisant cela.

      Je pense avoir fait preuve de modération dans la manière dont j’ai présenté les résultats de cette investigation. J’ai bien dit qu’il ne fallait pas tomber d’ans l’angélisme : du plagiat dans Wikipédia, certes il y en a. Mais les mécanismes de régulation existent aussi.

      Et je persiste à penser qu’ils doivent retenir notre attention, car c’est l’un des premiers exemples d’une communauté d’utilisateurs qui s’organisent pour « intégrer » une règle de droit extérieure.

      En ce sens, je dirais que cela manifeste un premier stade d’institutionnalisation d’une communauté 2.0, dans lequel le droit a un rôle particulier à jouer. A mon avis, l’avenir donnera d’autres exemples de phénomènes de ce type, à mesure que les réseaux sociaux évolueront.

      Si vous voulez discuter de cela, dans un esprit constructif, les commentaires de ce billet vous sont ouverts. Jusqu’à présent, je ne crois pas avoir bloqué aucun commentaire au titre de mon droit à la modération découlant de mon statut d’éditeur de ce service en ligne (loi LCEN, etc…).

      Mais honnêtement, si c’est pour retomber dans ces débats stériles et vite agressifs sur Wikipédia, cela ne m’intéresse pas. C’est fatiguant et cela ne fait pas avancer le débat d’un millimètre.

      Je précise que cela ne me dissuadera pas de m’intéresser et d’écrire à nouveau sur Wikipédia, dont je suis l’évolution depuis longtemps et qui apporte beaucoup à ma réflexion sur l’évolution du droit.

      A bon entendeur pour tout ceux qui laisseront des commentaires sous ce billet !

      Petite citation de Mallarmé pour finir :

      Mais hélas ! Ici-bas est maître : sa hantise
      Vient m’écœurer parfois jusqu’en cet abri sûr,
      Et le vomissement impur de la Bêtise
      Me force à me boucher le nez devant l’azur.

      1. Calimaq, j’apprécie énormément votre blog et le très beau travail que vous faites. Excusez moi si j’ai pu provoquer des réactions peu appréciables. N’hésitez pas à supprimer mes commentaires s’il le faut.

        1. Bonjour Serein,

          Je ne pense que vous ayez provoqué ces réactions par vos commentaires. C’est juste que le sujet de Wikipédia reste « à vif », pour des raisons qui parfois m’échappent un peu. Et c’est d’ailleurs justement pour cela que j’ai voulu écrire ce billet : pour essayer de déplacer un peu l’angle d’attaque et d’aborder d’autres thèmes.

          Je viens de tomber sur cette analyse de Pierre Mounier (du CLEO) issue des actes du forum de la SGDL « La Révolution numérique de l’auteur« , qui me paraît très pertinente :

          En fait, on s’intéresse trop et pas assez à Wikipedia : on insiste beaucoup sur ce phénomène mais peu sur ce qu’il a d’intéressant : non pas la qualité des textes, ni l’organisation intellectuelle du site, mais la machinerie politique qui se trouve au cœur de son fonctionnement, c’est-à-dire par exemple la manière dont sont résolus les conflits d’édition, la manière dont l’action des différents auteurs est organisée, la manière dont les textes qu’ils ont écrits sont transformés, « wikifiés », automatiquement par des robots. J’ai édité sur un site que j’anime, Homo-numericus, le mémoire d’un étudiant en sciences politiques à propos de cette machinerie politique. Je peux vous assurer que Wikipedia est un exemple du fait que, dans le cyberespace, les collectifs ne sont jamais des magmas, que les rapports entre les hypers individus et les contenus qu’ils coproduisent à travers des plates-formes sont déterminés par des dispositifs techno politiques qui organise des relations de pouvoir.

          Je pense que le copyvio est un bon exemple de cette machinerie politique interne à Wikipédia, et il n’est pas si étonnant que le droit serve de support à de telles pratiques.

          Pour le reste, je ne supprime aucun commentaire et vous être la bienvenue sur S.I.Lex.

          Cordialement,

          Calimaq

          1. Il y a en effet énormément à dire sur le fonctionnement de Wikipédia, et notamment sur tout son côté « créateur de procédures ». Pour ma part, c’est par Wikipédia (et plus généralement les projets Wikimedia) que je me suis intéressée à la notion de droit d’auteur et donc à tout ce qui concerne la culture libre. Je suis persuadée que Wikipédia contribue fortement à faire naître de nouveaux usages autour du droit d’auteur. Voir par ex. les procédures de republication sous licence libre de contenu ou d’images. Petit à petit, nous arrivons à peaufiner notre discours et à voir ce type de republication, et surtout à diffuser cela hors de Wikipédia. La route est encore longue mais ça me semble aller dans le bon sens. Et là, l’influence de la « communauté » (vaste sujet) est fondamentale : c’est par le fait que, par exemple, la question du plagiat et de la violation de droit d’auteur est « sévèrement » traitée que petit à petit la notion de contenu libre se diffuse. L’intransigeance comme moyen d’avancer, avec tous ses aspects parfois pénibles et bureaucratiques, mais c’est ainsi qu’on peut garantir un contenu libre.

  6. Bonjour,
    Un petit complément pour nuancer le « sérieux » de la blogueuse Alithia.

    Une étude universitaire sur wikipedia :http://doc-iep.univ-lyon2.fr/Ressources/Documents/Etudiants/Memoires/Masters/Sociopo/prothais_d/prothais_d.pdf

    L’auteur étudie les possibles dérives de wp telles qu’elles sont dénoncées par Alithia. De là, il montre comment se fait le consensus sur wp et précise que le consensus et les débats sont les mêmes que ceux qui animent le débat scientifique. Il précise donc en note 174 : « Cette précaution nous semble indispensable pour nuancer les thèses à tendance conspirationniste que développent certaines personnes à l’égard de Wikipédia, comme le blog « Observatoire de Wikipédia » tenu par l’utilisateur Alithia, qui conclut à la présence de groupes révisionnistes, de propagande islamiste, etc (voir 1.1.4) »

    Alithia, qui se flatte d’être scientifique et en donne des gages qu’une lecture un peu hâtive permet de prendre au sérieux, quand elle est réellement étudiée par des universitaires elle est ramenée à ce qu’elle est une « conspirationniste ». Charmante boucle…

    ++

      1. Alithia fait encore du google rank en donnant des liens vers son site. On va la suivre mais c’est pénible car mal écrit et noyé dans une logorrhée de termes abscons et de sophismes pédants.

        Suivons donc le premier lien. Prise la main dans le sac elle dénie. Elle n’avait pas lu ou pas vu (elle lit souvent avec un ventilateur faut dire). Soit ! Mais que fait-elle ? elle insulte l’auteur (et les profs qui l’ont relus).

        Suivons ce lien où on a à la fois la démonstration de sa logique conspirationniste et à la fois la démonstration de ses méthodes d’analyse.

        Alithia sur le premier lien :
        « Ce malheureux étudiant , qui ne doit pas savoir lire et ne comprend pas ce qu’il lit, écrit absolument n’importe quoi.  »

        ou encore « je dénonce précisément et cela figure même dans le texte de ce petit étudiant puisqu’il cite le Réseau Voltaire, haut lieu de complotisme mondialement connu- et autres rédactions partisanes indignes d’une encyclopédie »
        —> ce qui est faux par ailleurs : il cite le réseau voltaire pour montrer comment il se fait contrer et non pas comment il fait sa promo. Une déformation dont est habituée Alithia.

        l’insulte « Si cet étudiant savait lire -mais je commence maintenant à m’interroger sur sa rigueur et même peut-être son honnêteté- »
        —> Elle n’attaque pas sur le fond mais sur la personne. Personne à qui elle attribue au mieux des pensées et intention malveillantes au pire une incompétence.
        Elle l’insulte par le biais de l’amalgame conformément à son schéma de pensée binaire : il la critique DONC il est WP DONC elle le réduit en cela à tous les poncifs qu’elle énumère. Pure illusion rhétorique sans fondement scientifique.

        Plus loin, du pur complotisme de la part de son plus grand fan Altshift (ou adepte tant Alithia est sectaire et qu’elle se veut en gourou de la vérité). Vous allez me dire : « oui, mais ce n’est pas Alithia ». Soit ! mais elle le laisse passer systématiquement quand elle censure toutes les opinions divergentes. Ce n’est pas anodin.
        Altshift dans toute sa splendeur :
        « Il n’est pas impossible que cet étudiant n’existe absolument et soit seulement un élément la solde de wikimédia et consorts, prêt à rédiger de faux témoignages à la demande.  »
        –> idée conspirationniste. Alithia victime d’un complot…

        Au reste, elle surenchérit plus loin :
        Alithia : « Cet étudiant est vraisemblablement un wikipédien (militant de sa cause)… »

        Bref, elle tient un blog anonyme qui décrit un monde manichéen peuplé de pro et d’anti WP. Du pur complotisme.

        Par ailleurs, si elle se dit prof de philo c’est pour se donner de la contenance, contenance qui fait bien défaut dans son blog mal écrit, et de là à en déduire que le titre est usurpé…

        Bien cordialement

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.