Open Law : un modèle exemplaire de partenariat Public-Privé-Communs

L’introduction des « Communs informationnels » en tant que nouvelle catégorie juridique dans la loi française n’a pas été retenue par les députés la semaine dernière, à l’occasion de l’examen de la loi Lemaire. Néanmoins cette loi aura tout de même un effet puissant de promotion des Communs, notamment grâce à ses dispositions instaurant un principe d’Open Data « par défaut ». Aussi bien au niveau national que local, un nombre important de nouveaux jeux de données devraient être libérés en ligne dans les mois qui suivront l’entrée en vigueur du texte. En soi, l’ouverture des informations publiques constitue pour les personnes publiques un manière de « contribuer aux Communs », dans la mesure où cette démarche élargit les droits d’usage sur les données mises en partage.

Cependant, l’existence de jeux de données réutilisables n’est pas en elle-même suffisante pour constituer des Communs, au sens propre du terme. Il n’en sera ainsi que si des communautés réelles apparaissent et se structurent autour des données ouvertes pour les réutiliser effectivement, assurer leur enrichissement et participer à leur gouvernance. Jusqu’à présent, si le mouvement d’ouverture des données publiques a bien progressé en France, on peut dire que ce sont à propos de ces derniers points que la dynamique d’Open Data pêche encore assez largement.

« Open Law – Le droit ouvert » constitue une initiative qui montre une voie pour associer acteurs publics, entreprises privées et  société civile autour de données ouvertes dans le but explicite de produire de nouveaux communs. Elle constitue un modèle de ce que l’on pourrait appeler un « Partenariat Public-Privé-Communs », dont la vidéo ci-dessous vous présente les grandes lignes :

Le secteur de l’information juridique en voie de recomposition

Le champ d’intervention du projet Open Law est celui de l’information juridique. Ce domaine a connu de profonds bouleversements ces dernières années avec l’ouverture en Open Data des grandes bases de données de législation et de jurisprudence. Jusqu’alors ces éléments clés n’étaient réutilisables qu’à la condition de s’acquitter d’une redevance versée à la DILA (Direction de l’Information Légale et Administrative), administration centrale rattachée aux services du Premier Ministre. Cette situation faisait que ces données étaient en pratique réservées à un groupe d’éditeurs juridiques (Lexis Nexis, Dalloz, Lextenso, etc.), qui s’en servaient pour proposer des bases de données sous forme de produits commerciaux.

Avec le passage en Open Data des mêmes jeux de données, les différents acteurs de ce champ doivent se repositionner. Le « coût d’entrée » sur ce secteur de l’information juridique a été fortement abaissé, ce qui permettra à davantage de petits acteurs innovants de l’investir. L’acteur public conserve une position centrale en matière de production des jeux de données essentiels de l’information juridique, mais la possibilité pour des entreprises, des associations ou de simples citoyens de contribuer est dorénavant largement plus ouverte.

Open Law, une démarche de coopération pour la création des « Communs du droit »

Dans ce nouveau contexte, l’initiative Open Law a été lancée sous la forme d’une association pour fédérer ces partenaires publics et privés autour d’une dynamique de coopération. L’originalité principale de la démarche consiste à favoriser la production de « Communs du droit », visant à faciliter la réutilisation des informations juridiques et à exprimer leur plein potentiel :

Rendus possibles par l’ouverture des données juridiques, les communs sont construits, enrichis, gouvernés et maintenus au bénéfice de tous par des communautés d’acteurs.

Ils nourrissent l’innovation et servent de socles au développement de services innovants, par les entreprises et par la société civile.

Open Law Europa a permis l’émergence et la conception de 5 nouveaux communs pour le droit ouvert, dont la construction se poursuivra au fil des prochains mois.

Ces 5 Communs du droit sont les suivants :

  1. HUB : un catalogue des ressources juridiques librement accessibles en France et à l’étranger, placé en Open Access et construits de manière collaborative ;
  2. PARIS : une norme permettant l’identification des sources du droit à l’échelle européenne par le biais d’un standard unique, ouvert et pérenne d’URI ;
  3. CORE : une ontologie visant à permettre le traitement automatisé des données juridiques et leur inscription dans le web de données ;
  4. CROWD : des interfaces web pour l’annotation collaborative des textes juridiques, au moyen de mots-clés et de vocabulaires contrôlés ;
  5. SOCLE : une suite logicielle Open Source pour le droit ouvert.

Comme on le voit, ces Communs constituent en réalité des standards, des normes, des inventaires, des logiciels qui forment les « briques de base » indispensables à la construction d’un « Réseau de données liées ouvertes et exploitables par tous », que ce soit dans un but commercial ou non.

Financer le développement d’une infrastructure commune

Il est clair que l’utilité de cette couche d’enrichissement construite au-dessus des jeux de données en Open Data ne peut être optimale que si elle est elle-même ouverte. Même les acteurs commerciaux ont intérêt par exemple à ce qu’un standard émerge pour pouvoir désigner les ressources juridiques par le biais d’identifiants contrôlés ou à ce qu’une ontologie du droit soit mise en place pour pouvoir investir le web de données.

Mais pour que ces ressources communes existent, il est nécessaire de consentir des investissements financiers, techniques et humains, qui peuvent s’avérer conséquents. L’acteur public n’en a pas forcément les moyens, en plus de la production des données de base qui lui incombe. Les acteurs privés n’ont de leur côté pas naturellement intérêt à le faire, s’ils restent dans leur logique traditionnelle de compétition, car cela reviendrait à produire des ressources utilisables par leurs concurrents. Du coup, il fallait monter une infrastructure permettant à chacun de ces acteurs de dépasser leur approche traditionnelle pour leur faire voir l’intérêt de mutualiser les moyens en vue de la production de ces « briques essentielles » pour tout l’écosystème.

L’association Open Law joue ce rôle. Elle sert d’abord de cadre de rencontre et de discussion entre acteurs publics et privés pour identifier les Communs à faire émerger dans le domaine de l’information juridique. Elle sert ensuite de « pot commun » rassemblant des financements publics et privés pour lancer des appels à contributions visant à la construction de ces Communs. Un peu à la manière de ce qu’est le W3C à l’échelle du web, Open Law joue aussi le rôle d’instance de gouvernance pour cette nouvelle infrastructure.

Ces Communs une fois mis en place, développés et maintenus par Open Law, chacun est libre de les réutiliser pour développer des projets concrets de services construits sur les données juridiques ouvertes. Open Law en signale déjà un certain nombre sur son site comme RIPSA (un répertoire permettant de connaître simplement les procédures administratives pour lesquelles le silence de l’administration vaut accord) ou DroitDirect.fr (une plateforme pour faciliter l’accès des personnes au droit, notamment celles en position précaire comme les étrangers et demandeurs d’asile).

On notera également qu’Open Law innove dans la manière dont le projet souhaite favoriser et récompenser les contributions apportées par les individus à ces Communs identifiés comme essentiels pour l’écosystème du droit ouvert. En effet, Open Law a mis en place un statut de « contributeur rémunéré aux communs ». Les sommes mutualisées par les partenaires servent en partie à verser une rémunération aux contributeurs individuels donnant de leur temps et de leurs compétences pour réaliser les objectifs déterminés par la structure. Open Law implémente ainsi l’idée d’une « réciprocité pour les Communs » ou d’un revenu contributif, sans avoir pour cela à inventer de nouvelles licences.

Pour une généralisation des partenariats Public-Privé-Communs

En 2014, l’italien Tommaso Fattori avait proposé le concept de « Partenariats Public-Communs » (Public-Commons Partnerships) comme une alternative aux partenariats Public-privé classiques, trop souvent à l’origine de formes de privatisation ou d’accaparement de ressources communes. L’initiative Open Law constitue à mon sens à la fois une réalisation et un enrichissement de cette idée, en montrant comment des Partenariats Public-Privé-Communs peuvent être mis en place autour des données ouvertes.

Comme je le disais au début de ce billet, avec la loi numérique de nombreux jeux de données publiques devraient être ouverts dans les mois qui suivront l’entrée en vigueur du texte. On peut dès lors se demander si ce qu’a réalisé Open Law dans le secteur de l’information juridique ne pourrait pas être répliqué dans d’autres domaines. Il existe en effet de nombreux champs où l’on retrouve des écosystèmes similaires, avec un rôle central joué par l’acteur public en matière de production de jeux de données essentiels, un tissu d’entreprises réutilisant ces données pour offrir des produits et une communauté d’utilisateurs capables de contribuer à leur enrichissement. Le secteur de la santé par exemple, celui de l’énergie ou des transports, mais aussi ceux de l’éducation, de l’enseignement supérieur ou de la culture présentent des caractéristiques assez similaires.

Or dans ces domaines, le besoin existe aussi de créer des répertoires des ressources libres, de produire des référentiels et des ontologies partagées, d’élaborer des standards et des normes d’identification ou de produire des solutions logicielles en Open Source. De nombreux « communs informationnelles » essentiels font encore défaut pour que l’Open Data donne la pleine mesure de son potentiel. Cette voie des partenariats Public-Privé-Communs ouverte par Open Law mérite donc sans doute d’être généralisée et approfondie.

Quelle réalité pour le principe d’Open Data « par défaut » de la loi Lemaire ?

C’est l’un des points sur lesquels la secrétaire d’Etat Axelle Lemaire avait le plus insisté lors du processus d’élaboration de la Loi numérique : la volonté d’instaurer en France un « principe d’Open Data par défaut« .

16323834751_0b990c39a9_b

A quelques semaines du début des débats à l’Assemblée nationale sur le texte, Next INpact a consacré hier un article à cette question où le journaliste Xavier Berne examine les dispositions relatives à « l’ouverture par défaut des données publiques« . On peut y lire notamment ceci :

Le Premier ministre s’y était engagé en juin dernier : inscrire dans la loi « le principe d’Open Data par défaut ». Aujourd’hui, le citoyen qui souhaite obtenir un document public (rapport, délibération, étude, correspondance, statistiques…) doit généralement en faire la demande auprès de l’administration. L’objectif du projet de loi « pour une République numérique » est donc de renverser ce paradigme, pour que l’ouverture devienne la règle et la fermeture l’exception.

Concrètement, cela signifie que toutes les données publiques détenues par les ministères ou certains établissements publics devraient être systématiquement mises en ligne par les pouvoirs publics – hormis certains documents relevant par exemple du secret des affaires.

Le problème, c’est que cette affirmation ne se révèle que partiellement vraie à la lecture attentive du texte.

Rappel : ce que l’Open Data veut dire… 

Pour comprendre pourquoi, il faut revenir à la définition de ce qu’est l’Open Data. On peut pour cela reprendre la fameuse « échelle en 5 étoiles » proposée par Tim Berners-Lee :

5-stars

On voit au premier niveau que pour parler d’Open Data au sens propre, les données doivent être publiées en ligne sous une licence ouverte garantissant la libre réutilisation.

C’est pour ainsi dire l’exigence première en matière d’Open Data, les niveaux supérieurs renvoyant davantage à des degrés de qualité des données (données structurées, format ouvert) ou à leur insertion dans le web de données ou Linked Data.

Mise en ligne à géométrie variable

Or c’est sur cette question basique de la mise en ligne des données que la loi Lemaire comporte encore une faiblesse relativement importante. En l’état, l’article 4 de la loi impose aux administrations de plus de 250 agents ou salariés de « rendre publics en ligne, sous un format ouvert aisément réutilisables » quatre type d’éléments (résumés ci-dessous par Xavier Berne) :

  • Les bases de données (et leur contenu).
  • Les documents communiqués à des particuliers suite à des procédures « CADA », ainsi que leurs « mises à jour ».
  • Les « données dont l’administration, qui les détient, estime que leur publication présente un intérêt économique, social ou environnemental ».
  • Les « principaux documents » figurant dans le répertoire d’informations publiques prévu par l’article 17 de la loi CADA.

Certes, l’inclusion des bases de données dans le périmètre de cet article constitue une grande avancée par rapport à la situation légale préexistante (surtout que le projet de loi précise plus loin à l’article 7 que les administrations ne pourront plus opposer leur droit de producteur de base de données à une demande de réutilisation, ce qui s’est déjà produit par le passé). Les bases de données produites par les administrations devront en principe être accessibles en ligne et on peut bien parler à leur sujet d’Open Data « par défaut ».

Par contre, pour ce qui concerne les documents administratifs, qui sont eux-aussi susceptibles de contenir des informations publiques, l’effet de la loi risque d’être plus limité. En effet, les administrations ne sont tenues de mettre en ligne de manière spontanée que les documents « communiqués à des particuliers suite à une procédure CADA« .

On ne sort donc pas vraiment à leur sujet de la situation préexistante, dans laquelle il fallait que les citoyens aillent demander à l’administration communication des données qu’ils souhaitaient réutiliser.

Logique persistante d’Open Data « à la demande » 

Cette lecture est confirmée par ce billet publié à la mi-décembre sur le blog d’Etalab qui analyse les conséquences de la loi Lemaire, dans lequel on peut lire ceci :

  • l’open data se développera sur la demande des citoyens : ainsi, les administrations seront tenues de diffuser en ligne les documents communicables à tous qui auront fait l’objet d’une demande de communication, ainsi que les mises à jour de ces documents;

  • par ailleurs, les administrations seront tenues de publier spontanément en ligne les documents qui figurent dans leurs répertoires d’informations publiques, ainsi que leurs bases de données. Elles diffuseront en outre les données présentant un intérêt économique, social ou environnemental.

Le premier paragraphe montre bien qu’on reste – du moins pour les documents contenant des informations publiques – dans une logique d’Open Data « à la demande », sans aller vers un passage à une logique d’offre systématique par l’administration.

RIP à la carte (et à trous)

Le projet de loi numérique ajoute cependant que les administrations devront aussi mettre en ligne les « principaux documents » figurant dans le répertoire d’informations publiques (RIP) qu’elles doivent tenir en vertu de l’article 17 de la loi CADA (dont voici le texte) :

Les administrations qui produisent ou détiennent des informations publiques tiennent à la disposition des usagers un répertoire des principaux documents dans lesquels ces informations figurent.

Les conditions de réutilisation des informations publiques ainsi que, le cas échéant, le montant des redevances et les bases de calcul retenues pour la fixation de ce montant sont rendus publics, dans un standard ouvert, par les administrations mentionnées à l’article 1er qui les ont produites ou reçues.

D’après la rédaction de cet article 17, la tenue du RIP est une obligation pour les administrations, ce qui devrait garantir en principe la mise en ligne de nombreux documents. Pourtant, si la plupart des Ministères ont établi un RIP, je ne suis pas certain que ce soit encore le cas pour tous. Par ailleurs, la majorité des établissements publics n’ont pas encore mis en place de tels répertoires et c’est pourtant à ce niveau que se situe à présent l’essentiel des données restant à libérer en France. En l’absence de répertoire, l’effet de la loi Lemaire risque d’être limité pour beaucoup d’administrations.

Quand bien même ce serait le cas, la loi ne fait obligation de faire figurer dans le RIP que les « principaux documents » produits par les administrations. Et la loi Lemaire indique de son côté que l’obligation de mise en ligne ne porte que sur les « principaux documents » figurant dans le RIP. Donc en définitive, la mise en ligne ne portera que sur les « principaux documents » parmi « les « principaux documents » produits par les administrations…

Comment arriver à un véritable Open Data « par défaut » ? 

On mesure déjà qu’on est loin en réalité d’un véritable Open Data « par défaut » avec mise en ligne spontanée des informations par l’administration et une large part de sélectivité risque de subsister. Cet état de fait est confirmé par le texte de l’article 4 qui ajoute que les administrations devront aussi mettre en ligne  les « données dont l’administration, qui les détient, estime que leur publication présente un intérêt économique, social ou environnemental ».

On reste encore ici dans une pure faculté discrétionnaire étant donné que l’évaluation de l’intérêt de la publication reste soumis à l’appréciation de l’administration concernée. Est-ce que par exemple les documents relatifs au budget ou au personnel d’un établissement public doivent ou non aller en ligne ? Ce sera aux instances dirigeantes d’en décider, comme c’était déjà le cas auparavant, alors qu’on pourrait penser qu’il s’agit au contraire des premières données qui devraient passer en Open Data.

En réalité pour imposer un véritable « Open Data par défaut », il aurait fallu que l’article 4 de la loi indique que l’obligation de mise en ligne pro-active concerne non seulement les documents « communiqués à des particuliers suite à une procédure CADA« , mais aussi tous ceux qui sont « communicables » en vertu de la loi du 17 juillet 1978.

On aurait eu alors un effet de levier très puissant et on serait sorti une fois pour toute de la logique insatisfaisante d’un Open Data « à la demande ».

Et les collectivités locales ? 

De manière paradoxale, les collectivités locales, qui sont pourtant explicitement exclues du champ de l’article 4 de la loi numérique, risquent d’être soumises à une obligation beaucoup plus forte de mise en ligne spontanée des documents qu’elles produisent.

L’article 106 de la Loi NOTRe adoptée cet été indique en effet que :

Les collectivités territoriales de plus de 3 500 habitants ainsi que les établissements publics de coopération intercommunale à fiscalité propre auxquels elles appartiennent rendent accessibles en ligne les informations publiques mentionnées à l’article 10 de la loi du 17 juillet 1978 […], lorsque ces informations se rapportent à leur territoire et sont disponibles sous forme électronique.

Contrairement aux administrations centrales et aux établissements publics rattachés à l’État, les collectivités locales de plus de 3500 habitants seront donc bien dans l’obligation de mettre en ligne toutes les informations publiques qu’elles produisent, ce qui implique nécessairement qu’elles publient aussi sur Internet l’intégralité des documents qui contiennent de telles informations.

Par contre, l’obligation de la loi NOTRe ne porte que sur l’accès en ligne et pas sur la réutilisation en tant que telle. On est ici davantage dans une logique d’Open Access que dans de l’Open Data au sens propre, les collectivités gardant comme aujourd’hui la faculté de décider de placer ou non leurs données sous licence ouverte.

Au final, on risque d’avoir au niveau de l’État une extension du principe de réutilisation, mais sans mise en ligne spontanée, tandis qu’au niveau des collectivités locales, on risque d’avoir une extension de la mise en ligne sans possibilité de réutilisation…

***

On voit donc qu’en définitive, ni au niveau de l’État, ni au niveau des collectivités locales, les changements législatifs récents ou à venir ne vont parvenir à satisfaire complètement cet objectif d’instauration d’un « Open Data par défaut ».

Pour ce qui concerne la loi Lemaire cependant, il serait assez simple pour les parlementaires qui vont bientôt examiner le texte de corriger ce défaut : il suffirait comme je l’ai dit plus haut d’amender l’article 4 du projet de loi pour faire en sorte que l’obligation de mise en ligne concerne tous les documents communicables au sens de la loi CADA et pas les documents effectivement communiqués.

Un simple mot à changer : c’est la condition pour éviter un Open Data « en trompe-l’oeil » que la loi risque de produire autrement…

 

 

 

Le statut juridique des données de la recherche : entre droit des bases de données et données publiques

Le mois dernier, j’ai été invité à intervenir à la Maison Européenne des Sciences de l’Homme et de la Société (MESHS) de Lille, dans le cadre d’un cycle d’un cycle de conférences sur le « Droit d’auteur dans l’environnement numérique ». J’étais chargé de traiter de le thème du droit des bases de données, mais j’ai élargi un peu le propos pour examiner la question du statut juridique des données de la recherche, de manière générale (voir la présentation ci-dessous).

Lire la suite

Text et Data Mining : l’absence d’exception pénalise bien la recherche

Un article scientifique a été publié le 7 juin dernier qui démontre pour la première fois que les pratiques de Text et Data Mining (exploration de données) sont moins développées dans les pays où le niveau de protection par le droit d’auteur est le plus élevé et ne prévoit pas de mécanisme spécifique pour les sécuriser. Ecrit par Christian Handke, Lucie Guibault et Joan-Jospeh Vallbé, cet article s’intitule : « Is Europe Falling Behind Text et Data Mining : Copyright’s Impact On Data Mining In Academic Research » et il est disponible en Open Access ici. Il a également fait l’objet d’une communication à laquelle j’ai pu assister lors du dernier congrès de la Ligue des bibliothèques européennes de recherche (LIBER) qui s’est tenu la semaine dernière à Londres.

L’intérêt de ce travail de recherche réside d’abord dans sa méthodologie. Par une jolie mise en abyme, les trois chercheurs ont choisi de recourir au Text Mining pour vérifier si les rigidités du droit d’auteur avait ou non impact sur l’utilisation du TDM dans les activités de recherche. Ils ont eu pour cela l’idée de conduire une opération de fouille de texte au sein de l’outil Web of Science proposé par Thomson Reuters, qui recense des milliers de journaux académiques. Ils ont ainsi pu constater que sur une période s’étendant de 1992 à 2014 le nombre des articles utilisant le mot clé « Data mining » dans leur description s’accroît constamment pour atteindre un total de 18 441 travaux publiés par des chercheurs dans le monde.

tdm
Evolution du nombre d’articles scientifiques recourant au TDM en fonction du temps (le « creux » constaté en 2007 s’explique par une modification de l’abonnement à Web of Science contracté par l’université où la recherche a été conduite).

Lire la suite

Français, encore un effort si vous voulez que les logiciels de l’administration deviennent libres !

En fin de semaine dernière, la Commission d’Accès aux Documents Administratifs (CADA) a rendu un avis remarquable, dans lequel elle reconnaît que le code source d’un logiciel développé par l’administration doit en principe être communiqué aux administrés en faisant la demande. En l’espèce, une personne demandait au Ministère de l’économie d’avoir accès au code source d’un logiciel simulant le calcul de l’impôt sur le revenu des personnes physiques à des fins de recherche. Cette décision est particulièrement intéressante, notamment par la manière dont elle articule le droit d’auteur et le droit d’accès aux documents administratifs, en faisant primer le second sur le premier.

delacroix
La liberté d’accès aux documents administratifs guidant le peuple.

Si cet avis consacre une forme « d’Open Source par défaut » pour les logiciels de l’administration, il n’implique pas cependant que les-dits logiciels passent ipso facto sous licence libre. En effet, une fois le code source communiqué, la réutilisation du logiciel se fait dans les limites de la loi du 17 juillet 1978 sur l’accès aux documents administratifs et la réutilisation des informations publiques. Or l’administration peut s’appuyer pour ce texte pour fixer des licences et des redevances, qui continueront à impliquer un formalisme préalable et un paiement en cas de réutilisation, toutes choses incompatibles avec les libertés du logiciel libre. Par ailleurs, l’avis de la CADA n’implique bien sûr en rien que les administrations cessent d’acheter et d’utiliser des logiciels propriétaires pour passer au libre.

Néanmoins avec le développement de l’Open Data, la réutilisation des informations publiques tend de plus en plus à s’inspirer et à se rapprocher des principes du Libre. Les administrations sont déjà soumises par décret à une obligation relativement large de rendre leurs informations réutilisables sous licence ouverte. L’avis de la CADA ouvre donc la possibilité d’étendre à présent cette politique d’ouverture aux logiciels produits par l’administration. Plus encore, avec la loi sur le numérique annoncée pour cette année, un passage par défaut à l’ouverture des informations publiques devrait s’opérer, ce qui ferait de l’Open Data leur mode de diffusion principal, en cantonnant la réutilisation payante à des cas exceptionnels et limités. En assimilant les logiciels à des documents administratifs contenant des informations publiques, la CADA a fait en sorte qu’une telle avancée législative – si elle a bien lieu – se répercutera logiquement sur les logiciels et les soumettra à un régime de réutilisation proche des licences libres (bien que reposant sur un fondement différent). Lire la suite

Données culturelles : alerte rouge pour le principe de réutilisation !

Voilà plusieurs années à présent que j’écris sur ce blog sur le sujet de la réutilisation des données culturelles. Le moins que l’on puisse dire, c’est que cette problématique n’aura pas été un long fleuve tranquille, mais un jugement rendu cette semaine par la Cour d’Appel de Bordeaux dans un litige opposant la société NotreFamille.com aux Archives départementales de la Vienne vient d’allumer sur le tableau de bord un gros voyant rouge, tant il est porteur d’un risque de régression en la matière.

Image par Dieselducy, Andrew R. CC-BY-SA. Source : Wikimedia Commons

Cette décision vient confirmer un jugement de première instance publié l’an dernier par le Tribunal administratif de Poitiers, auquel j’avais consacré une analyse en tirant déjà la sonnette d’alarme. Pour faire simple, le juge avait accepté que les Archives de la Vienne s’opposent à une demande de réutilisation commerciale de documents numérisés d’état civil et de recensement, en invoquant leur droit de producteur de la base de données constituée par leurs soins.

Lire la suite

Les données culturelles deviendront-elles des « données d’intérêt général » ?

C’est un point qui n’a pas fait l’objet encore de commentaires particuliers, mais qu’il faudra surveiller attentivement en 2015. A la fin du mois de novembre dernier, le site Contexte publiait un article se faisant l’écho des premiers travaux interministériels concernant la future loi sur le numérique, portée par Axelle Lemaire.

Un des volets de cette loi concernera l’ouverture des données publiques et l’on peut lire chez Contexte que les premiers éléments envisagés pour le texte portent sur les points suivants :

Ouverture des données

Le premier chapitre du texte porte sur la politique d’ouverture des données publiques, avec la transposition de la directive « Public sector information » (PSI) et la réaffirmation des principes d’ouverture, de gratuité et d’interopérabilité.

La Commission d’accès aux documents administratifs (Cada) deviendrait une véritable autorité des données publiques. Un statut des données dites « d’intérêt général », avec un régime juridique spécifique, serait créé. Cela concerne des secteurs aussi divers que la santé, les transports, l’énergie, la culture ou le logement.

Voir les données culturelles envisagées comme des candidates au statut de données « d’intérêt général » est assez surprenant, mais aussi potentiellement une chose positive. En effet, jusqu’à présent dans la loi française, les données culturelles ont déjà été soumise à un régime juridique spécifique, appelé (à tort) « exception culturelle ». Selon l’article 11 de la loi du 17 juillet 1978, les « établissements, organismes ou services culturels » conservaient la faculté de « fixer les conditions dans lesquelles les informations peuvent être réutilisées ».

Lire la suite

Deux enjeux stratégiques dans la nouvelle version 4.0 des Creative Commons : Open Data et clause Non-Commerciale

Cette semaine, après un processus d’élaboration de plus de deux ans, Creative Commons International a annoncé la publication de la nouvelle version 4.0 de ses licences. Framablog a déjà traduit en français un article d’une des responsables de l’organisation, Diane Peter, qui explique les principales modifications par rapport à la version 3.0 remontant à 2007. Creative Commons a travaillé par exemple pour simplifier le texte des licences afin de les rendre plus compréhensibles ; les licences auront également un effet plus global, car elles n’auront plus désormais à être transposées pays par pays et des clarifications intéressantes ont été apportées, notamment en ce qui concerne l’attribution des auteurs et l’adaptation des oeuvres.

Creative Commons. Par Skley. CC-BY-ND. Source : Flickr.

Mais je voudrais dans ce billet m’attarder sur ce qui constitue à mon sens les deux points les plus importants à souligner dans cette nouvelle version des Creative Commons. Le premier est qu’à présent, les licences prennent en compte le droit des bases de données, ce qui les rend applicables dans le cadre de projets d’Open Data, alors que c’était difficilement le cas auparavant. Par ailleurs, la clause NC, qui permet aux auteurs de réserver les usages non-commerciaux d’une oeuvre, a été maintenue, alors qu’un débat assez vif avait agité la communauté pour savoir s’il fallait ou non la supprimer. J’étais d’ailleurs moi-même intervenu dans cette discussion côté français, pour me prononcer en faveur du maintien. Cette clause a finalement été conservée, mais sans modification, ce qui n’est sans doute pas complètement satisfaisant.

Lire la suite

Après l’automne, le printemps ? Changement de stratégie au Ministère de la Culture en faveur de l’ouverture

Il s’est produit cette semaine une série d’évènements et d’annonces faites par le Ministère de la Culture dans la cadre de « l’Automne numérique« , qui traduisent un changement d’orientations significatif en faveur de l’ouverture. J’ai critiqué la politique culturelle qui a été conduite dans ce pays pendant des années sous l’ancien gouvernement et celui-ci n’avait pas jusqu’à présent réellement modifié le cap. Mais depuis plusieurs mois, on avait commencé à relever des signes encourageants en faveur de l’ouverture, notamment avec la parution en mars dernier du Guide Dataculture sur la réutilisation des données culturelles, et la publication d’une feuille de route Open Data en juillet

L’automne est donc la saison de l’ouverture, après un interminable hiver de la politique culturelle dans ce pays… (Red Leaves. Par Chang’r. CC-BY-ND. Source : Flickr)

L’Automne numérique a donné lieu à un atelier de mashup à partir d’oeuvres du domaine public, un Hackathon précédé par la libration d’une centaine de jeux de données par le Ministère et ses établissements, ainsi qu’une journée sur la transmission de la Culture à l’heure du numérique. Et c’est à l’issue de ce cycle d’évènements qu’Aurélie Filippetti a annoncé une série de mesures, visant à développer les usages du numérique, en lien avec le projet d’éducation artistique et culturelle porté par le Ministère.

Lire la suite

Un Open Access sans licence libre a-t-il un sens ?

Voilà un moment déjà que je voulais écrire sur les rapports entre l’Open Access et les licences libres, et une affaire survenue à propos du site MyScienceWork la semaine dernière me donne une excellente occasion de le faire.

Open Access (storefront). Par Gideon Burton. CC-BY-SA. Source : Flickr.

Enclosure informationnelle 

Stéphane Pouyllau, qui travaille au CNRS sur les projets ISIDORE et MediHal, a épinglé sur son blog les pratiques du portail MyScienceWork, dans un billet intitulé « Le libre accès privatisé ?« . MyScienceWork est une entreprise qui a mis en place un moteur donnant un accès fédéré à des archives ouvertes, doublé d’un réseau social auquel les chercheurs peuvent s’inscrire pour partager des références et rester en contact. Jusqu’ici rien de problématique et il est légitime à mon sens de voir des entreprises privées développer des services autour de l’Open Access. Mais Stéphane Pouyllau relève que pour accéder aux articles, la plateforme demande aux utilisateurs de s’inscrire, alors que ceux-ci sont disponibles par ailleurs dans HAL par exemple. De plus, la mention de source semble faire défaut dans les notices des articles signalés :

[…] il n’est même pas signalé l’origine des publications : ni source, ni référence d’éditeurs, et donc HAL-SHS n’est même pas mentionné ! L’url pérenne fournie par HAL-SHS n’est pas indiquée non plus, le lien proposé pointe sur une adresse « maison » de MSW qui n’a rien de pérenne (elle est explicite, mentionne le nom du réseau : http://www.mysciencework.com/publication/show/1107184/les-moteurs-de-recherche-profitent-aussi-de-la-semantique). Bref, on ne sait pas d’où vient l’article, ni dans quoi il a été publié !

Stéphane Pouyllau critique ce procédé qui permet à MyScienceWork d’engranger des données personnelles fournies par ses utilisateurs sans pointer en retour vers la source des ressources moissonnées par le moteur :

[…] d’un coté [l’utilisateur] a permis à MSW d’engranger de la valeur, mais il n’a pas les documents et donc pas l’information, de l’autre, il a l’information et les documents, le contact, d’autres documents en rapport avec son travail. C’est en cela que je trouve ces pratiques malhonnêtes et que je dis qu’il s’agit de la privatisation de connaissances en libre accès.

Lire la suite

Open Data culturel : enfin des archives libres, sous le signe du partage à l’identique

J’ai déjà eu l’occasion de l’écrire à de nombreuses reprises : l’ouverture des données publiques s’est avérée délicate dans le champ culturel et c’est en particulier vrai pour les archives, où l’on ne trouvait jusqu’à la semaine dernière aucun exemple de démarche que l’on puisse vraiment qualifier d’Open Data. Mais les archives municipales de la Ville de Toulouse ont publié un nouveau règlement relatif à la réutilisation de leurs données qui démontre que l’Open Data est possible pour les archives. Au-delà du seul secteur culturel, ce règlement est également important, parce que pour la première fois, il comporte une clause de partage à l’identique (Share Alike) directement construite à partir de la loi du 17 juillet 1978. Or ce mécanisme, déjà bien connu du secteur du logiciel libre, est susceptible de jouer un rôle régulateur dans les rapports entre secteur public et secteur privé, en empêchant le retour d’enclosures sur les données.

Non seulement gratuites, mais aussi libres : les archives de Toulouse sont les premières en France à s’engager dans une démarche d’Open Data. (Free. Par Sharon Drummond. CC-BY-NC-SA)

Lire la suite

L’Open Data de l’Elysée est sous licence fantôme…

L’Elysée a annoncé hier par le biais de son fil Twitter qu’il « ouvrait ses données » dans une nouvelle rubrique de son site. Un premier ensemble de données, comme la frise chronologique des activités de la Présidence ou les statistiques de consultation du site Elysée.fr, sont disponibles au téléchargement, dans des formats adaptés (XML ou JSON).

ghost

La réalisation est certes modeste, mais elle a sans doute une valeur symbolique de soutien apporté par l’Élysée à la politique d’ouverture des données publiques, portée par le Premier Ministre s’appuyant sur la mission Etalab. La feuille de route du Gouvernement publiée en février dernier contenait des dispositions ambitieuses en la matière. On se souvient aussi qu’aux Etats-Unis, l’implication du président Barack Obama a été déterminante, et l’est toujours, pour la mise en oeuvre de la politique d’Open Data.

Lire la suite

Ouverture des données culturelles : The Times, They Are A Changing ?

J’ai à de nombreuses reprises eu l’occasion de déplorer dans ce blog que l’ouverture des données publiques était en panne dans ce pays en ce qui concerne le secteur culturel. Jusqu’à présent, la Culture était le mouton noir de l’Open Data en France, alors qu’à mon sens, elle aurait du être l’un des premiers domaines à embrasser ce mouvement.

Open Data Scrabble. Par Justgrimes. CC-BY-SA. Source : Flickr

Pourtant, les choses semblent en train de changer graduellement, notamment au niveau de la politique du Ministère de la Culture. J’avais déjà relevé dans S.I.Lex la parution du guide Dataculture en mars dernier, qui constituait un premier pas important en avant. Pour la première fois, le MCC prenait une position franche en faveur de l’ouverture des données culturelles, en adressant à ses services et aux établissements sous sa tutelle des consignes pour mettre en oeuvre une politique d’Open Data, notamment au niveau juridique.

C’est à présent sur C/Blog, le blog du Ministère de la Culture, que l’on remarque des signes qui montrent que cette dynamique semble bien se poursuivre. Plusieurs sites ont relevé que C/Blog avait changé d’apparence visuelle ces dernières semaines, mais ce n’est pas le changement le plus intéressant que l’on puisse repérer.

Lire la suite

Guide Data Culture : enfin un pas en avant pour l’ouverture des données culturelles

En matière d’Open Data, les données culturelles accusent un retard conséquent en France, que j’ai eu l’occasion de déplorer à plusieurs reprises sur S.I.Lex, mais la parution récente d’un Guide Data Culture marque enfin un signe encourageant envoyé par le Ministère de la Culture, pour la politique d’ouverture des données.

datalove
Mais que se passe-t-il au Ministère de la Culture ? Son dernier rapport Data Culture relève quasiment de la déclaration de Datalove…

Soumises à un régime particulier « d’exception », la réutilisation des données produites par les institutions culturelles a suscité un certain nombre de blocages et de difficultés ces dernières années, que j’ai résumées dans la présentation ci-dessous, avec un point sur les évolutions en cours au niveau européen. Cette crispation s’est notamment traduite encore le mois dernier par le fait que les données culturelles restent absentes de la nouvelle feuille de route du gouvernement pour la relance de la politique d’Open Data

Mais peut-être les choses sont-elles en train de commencer à évoluer, si l’on en croit ce qu’on lit dans le Guide Data Culture, publié le 22 mars dernier sur le portail Etalab. Ce rapport, signé par Camille Domange, correspondant Open Data du MCC et réalisé au niveau du département des programmes numériques, constitue à mon sens le premier signe clair envoyé par le Ministère de la Culture en faveur d’une politique d’ouverture des données culturelles.

Lire la suite

Les données culturelles, absentes de la feuille de route du gouvernement sur l’Open Data

En marge de son séminaire numérique, le gouvernement a publié jeudi une feuille de route en matière d’ouverture et de partage des données publiques.

Ce texte comporte plusieurs éléments intéressants, qui viennent concrétiser la mesure n°15 annoncée lors du séminaire gouvernemental sur le numérique : « Faire de l’ouverture des données publiques le levier de la modernisation de l’activité publique ».

Le gouvernement a fixé le cap en matière d’Open Data, mais les données culturelles ne sont même pas sur la carte… (Boussole. Par Claude Robillard. CC-BY. Source : Flickr)

Pourtant, même si l’on peut se réjouir que le nouveau gouvernement poursuive l’effort d’ouverture des données, il reste un sujet désespérément absent du radar : celui des données culturelles.

Lire la suite