Vous avez dit open access / open data ?
Journée d’étude Médiat Rhône Alpes – 5 octobre 2015
Alors que se tenait en octobre dernier l’Open Access Week, Médiat Rhône Alpes organisait le 5 octobre 2015 à Grenoble une journée d’étude portant sur l’open access et l’open data. Au cours de leurs divers exposés et retours d’expériences, les intervenants ont présenté ces deux concepts, la manière dont ils se déclinent dans les bibliothèques ainsi que la logique de l’ouverture des données publiques en bibliothèque.
Open data et open access : définitions et enjeux actuels
Éric Lams, directeur de la BULCO 1, ouvre cette journée en rappelant ce qui définit l’open data (ou données ouvertes) et l’open access (ou libre accès).
Concernant l’open data, il s’agit de données de tout type (cartographie, transport, recensement, finances, etc.) accessibles sous forme numérique et produites par un fournisseur public ou privé. L’open access désigne la mise à disposition de contenu numérique libre ou soumis à des régimes de propriété intellectuelle. Il concerne essentiellement la publication scientifique. Le développement de ces deux mouvements répond à une politique d’ouverture et d’innovation qui considère que les données publiques sont un bien commun.
On parle aujourd’hui de « big data » pour qualifier la quantité des données atteignant une taille critique. Les serveurs informatiques, comme ceux se trouvant au CINES 2, doivent donc évoluer vers des technologies proposant des capacités de stockage de plus en plus importantes, à l’image du cloud 3 pour le SGBM 4. Si la réutilisation des données publiques est encouragée (avec la licence Etalab par exemple), leur exploitation par des entreprises privées dans un but lucratif constitue une autre problématique liée à l’open data.
Comme l’avait affirmé la ministre de l'enseignement supérieur et de la recherche de l’époque, Geneviève Fioraso, dans son discours lors des 5e journées Open Access 5, il existe une forte volonté politique de mettre à disposition de tous la production scientifique. Cela se traduit notamment dans les différents projets initiés par le gouvernement : la Bibliothèque scientifique numérique, la plateforme nationale d’archives ouvertes HAL 6, ou encore le projet de loi pour une république numérique. Cet objectif est freiné par des barrières juridiques (question du droit d’auteur) et financières : l’open access peine à trouver son modèle économique.
Les bibliothèques universitaires comme celles de lecture publique ont dès lors un rôle important à jouer dans le développement de ces mouvements. Les présentations suivantes montreront comment elles se positionnent en tant qu’acteurs majeurs de l’open data et de l’open access.
Retour d’expérience sur un projet
open data en bibliothèque publique
Paris et Rennes font figure de pionnières sur la question de l’ouverture et de la mise à disposition des données : dès 2010 ces deux agglomérations ouvrent leurs données publiques sur des portails. C’est la contribution de la médiathèque des Champs Libres de Rennes Métropole à ce projet qu’est venue relater Frédérique Schlosser, responsable du numérique, de la communication et de l’informatique documentaire dans cet établissement et auteure d’un mémoire sur l’open data 7.
Le projet, initié sous forme de concours, a vu la mise en place d’une plateforme « Rennes métropole en accès libre », sur laquelle l’application lauréate à été mise à disposition du public sous forme de datavizualisation 8. Interprétée graphiquement, la présentation des données est alors beaucoup plus attractive qu’un tableau Excel ou qu’une liste de données écrite noir sur blanc.
La Direction générale de la communication de la Métropole proposera à la médiathèque de mettre les données de fréquentation et de transaction à disposition. Frédérique Schlosser rappelle que les données, présentées au format CSV 9, doivent être triées et accompagnées d’une note explicative. Les données, présentées sous forme brute, ne sont pas mises en scène. La bibliothèque n’ayant ni les moyens techniques ni les compétences pour faire ce travail, le collectif Open Data Rennes proposera une datavizualisation des données de fréquentation. Revenant sur l’idée d’utiliser les données du catalogue, un ingénieur en informatique appartenant au collectif proposera un prototype de catalogue ouvert dont les données seront enrichies par d’autres sources. Il croisera ainsi les données de Wikipédia, d’Open street map, des transports en communs et d’une cartographie précise de la bibliothèque, créée pour l’occasion, allant jusqu’au détail de localisation des cotes sur les étagères. Ainsi, l’application permettrait aux usagers de chercher un livre sur ce catalogue et de voir le trajet, depuis son domicile jusqu’à l’étagère dans la bibliothèque avec les horaires des transports en commun. Faute de pouvoir payer un développeur à plein temps et d’avoir du personnel formé pour gérer le suivi au quotidien de l’application, la médiathèque à stoppé la collaboration avec le collectif. L’application est donc restée au stade de prototype.
Exemple de datavizualisation de la fréquentation sur une année proposée par le collectif Open Data Rennes.
La datavizualisation et la mise en scène des données ouvertes permettent de communiquer à propos de la bibliothèque vers son public mais aussi vers les tutelles, afin par exemple de justifier les horaires d’ouverture. Ce type de projet engage des personnes de métiers différents à collaborer ensemble, et permet à la bibliothèque de s’adapter aux usagers du Web. Mais à tous ces avantages s’opposent de nombreux obstacles et interrogations. Le temps, les moyens matériels et les compétences sont indispensables à la réussite d’un tel projet, qui ne pourrait pas se réaliser sans un soutien important des tutelles dont dépend l’établissement.
L’open access et les productions scientifiques :
HAL, BSN4, Horizon 2020
Lucie Albaret, responsable du département du système d’information documentaire au SID2 de Grenoble, revient ensuite sur le mouvement de l’open access dans la communauté universitaire en rappelant que ce débat déjà ancien concerne non seulement les publications scientifiques mais aussi, depuis une date plus récente, les données de la recherche.
Le développement du libre accès à travers la mise en place de nouveaux modèles économiques et juridiques semble en effet s’imposer pour faire face à l’explosion des coûts de l’édition scientifique et améliorer l’accessibilité des productions de la recherche financées (doublement) sur fonds publics tout en favorisant le lancement de nouveaux projets via les contrats de recherche.
Parmi les nombreuses réalisations citées on retiendra en particulier les initiatives gouvernementales BSN4, segment de la Bibliothèque scientifique numérique consacré aux archives ouvertes, et Horizon 2020, programme mené par la Commission européenne visant à rendre accessible gratuitement l’ensemble de la production scientifique d’ici 2020. A noter également : l’émergence de modèles novateurs tels que les épi-revues 10 à l’intiative des chercheurs ou encore les Open Library Humanities 11 dans le domaine des bibliothèques.
L’exemple grenoblois du portail HAL-UGA, plateforme institutionnelle rattachée à la plateforme nationale d’archives ouvertes HAL, témoigne à travers l’enquête menée au printemps 2015 des services attendus par les chercheurs autour de cet outil, à savoir : un conseil juridique (23,8 %), une aide au dépôt individualisée (32,3 %), des journées d’étude et colloques (9,2 %), des interventions de bibliothécaires dans les laboratoires (32,3 %). De fait, l’enquête révèle également que 47,2 % des chercheurs interrogés n’ont jamais déposé de document sur une archive ouverte, par méconnaissance (15,9 %), par manque de temps (10,8 %), parce qu’ils considèrent que c’est trop compliqué (6,2 %), que ce n’est pas obligatoire (5,2 %) ou que c’est inutile (4,6 %).
Dans ce contexte, les bibliothèques sont amenées à se rapprocher d’autres services de l’université, leur rôle consistant à sensibiliser les différents acteurs aux enjeux de l’open access et à proposer grâce à leur expertise documentaire une assistance technique à la gestion des données comme aux projets de publication.
L’open access vu par la bibliométrie
Chérifa Boukacem-Zeghmouri, co-responsable de l’Urfist de Lyon, propose enfin une lecture bibliométrique des développements de la publication open access.
La bibliométrie, définie comme « une méthode de recherche qui consiste à utiliser les publications scientifiques et leurs citations comme indicateurs de la production scientifique et de ses usages » 12, constitue un observatoire de l’activité scientifique 13 qui permet d’analyser la dynamique sociale et internationale de la science. Elle met ainsi en évidence des phénomènes tels que les évolutions interdisciplinaires de l’activité scientifique ou encore les interactions scientifiques.
La bibliométrie connait toutefois des dérives lorsqu’elle se confond avec l’évaluation en se basant sur l’analyse de la citation. Ainsi l’invention du facteur d’impact 14 figurant dans le Journal Citation Reports 15 est à l’origine du développement des bases de données bibliométriques (Web of Science, Scopus, Google Scholar) ainsi que de l’orientation des politiques de recherche selon une bibliométrie « sauvage » 16 et une logique de classement où l’évaluation devient un véritable marché.
De ce point de vue, l’application de la bibliométrie à l’observation du libre accès montre une extension du facteur d’impact aux revues du gold 17 et à la citation des données via les altmetrics, indicateurs associés à la publication des données, qui sont dès lors valorisées au même titre que les articles. Mais la citation contribue également au partage et à la réutilisation des données, favorisés par l’émergence des réseaux sociaux scientifiques comme Research Gate ou Academia.
Pour conclure…
Selon Éric Lams la bibliothèque apparaît comme un modèle à réinventer avec le passage au numérique où l’open data et l’open access deviennent de véritables enjeux de société et représentent une opportunité à saisir pour les professionnels de l’information, afin de faire valoir leurs compétences auprès des pouvoirs publics comme de l’université. Il s’agit pour les bibliothèques universitaires d’alléger les coûts de l’IST 18 tout en favorisant la diffusion. Les bibliothèques de lecture publique se doivent quant à elles d’investir le domaine de la donnée publique, revêtant ainsi une dimension citoyenne à l’heure où le projet de loi pour une république numérique traduit la volonté politique d’ouverture des données publiques auprès des internautes.
Cette journée au contenu très riche a été appréciée des participants entre lesquels des échanges ont eu lieu par la suite. La présentation du portail HAL-UGA aurait cependant mérité d’être davantage détaillée : ce sujet pourra faire l’objet d’une prochaine conférence…