entête
entête

« Open access, open data en bibliothèque »

Journée d’étude Médiat Rhône-Alpes – 31 mars 2016 – Université-Lyon-1

Solène Charuel

Avec l'avènement des ressources numériques, la fonction des bibliothèques change profondément. Lors de cette demi-journée d’étude, Sitthida Samath et Chérifa Boukacem‑Zeghmouri ont abordé ces nouveaux rôles et responsabilités des bibliothèques par le prisme de l’open access et de la bibliométrie.

Open access et open data, un nouveau rôle pour les bibliothèques?

Sitthida Samath, assistante de ressources documentaires à l’Institut des Sciences de l’Homme à l’Université Lyon 2 a ouvert cette journée en définissant l’open access et l’open data.

L’open access est un mouvement qui propose un accès libre et rapide à la production scientifique (articles, thèses, rapports, etc.). Il est apparu dans les années 1990 en réaction à l’augmentation des coûts d’abonnement aux revues scientifiques devenus prohibitifs pour les chercheurs et les bibliothèques. Il s’agit d’une notion alternative à la privatisation du savoir et des connaissances, qui repose sur une logique de coopération et de partage. Avec l’open access, l’accès à la documentation scientifique est devenu une valeur à part entière.

Le mouvement de l’open data est plus récent. Il s’agit de la mise à disposition de la donnée, publique ou privée, pour tout citoyen. On retrouve des traces de cette volonté dès le 18ème siècle en France. Par exemple la loi du 25 juin 1794, qui institue un dépôt centralisé des archives et en permet un libre accès aux citoyens.

Mais quelle est la nature de ces données auxquelles on veut donner accès ? De nombreuses définitions s'enrichissent les unes les autres 1. La Queensland University of Technology propose celle-ci :

“Research data means data in the form of facts, observations, images, computer program results, recordings, measurements or experiences on which an argument, theory, test or hypothesis, or another research output is based. Data may be numerical, descriptive, visual or tactile. It may be raw, cleaned or processed, and may be held in any format or media.” 2

Les données sont donc de nature très diverses. Pour qu’elles soient exploitables, elles doivent suivre 8 principes proposés en 2007 et décrits lors de séances du groupe de travail de Sebastopol : elles doivent être complètes, disponibles, primaires, mises à jour, accessibles au plus grand nombre et enfin, permettre un traitement automatisé, non discriminatoire, sous un format non propriétaire et libre de droit. Cela suppose des efforts particuliers sur la qualité de ce qui sera à disposition de tous.

Pourquoi et comment gérer ses données ?

Une bonne gestion commence depuis la création des données jusqu'à leur conservation à long terme ; c'est une condition essentielle d’une bonne pratique scientifique. Cela fait également partie des obligations signalées par le financeur d’un projet et certains éditeurs qui, comme PlosOne, ont mis en place une obligation de publication des données simultanément à l’article.

Au-delà de l’aspect contractuel, la massification de la production scientifique et la globalisation des échanges rendent nécessaires l’organisation des données. Mais ces arguments se répercutent peu dans le monde de la recherche. La gestion des données est perçue comme une charge de travail supplémentaire non négligeable sans effets positifs sur une évaluation de carrière par exemple.

Cependant, plusieurs outils existent pour répondre à ce nouveau besoin comme le Data Management Plan (DMP). Il peut prendre la forme d’un formulaire, tableau, ou d’un plan détaillé et peut être informatisé ou non (DMPTool, DMP Online). Les bibliothèques universitaires se sont emparées de ce dispositif et aujourd’hui on peut en voir des exemples à Paris Diderot, University of Edinburgh, University of Minnesota. L’accent est mis sur le croisement des compétences. L'équipe scientifique, créatrice des données, est au cœur du dispositif mais elle s'appuie toujours sur ses partenaires qui participent au cycle de vie des données (Services des systèmes d'information, services juridiques, bibliothécaires, documentalistes et archivistes). Actuellement, le projet Doranum 3 s’est engagé dans cette voie afin de promouvoir de bonnes pratiques de gestions des données de la recherche par le biais de formations et de ressources.

Quels rôles et changements pour les bibliothèques ?

Face à l’open access et l’open data, les acteurs des bibliothèques doivent réfléchir aux rôles qu’ils veulent jouer sur le terrain des publications scientifiques et des données. Comme un centre de ressources, la bibliothèque pourrait être l’établissement de référence des données ou bien l’institution en charge de leur dépôt légal ; l’analogie avec le dépôt légal des thèses est ici évidente. Enfin, que penser d’une bibliothèque fournisseur de services ? C’est-à-dire proposer des formations à la culture informationnelle, aider les chercheurs à déposer leur production sur des plateformes open-access ou participer en tant qu’expert aux projets de recherche. Toutefois, ces possibilités sont à nuancer car ce genre d’action fait souvent face à un besoin rarement explicite des usagers.

Dans ce processus d'ouverture qui passe par le libre accès aux publications et aux données, les professionnels de l'information jouent leur rôle en mettant tout simplement en œuvre ou en développant les compétences, volontés et moyens déjà existants. Ces nouveaux profils n’ont pas encore de noms établis mais au travers des nombreuses journées d’études et colloques sur le sujet, on commence à voir apparaître des noms comme “architecte de l’information” ou encore data librarian.

Bibliométrie et bibliothèques, une collaboration impossible ?

Le seconde partie de cette demi-journée d’étude a été animée par Chérifa Boukacem-Zeghmouri, maître de conférences à l’Université Lyon 1. Elle a abordé le sujet de la bibliométrie dont elle propose une définition rédigée par Yves Gingras : « La bibliométrie est une méthode de recherche qui consiste à utiliser les publications scientifiques et leurs citations comme indicateurs de la production scientifique et de ses usages. »

Relation bibliothèque et bibliométrie

Le lien qui unit bibliométrie et bibliothèque a été abordé par l’histoire de cette méthode de recherche pensée par un physicien anglais, Derek John de Solla Price (1922-1983). Après la seconde guerre mondiale, la publication scientifique est bouleversée par l’internationalisation et le modèle économique qui va s’y rattacher. En effet, la science doit se faire de manière collaborative et internationale et on constate une évolution exponentielle de la production scientifique dans la seconde moitié du 20e siècle.

Avec la marchandisation des données de la science, la bibliométrie a donné lieu à de nombreuses dérives qui ont parfois circonscrit les articles scientifiques à des quotités de citations. Or, comment témoigner de la qualité d’un article par le nombre de citations qu’il reçoit ou qu’il mentionne ? L’aspect sociologique – terme défendu par Chérifa Boukacem‑Zeghmouri – est donc laissé de côté sans prendre en compte le fait que l’auteur cité puisse être défendu ou conspué.

L’importance de la citation a créé le facteur d’impact qui permet de donner une valeur scientifique à une revue dont les articles ont été souvent cités. Par ces algorithmes, la visibilité et la popularité de la revue s’accroissent et cela devient un argument pour augmenter les prix d’abonnement. Ainsi le chercheur se trouve dans un cercle vicieux où il va chercher à publier dans les meilleures revues qui demanderont un abonnement exorbitant à la bibliothèque de son établissement. C’est pour cela que d’un point de vue économique mais aussi sociétal, pour la notion de bien commun, les acteurs des bibliothèques s’impliquent activement dans les mouvements d’open access et d’open data. L’approche bibliométrique est une méthode parmi d’autres qui ne se suffit pas à elle seule et doit être accompagnée par des approches qualitatives.

De nouvelles formes de bibliométrie

Avec l’utilisation massive des réseaux sociaux généralistes et ceux de la recherche, l’information circule selon des flux nouveaux que l’on cherche à quantifier. C’est ainsi que les Altmetrics sont apparus. Basés sur les réseaux sociaux ils permettent de savoir combien de fois un article a été tweeté, liké, partagé. Mais quelle valeur donner à ces informations ? Que valent un like, un retweet dans la notion qualitative d’un article ? Quelle temporalité pour l’influence d’une production scientifique dont les Altmetrics sont très hautes ? N’est-ce pas une pression supplémentaire pour le chercheur qui doit aussi être présent activement sur le web ? Toutes ces questions sont actuellement débattues.

Conclusion

Les mouvements d'open access et d'open data sont totalement d'actualité d'autant plus que la Loi pour une République Numérique proposée par Axelle Lemaire est actuellement en lecture au Sénat. Les bibliothèques, qui assument depuis toujours la fonction de lien entre les données et leurs usagers, vont être sollicitées pour participer à la gestion de l'énorme volume de ces nouvelles données. Il s'agit donc de redéfinir ou de créer les rôles et outils de chacun ; la bibliométrie en particulier constitue un de ces outils appelés à évoluer.

  1.  (retour)↑  Voici les Principes et lignes directrices de l’OCDE pour l’accès aux données de la recherche financée sur fonds publics, https://www.oecd.org/fr/sti/sci-tech/38500823.pdf, [en ligne], consulté le 11/04/2016. On peut également évoquer les définitions proposées par The Australian national data service, l’Université de Bristol, ou le programme Horizon 202
  2.  (retour)↑  http://www.mopp.qut.edu.au/D/D_02_08.jsp, [en ligne], consulté le 07/04/2016.
  3.  (retour)↑  Données de la Recherche: Apprentissage NUMérique à la gestion et au partage