Les bibliothèques face au monde des données

Laetitia Bracco

Véronique Mesguich
Les bibliothèques face au monde des données
Villeurbanne, Presses de l’Enssib, 2023
Collection « Papiers »
ISBN 978-2-37546-148-8

La découverte de la table des matières de l’ouvrage Les bibliothèques face au monde des données ne manquera pas de surprendre le lecteur. Web de données, données d’activités des bibliothèques, données de la recherche, autant d’angles d’approche abordés dans cet ouvrage pourtant synthétique (environ 150 p.). Toutes ces pistes ouvertes finissent-elles par se rejoindre ?

La préface donne le ton, il s’agirait ici de parler avant tout des données des catalogues de bibliothèques. L’introduction se poursuit sur la transition bibliographique et sur la médiation numérique ; des concepts qui ne sont d’ordinaire pas associés aux « données » telles qu’on les imagine en bibliothèque, à l’heure de Recherche Data Gouv. Les données de la recherche y font cependant leur apparition : « les bibliothèques universitaires gèrent, décrivent et stockent les données de la recherche » (p. 18) ; une affirmation simplificatrice qui dès le départ pose question.

Le premier chapitre, consacré comme il se doit à quelques définitions, rappelle commodément de grands concepts tels que le big data et permet au lecteur de retrouver quelques dates importantes de l’histoire des données ouvertes. Est ensuite abordée la question des formats des données, qui semblent à la lecture du chapitre ne pouvoir prendre que la forme de tableurs ; il se termine par un trop bref passage sur le cycle de vie de la donnée, qui aurait pourtant pu en constituer la structure, et qui s’achève sur une confusion entre data center et entrepôt de données.

Le deuxième chapitre, Bibliothèques et web de données, est plus didactique et constitue un panorama clair et documenté sur la question, tour de force s’il en est, au vu de la profusion de publications sur le sujet. Sans transition, le troisième chapitre traite des données d’usage et d’activité dans les bibliothèques et fait d’intéressants parallèles entre collecte de données et adaptation des services proposés aux usagers. Le quatrième chapitre, consacré à la description et au traitement des données, porte logiquement sur les métadonnées et la galaxie de standards permettant de décrire tout type de ressource. Quelques exemples en illustration auraient été bénéfiques pour visualiser ces représentations de l’information parfois obscures, surtout pour les novices.

Après ces trois derniers chapitres bien construits, sont abordées les données de la recherche. C’est là que l’on ne peut que constater que cet angle n’est pas maîtrisé. L’historique ne fait mention ni de la Commission d’accès aux documents administratifs (CADA), ni de la Loi pour une République numérique. La partie sur le cycle de vie de la donnée (pourtant déjà rapidement survolé au chapitre 1) commence, très étonnamment, par les identifiants chercheurs au lieu du plan de gestion de données (PGD), et se poursuit par les datas papers (qui devraient intervenir à la toute fin). Le « cycle de vie » se termine sur les entrepôts, dans une rubrique qui passe bien trop rapidement sur le bouleversement majeur du paysage que constitue l’avènement de l’écosystème Recherche Data Gouv. La partie sur le PGD, trop brève, annonce qu’un exemple sera fourni. En lieu et place, « l’exemple » s’avère être une capture d’écran d’une infographie sur les questions contenues dans un PGD… Le problème fondamental de ce chapitre réside probablement dans le fait que les données de la recherche sont traitées comme les autres données gérées habituellement par les bibliothèques (entrées, prêts, consultation de documentation électronique, etc.) ; alors qu’elles sont un objet à part. Elles ne sont pas indexées par les catalogues de bibliothèques, elles ne sont généralement pas déposées dans les entrepôts par des bibliothécaires car cette opération nécessite des connaissances scientifiques poussées, elles ne peuvent pas être gérées uniquement par des bibliothécaires.

Le sixième chapitre sur l’analyse et la réutilisation de données, bien qu’utile pour ses définitions, donne l’impression d’une liste à la Prévert, traitant indifféremment du text and data mining, des outils d’analyse intégrés aux catalogues, de data visualisation et des systèmes de recommandations dynamiques à la façon d’Amazon.

La protection des données est abordée au chapitre suivant, qui offre une synthèse utile du Règlement général sur la protection des données (RGPD) et des différentes façons pour les bibliothèques de s’y conformer. Le dernier chapitre porte enfin sur les métiers de la donnée en bibliothèque. Du fait de l’extrême variété des « données » abordées, la synthèse mêlant data librarians, data scientists ou encore délégués à la protection des données (DPO) ne convainc pas tout à fait.

L’ouvrage s’achève par un passage sur l’intelligence artificielle en bibliothèque, le lien avec ce qui a été présenté précédemment n’étant pas évident.

En conclusion, l’ouvrage Les bibliothèques face au monde des données ne parvient pas à réconcilier des approches trop variées du concept de « donnée ». Du fait de l’absence de problématique, l’angle de l’ouvrage n’est pas explicite ; il ne permettra pas aux candidats aux concours d’y voir plus clair, hormis sur certains points précis comme le web de données ou les données d’activité des bibliothèques. La simplification à l’extrême du paysage complexe des données de la recherche mène à des contresens, voire à des erreurs.