Exploiter les données d’usages en bibliothèque : pourquoi faire ?

Journée d’étude Enssib – Lyon, 14 janvier 2016

Daniele Franco

Un enjeu majeur pour les bibliothèques :
l’exploitation des données d’usages

L’essor des outils pour la production de données mis à disposition des bibliothécaires - listes obtenues avec les logiciels SIGB, graphiques issus des enquêtes de satisfaction, tableaux excel générés à partir des systèmes de reconnaissance des fichiers de log - a entraîné une massification des données disponibles. Or, celles-ci sont souvent très difficilement interprétables. Leur utilisation est pourtant un enjeu majeur pour les professionnels des bibliothèques : comment les traiter, les interpréter, les exploiter ? La journée d’étude organisée par l’Enssib le jeudi 14 janvier 2016 a permis à des professionnels des bibliothèques, de l’édition et de la recherche d’échanger sur cette problématique majeure à l’heure du big data.

La première expérience partagée fut celle du réseau des BU de Franche-Comté. Son projet d'art génératif Village Doc permet de visualiser le réseau des bibliothèques comme la place d'un village où les lecteurs réels se rencontrent dans l'espace virtuel. Deux thèmes ont ensuite été traités par les intervenants.

L'exploitation sociologique des données recueillies
lors des enquêtes de public

Les interventions de la matinée ont permis de réfléchir à l’exploitation sociologique des données recueillies lors des enquêtes de public. Des expériences intéressantes ont été menées dans plusieurs bibliothèques de la région Rhône-Alpes. Dans le cadre de son doctorat de sociologie à l’Enssib, Mabel Verdi s’est intéressée au rôle de la lecture numérique en bibliothèque municipale. Pour ce faire, elle a conduit 34 entretiens directs avec des usagers actifs dans dix bibliothèques municipales du Rhône. Olivier Zerbib, maître de conférences en sociologie au sein du G2i - IAE de Grenoble, Marie Doga, maître de conférences en sociologie au sein du laboratoire Pacte, et Emmanuel Brandl, docteur en sociologie et ingénieur de recherche à EnssibLab ont conduit une enquête sur Bibook, l'interface de lecture numérique des bibliothèques de Grenoble. De ces différentes enquêtes, plusieurs résultats intéressants ressortent.

Elles révèlent notamment que la génération des babyboomers est très attentive à l'effervescence de l'industrie culturelle. Un autre résultat instructif est l’existence d’une correspondance entre les emprunteurs de liseuse et les grands lecteurs. Elles montrent également que la pratique de la lecture nomade permet d’élargir l’espace de l’expérience de la lecture.

Cécile Touitou a ensuite présenté le contexte normatif dans lequel s'inscrit l'évaluation en bibliothèque et les spécificités des normes ISO 2789 (activité), 11620 (performance) et 16439 (impact des bibliothèques sur la collectivité). Elle a ensuite évoqué l'utilisation de l'enquête Libqual+ à la bibliothèque de Sciences Po permettant une meilleure compréhension des attentes et des perceptions des différents publics sur trois axes : la bibliothèque comme lieu; les collections et les services.

L’exploitation numérique des données de bibliothèques

La deuxième partie de la journée a été consacrée à l'exploitation numérique des données de bibliothèque.

Le projet Prévu, né de la collaboration entre le laboratoire CiTu (Paragraphe Paris 8), le SCD de Paris 8 et le Labex Arts-H2H en partenariat avec l’EnsadLab et le Campus Condorcet a été présenté par Gaétan Darquié, Isabelle Breuil et Mehdi Bourgeois. Tout en reprenant les notions d'éditorialisation de Marcello Vitali Rosati et de dépassement du clivage contenant/contenu rendu possible avec le numérique, le projet Prévu essaie de structurer la circulation du savoir dans un acte de production du réel. Dans le maelstrom du big data, la visualisation des données obtenue par Prévu participe à leur « redocumentarisation » tout en donnant une lisibilité immédiate par des graphiques et des schémas.

Les expériences de PNB Dilicom (Véronique Backert), de OpenEdition (Julien Gilet) et EzPaarse (Thomas Porquet et Thomas Jouneau) se focalisent sur le potentiel de l’exploitation des données d’usage des ressources numériques grâce à leur traçabilité. Afin de permettre aux libraires de présenter des offres de livres numériques aux bibliothèques, le projet PNB vise à faciliter les interactions entre les acteurs de la chaine numérique. Devant la masse de données obtenues, la problématique qui doit nous interroger est comment exploiter un corpus pas forcement standardisé tout en le croisant avec des données sensibles telles que les informations personnelles des lecteurs.

OpenEdition ainsi que le projet Ezpaarse figurent parmi les pionniers de l’analyse des fichiers log des accès distants. Pour Julien Gilet d’OpenEdition, plate-forme qui propose des revues en libre accès, l’enjeu des statistiques de consultation demeure vital car il permet de connaitre les attentes et les besoins réels des usagers et donc de leur fournir un service adéquat. A travers l’analyse des fichiers log, OpenEdition est dans la mesure d’étudier les flux de consultation. Mais cette analyse rencontre de nombreuses difficultés telles que la prolifération de robots qui faussent les données ou la faible fiabilité des données fournies par les outils d’analyse d’usage les plus répandus (Google Analytics par exemple). Pour y pallier, il est donc nécessaire de se tourner vers d’autres outils d’analyse. Le projet EzPaarse né de la collaboration entre le consortium Couperin, le CNRS-Inist et l'université de Lorraine, a élaboré un outil désormais devenu incontournable pour les BU qui ont besoin d’une une meilleure information sur le public de leurs ressources numériques. En effet, cet outil permet d'analyser les connexions aux ressources numériques via le proxy. La première phase du projet qui s’est terminée en décembre a permis d’avoir une lisibilité complète pour la majorité des bases de données scientifiques et pour une grande partie de celles en SHS. Actuellement, les membres du projet EzPaarse étudient la possibilité de donner une forme graphique à la masse de données obtenue chaque mois afin de rendre communicables les chiffres d’accès. Les intervenants ont ainsi présenté les perspectives offertes par plusieurs outils : Omniscope de Visokio pour le traitement des données statistiques ; Ezagimus, le projet de plate-forme qui permet d'utiliser les fichiers de logs afin de produire un entrepôt de données d'utilisation pour leur stockage sur le long terme ; et Kibana pour la visualisation des tableaux.

Enfin, lors de la dernière intervention, Soledad Beaudon de l’université Jean Monnet de Saint-Etienne a présenté le potentiel offert par l’exploitation des données obtenues grâce au SIGB Koha. L’interrogation de la base de données via des requêtes MySQL, outil précis mais parfois lourd, pose des problèmes de ralentissement et d’engorgement. Pour y faire face, une copie de la base de données d’usage du réseau des BU stéphanoises est sauvegardée à la date j-1 tous les jours : les bibliothécaires peuvent ainsi lancer des requêtes - même très importantes - sans gêner le fonctionnement normal du SIGB en mode production. En l’absence de traitement automatique des données, Mme Beaudon a souligné l'importance du suivi constant des statistiques qui doit anticiper les changements des statuts des usagers d’un mois à l’autre.

Une journée d’étude qui ouvre les champs des possibles

Tandis que les récentes polémiques liées au financement de la culture pourraient faire penser qu’une évolution possible de notre métier tendrait à exploiter les chiffres seulement dans une logique purement comptable, pour justifier l’existence même des bibliothèques, la journée du 14 janvier a présenté un tout autre panorama. Dans la majorité de cas il y a une réelle volonté de connaître les changements qui interviennent autour des bibliothèques. Les publics changent, les pratiques évoluent, par conséquent les demandes qui sont soumises aux bibliothèques doivent évoluer elles aussi. Aujourd'hui les études affinées par l'usage des nouvelles données mises à disposition par des outils en voie de développement nous montrent le potentiel à notre disposition. L’enjeu commun de toutes les interventions qui se sont succédées est l’élaboration d’un moyen de lire ces chiffres afin de pouvoir les mettre au service de la qualité de l’accueil, du développement des collections et des acquisitions, de l'amélioration de la connaissance des nouveaux publics. Une fois de plus dans leur histoir,e les bibliothèques sont confrontées à des profondes mutations sociales : l’exploitation des données d’usage est aujourd’hui une opportunité pour remettre au centre leur rôle.