Gouvernance des données dans l’enseignement supérieur et la recherche : une dynamique structurante pour le pilotage et la souveraineté des établissements
Journée d’étude Dataviz, 17 juin 2025, Sorbonne Université
Note des autrices : nous remercions Henriette de Daran (chef du pôle Évaluation et enquêtes au sein du service commun de la documentation de l’Université de Toulouse 3 et membre de la commission Pilotage et évaluation de l’ADBU – Association des directeurs et personnels de direction des bibliothèques universitaires et de la documentation) pour la relecture du présent article.
*
La journée d’étude Dataviz consacrée à la gouvernance des données dans l’enseignement supérieur et la recherche (ESR) s’est tenue à Sorbonne Université le mardi 17 juin 2025 1
. Elle était organisée par les commissions « Signalement, données et système d’information » et « Pilotage et évaluation » de l’ADBU, animées respectivement par Cédric Mercier (Université Paris-Saclay) et par Nelly Sciardis (Université Polytechnique Hauts-de-France). Elle a permis de poser les fondations d’une culture partagée autour d’un enjeu stratégique : les dispositifs de gouvernance, d’outillage et de pilotage par la donnée. La matinée a ouvert sur une clarification conceptuelle : la gouvernance de la donnée (ensemble de règles et processus visant la qualité, l’interopérabilité, la traçabilité) versus la gouvernance par la donnée (usage de la donnée comme support de décision stratégique), qu’il s’agisse de données de recherche ou bien de données de référence sur les moyens alloués à la recherche.Deux profils structurants sont à distinguer au cœur du dispositif
Isabelle Blanc, administratrice ministérielle des données, des algorithmes et des codes sources (AMDAC), au ministère chargé de l’Enseignement supérieur et de la Recherche, a rappelé le rôle fondamental des AMDAC dans les établissements, en miroir de la fonction ministérielle. Elle a souligné la nécessité de créer des référentiels communs pour garantir la fiabilité et l’interopérabilité des données – un enjeu d’autant plus crucial dans un contexte d’ouverture des données et de pilotage numérique. À leurs côtés, les administrateurs des données de référence (ADR) assurent une cohérence et une structuration fine des données d’appui à la stratégie. La nature de la gouvernance des établissements, composée de membres élus, contraste fortement avec la stabilité des organismes nationaux : la capacité à proposer des datavisualisations percutantes est d’autant plus importante.
Les interventions des AMDAC de terrain (Chloé Fabre, Toulouse 2) ont illustré les leviers, outils et obstacles rencontrés : absence de réseau formalisé, multiplicité des acteurs à coordonner (délégués à la protection des données – DPO, chercheurs, directeurs des systèmes d’information – DSI), hétérogénéité des systèmes, manque de culture commune de la donnée. À Toulouse, un important travail a été mené pour structurer une gouvernance autour des données de la recherche, incluant les codes sources et les algorithmes, en lien avec les principes de science ouverte, mais cette problématique est clairement isolée de la question plus globale des données de gouvernance des établissements.
Données institutionnelles, fusion et qualité : défis communs
Des retours d’expérience (Université de Poitiers, Université Paris-Saclay, Université Grenoble Alpes) ont mis en lumière la complexité liée aux fusions d’établissements, où l’uniformisation et l’urbanisation des données deviennent critiques. Dominique Fiquet (Saclay) a évoqué un projet de cartographie du système d’information (SI) pour comprendre les flux et poser les bases d’une urbanisation structurée, dont les enjeux sont aisément « montrables » à la gouvernance de l’institution grâce à la datavisualisation. À Poitiers, Marie Gac a détaillé la mise en place d’un système d’information décisionnel (SID) développé avec l’Université de Rennes sous le nom de Sterennes, précédée d’un travail essentiel sur la qualité des données via un réseau interne des producteurs de données. Il est à noter qu’à l’Université de Rennes, Sterennes commence à travailler sur la brique fréquentation des bibliothèques.
Dans ces projets, un principe clé : fiabiliser la donnée pour en faire un levier de stratégie, non un objet de débat. Des cas emblématiques comme la gestion des doctorants (étudiants/professionnels) ou le suivi des APC (Article Processing Charges) illustrent les zones grises entre métiers, services et systèmes. La mise en place de tableaux de bord à plusieurs niveaux de lecture, adaptés à chaque métier, semble rencontrer tous les suffrages.
Systèmes d’information décisionnels (SID) : vers une convergence des outils
L’après-midi a été consacrée à l’écosystème des outils. Trois projets structurants ont été présentés :
- SIROCCO 2 (Jean-Baptiste Marion, Université Lyon 3), plateforme communautaire (11 établissements) orientée patrimoine, ressources humaines, finances, formation, construite selon une logique de modularité ;
- Sterennes 3 (Université de Rennes), initié en 2017, permet avant tout de fiabiliser les données et de renforcer le pilotage de l’établissement. Ce projet, soutenu par la Direction générale de l’enseignement supérieur et de l’insertion professionnelle (DGESIP), a été « vendu » à 26 universités ;
- SID de l’Université Grenoble Alpes, structuré pour centraliser les outils de pilotage.
Ces projets révèlent des choix différenciés en matière d’infrastructure, mais tous insistent sur la nécessité d’un métier dédié pour faire vivre les SID. Une fois encore, la question de la qualité des données a été évoquée, notamment par le DSI de l’Université d’Artois qui a dressé un tableau des différentes possibilités d’alimentation d’un SID (au fil de l’eau, par chargements périodiques), sans oublier l’existence non négligeable du « shadow IT ».
La question de l’intégration des données des bibliothèques a été discutée : si les indicateurs produits par les services communs de la documentation (SCD) sont riches et nombreux, leur intégration dans les SID reste difficile (diversité des sources, faible automatisation, absence de brique spécifique « bibliothèque universitaire » (BU).
Lucie Chanas a présenté les résultats d’une enquête menée auprès des SCD en mars-avril 2025 pour mieux connaître les indicateurs BU demandés par les – ou remontés aux – établissements ainsi que les outils utilisés et l’existence de SID. L’usage des collections – papier et numérique – fait partie des indicateurs les plus demandés : nombre de prêts et nombre de téléchargements ou consultations en ligne. En regroupant avec les indicateurs sur la volumétrie et les dépenses de collections, on arrive à 15 indicateurs (soit 25 %), à égalité avec les usages des collections, les archives ouvertes et les indicateurs en lien avec la science ouverte : statistiques HAL, données bibliométriques. On trouve enfin la fréquentation et tout ce qui touche à l’utilisation des espaces de travail, puis les horaires. Ont été beaucoup moins citées : la formation des usagers, les données relatives aux ressources humaines (RH) et les données qualitatives issues des enquêtes de satisfaction usagers ou d’expérience des étudiants. Quinze répondants signalent l’existence d’un SID dans leur établissement (dont trois avec un SID bibliothèque), contre douze sans SID. Les répondants mentionnent Power BI (7 fois), Sirocco (5 fois), Sterennes (1 fois), Tableau (1 fois), Sphinx (1 fois). Un constat général : le nombre d’indicateurs remontés volontairement par la BU est deux à trois fois supérieur au nombre d’indicateurs exigés par l’établissement. À l’issue de cette présentation, les participants étaient invités à répondre à cette question en direct : « Quels sont les indicateurs qui vous semblent le plus important de promouvoir, calculer et diffuser à l’avenir ? » (voir figure).

Figure. Nuage de réponses à la question « Quels sont les indicateurs qui vous semblent le plus important de promouvoir, calculer et diffuser à l’avenir ? »
Sécurité, souveraineté et outillage : un nouveau paradigme
La dernière partie de la journée a permis d’aborder les enjeux de souveraineté numérique et de sécurité des données. Thomas Porquet (Couperin) a rappelé les risques liés au Cloud Act, aux conditions contractuelles des éditeurs (ex : Elsevier, EBSCO), et les dérives potentielles de la consolidation verticale. Les dimensions liées au Règlement général sur la protection des données (RGPD), à la réutilisation des données, à l’hébergement sont devenues structurantes dans le choix des outils.
Une grille d’analyse a été présentée (Hélène Pipet, Université Paris-Est Créteil – UPEC, ADBU), articulée autour de quatre axes :
- cadre institutionnel, modèle économique, gestion des accès ;
- capacité de restitution et de visualisation ;
- interopérabilité ;
- ergonomie.
Un panorama des outils a été dressé : Tableau, Power BI, ezMESURE (plateforme nationale basée sur les outils Elastic/Kibana et opérée par l’Inist-CNRS en partenariat avec Couperin), Metabase, SAP BusinessObjects, Qlik, Grafana, Alma Analytics… La souveraineté varie selon les modes d’hébergement et la nature des éditeurs. Lodex, outil public opéré par un opérateur public, a aussi été mentionné comme alternative souveraine.
Des démonstrations ont permis de présenter l’utilisation de certains outils dans des projets déjà aboutis (ezMESURE pour la qualification des usages des ressources numériques à Lille, Omniscope & Tableau pour des indicateurs stratégiques de la BU ou de la Scolarité), en lien avec les questions de modélisation en étoile, de restitution, et de collaboration interservices.
Finalement, une gouvernance à structurer collectivement
Cette journée a permis d’identifier un double impératif : structurer la gouvernance des données (par des fonctions, référentiels, processus) et développer une culture partagée, au croisement des métiers (pilotage, documentation, informatique, recherche). Les bibliothèques, fortes de leur expertise historique en métadonnées, ont toute leur place dans cette dynamique, mais nécessitent des interconnexions plus fortes avec les autres briques du SI (recherche, RH, Direction des études et de la vie universitaire…).
Les échanges ont également souligné un besoin fort de mutualisation, d’outils ouverts, et de formations, pour faire de la donnée un commun stratégique au service du pilotage éclairé et souverain des établissements.
Pour aller plus loin
- ALIOUAT Rachid, « La mécanique de production des indicateurs d’usages des ressources en ligne à l’Université de Lille », dans Compter pour raconter. Du bon usage des données en bibliothèque, sous la direction de Cécile Touitou, Villeurbanne, Presses de l’Enssib, 2025. DOI :https://doi.org/10.4000/13f7i
- BLANC Isabelle, GILLES Mathieu et MORENO Richard, « De la diversité des talents à l'impact collectif : immersion dans Recherche Data Gouv », webinaire du GT Recherche ESR, 27 mars 2025 : https://videos.esup-portail.org/video/1785-webinaire-gt-recherche-esr-recherche-data-gouv/
- NIKICHINE Marie et PORQUET Thomas, « Pistage et profilage des usagers par les éditeurs scientifiques. Quels enjeux pour les bibliothèques ? », note de décryptage Couperin, 15 mai 2025. En ligne : https://www.couperin.org/le-consortium/actus/pistage-et-profilage-des-usagers-par-les-grands-editeurs-scientifiques-quels-nouveaux-enjeux-pour-les-bibliotheques/