Pour une gouvernance de l’information et des données de qualité

Bonnes pratiques et normes volontaires au service des publics – Journée d’étude AFNOR CN46 / BnF – 23 juin 2017

Maya Goubina

En introduction de la journée, Arnaud Beaufort (directeur des Services et des Réseaux de la BnF), souhaite la bienvenue à tous les participants, tout en soulignant l’intérêt de cette rencontre qui réunit des représentants d’établissements publics et privés. C’est la gestion de la qualité des données, qui constitue l’essence même du travail de la normalisation, qui permet de mieux servir le public. En effet, la normalisation permet à la fois de dépasser les frontières et de faire face au « Data déluge ». L’enjeu de l’interopérabilité des données est, bien entendu, crucial. Mais la gouvernance des données permet également d’affermir le capital culturel en donnant un accès toujours plus large aux contenus.

Pierre Fuzeau (président de l’AFNOR CN 46 « Information et Documentation » 1) rappelle que depuis 2001 la France assure la présidence (Gaëlle Béquet) et le secrétariat (Sabine Donnard Cusse) du Comité Technique international ISO/TC 46. La commission de normalisation AFNOR/CN46, miroir du ISO/TC 46 au niveau national, y joue un rôle moteur. Une norme n’est pas une réglementation, mais un référentiel d’adoption volontaire. Le processus de normalisation s’établit par consensus, celui-ci étant un accord des volontés sans aucune opposition formelle. P. Fuzeau souligne l’aspect passionnant de dialogue de cultures qu’offre le travail au sein de l’ISO.

Les résolutions destinées à orienter le travail du comité ISO/TC 46 pour l’année à venir sont prises lors des rencontres annuelles. Mais pendant l’année les groupes de travail se réunissent à distance pour faire progresser la réflexion et aboutir à des documents normatifs. Si le processus de la prise de décision peut paraître long et complexe, Gaëlle Béquet souligne que c’est pourtant lui qui permet de garantir le consensus et la transparence. Cette année le travail du TC 46 avait été organisé autour de cinq thématiques : interopérabilité technique ; qualité – statistiques et évaluation de la performance ; identification et description ; stockage et conservation des documents ; archives/gestion des documents d’activité. Les travaux sur ces thématiques ont été présentés par les cinq sous-comités au cours de la 44e rencontre plénière annuelle du TC 46 qui a eu lieu du 22 au 26 mai 2017 à Pretoria (Afrique du Sud). G. Béquet mentionne notamment l’avancement des travaux de normalisation sur le format E-PUB3 et le fait que la future norme d’échange de données pour l’archivage 2 sera fondée sur la norme française MEDONA. La dernière version de la norme ISBN, votée à l’unanimité en 2016, est en attente de publication. Enfin, parmi les résolutions prises par le TC 46 pour l’année à venir, figure la décision de créer un groupe ad hoc sur la gouvernance de l'information (son rapport sur l’état des lieux au niveau mondial est attendu en mai 2018).

Le premier volet de la journée a été consacré à la « Gouvernance de l’information et des données : actualités dans le contexte national et européen ».

D’après Sylvie Dessolin (SopraSteria Consulting BENELUX), la transformation numérique en œuvre au niveau mondial et l'évolution générale de la société exigent de plus en plus de transparence, de responsabilité, de protection des données, de sécurité, d'interopérabilité et de partage de l'information au sein de tous les organismes et entre services publics, usagers, partenaires publics et privés. Cela implique une stratégie solide de gestion des données, de l'information et des connaissances, autrement dit une véritable gouvernance de l'information. Cela devrait jouer un rôle clé dans le développement d'initiatives de transformation numérique et d’e-gouvernance. Elle remercie Antonella Tarallo, qui présente l’initiative de la Commission Européenne (CE).

La réflexion sur la stratégie de gouvernance de l’information a été impulsée au sein de la CE en 2015. Les données produites et collectées par 30 000 employés des 44 directions générales de la Commission sont conservées dans environ 1 800 bases de données distinctes. L’un des objectifs immédiats est donc la création d’un outil de recherche commun pour toutes ces bases. L’enjeu global du programme d’action annoncé dans le rapport publié 3 est double. Il s’agit d’améliorer le service aux citoyens (grâce à des données plus accessibles), mais aussi de faire évoluer les mentalités et les modes de travail des agents de la CE, en favorisant la culture du partage des connaissances et du travail collaboratif.

Caroline Buscal (Serda-Archimag) présente les résultats du 6e rapport annuel de l’enquête « La gouvernance de l’information numérique dans les organisations » 4. En 2017 la politique de gouvernance de l’information numérique est implantée dans 75 % d’organisations en France. Les acteurs soulignent l’importance d’un équilibre à maintenir entre les deux enjeux de cette gouvernance : la sécurité de l’information (servir l’intérêt de son entreprise) et son partage (répondre à l’usager). Une attente forte est exprimée : celle du développement des référentiels qui doivent être transversaux, interopérables et évolutifs dans le temps. Cette enquête révèle en outre deux points d’alerte. D’une part, seulement 35 % des répondants sont conscients du besoin d’un audit de leur gestion de l’information. D’autre part, 49 % ne savent pas que les données à caractère personnel doivent être soumises aux mêmes règles de gestion. C.Buscal souligne que la gouvernance de l’information doit être transversale, opérationnelle (concrète et pragmatique), adaptée et intégrée à la culture de l’entreprise.

En introduisant le second volet de la journée intitulé « Comment piloter la qualité ? Retours d’expérience », Marie-Françoise Nesme (Temperens) rappelle qu’une norme est une contrainte mais qu’elle offre aussi une zone de confort. En effet, adopter une norme permet à l’organisme d’éviter les risques opérationnels et de s’assurer d’être en conformité avec la loi. Dans la continuité des interventions précédentes, elle confirme l’importance des référentiels et l’enjeu crucial qu’est l’interopérabilité. Enfin, elle évoque les fondamentaux du pilotage de la qualité. Celui-ci doit être une politique, avec des objectifs stratégiques et opérationnels, dont la réalisation doit faire l’objet d’un suivi et d’une amélioration continue en ligne de mire.

Cécile Allain (BnF, Département de la Conservation) présente le plan de sauvegarde des collections comme un outil d’aide à la décision. En effet, les situations d’urgence ont un impact sur les collections et le personnel, mais aussi sur le rapport au public et, plus généralement, sur l’image de l’institution. La démarche qualité paraît donc primordiale et doit résulter d’un processus continu et d’une démarche concertée. Elle doit prendre la forme d’un plan fondé sur des données tangibles et documentées. Elle doit aboutir à des interventions formalisées dont l’efficacité est éprouvée. Tous ces éléments constitutifs d’un plan de sauvegarde réussi sont réunis dans la norme ISO /CD2110:2017-06 dont la publication pour consultation publique est prévue pour 2018.

Anne-Christine Collet est responsable qualité au SCD de l’Université C. Bernard Lyon 1. Cet établissement est la seule BU française à avoir obtenu la certification ISO 9001-2008 pour la qualité de ses services. La démarche qualité est un mouvement en boucle : déterminer les besoins des usagers ; mettre en œuvre le service ; vérifier la satisfaction des usagers ; identifier les insatisfactions des usagers ; élaborer des plans d’actions correctives ; mettre en œuvre ces derniers ; vérifier. La collecte des besoins des usagers n’est pas forcément une tâche lourde et coûteuse. En plus des enquêtes, d’autres moyens existent : être présent dans les conseils et instances de l’Université et dans les associations étudiantes, tenir un cahier de suggestions où noter les remarques récoltées pendant le service public, etc.

Noëlle Drognat-Landré (BM de Lyon) constate l’importance de l’évaluation des services rendus par les bibliothèques. Les statistiques en constituent un préalable, permettant de répondre aux quatre objectifs : mesurer l’activité de l’établissement, en rendre compte aux tutelles ; répartir des moyens ; (se) comparer aux autres et à soi-même dans le temps. S’appuyer sur les normes est essentiel dans une démarche d’évaluation de l’efficience et de l’efficacité des bibliothèques, de leur impact en termes de politiques publiques. Trois normes phares sont à évoquer : l’ISO 2789, « Statistiques internationales de bibliothèques » ; l’ISO 11620, « Indicateurs de performance des bibliothèques » et l’ISO 16439, « Méthodes et procédures pour évaluer l’impact des bibliothèques » (non traduite en français). Et pour que les résultats de l’évaluation puissent servir d’aide à la décision, il faut envisager l’intégration des normes et des référentiels aux Systèmes Informatiques des bibliothèques, ce qui permettrait la data-visualisation des résultats de l’évaluation (cf. les réalisations de la BM de Fresnes, le projet EzMesure du consortium Couperin).

Le troisième volet de la journée a été organisé sous la forme d’une table ronde autour du thème « Référentiels et normes volontaires pour assurer des données de qualité ». Elle a été animée par Françoise Bourdon qui avait tant œuvré au sein de la Bibliothèque nationale de France et dans le cadre de l’AFNOR au développement et à la gouvernance des référentiels, tant au niveau national qu’international.

Stéphanie Roussel (Service Interministériel des Archives de France) présente l’état des lieux et les enjeux des données de référence en archives. Dans le domaine de la description archivistique, la pratique normative est assez ancienne et bien diffusée 5. En revanche, dans le domaine de l’archivage numérique la normalisation est plus récente 6, moins stabilisée et en cours de diffusion. Les défis suivants se dressent : l’élaboration d’outils de gestion et de publication des référentiels et la mise en place de leur gouvernance, mais aussi l’interopérabilité des référentiels en provenance des différentes communautés ainsi que leur visibilité sur le web. La qualité des données est donc déterminante, même si le travail d’alignement des données ne pourrait pas être automatisé complètement.

Charlotte Maday (Spark Archives – Klee group) présente l’initiative menée par l’Association des archivistes français et l’AFNOR. Son objectif a été d’inclure dans la norme ISO 23081 « Métadonnées pour les records » un set de métadonnées concret de référence, dont les composants auraient pour fonction de préserver la valeur et la qualité des documents. Dix institutions nationales et internationales ont répondu à l’appel à contribution et ont envoyé leurs sets pour analyse. Le travail de dépouillement visait à identifier les métadonnées les plus utilisées, à définir un profil minimal, mais aussi à croiser avec les exigences des normes, dont l’ISO 15489 « Records management » et l’ISO 23081. Au terme de l’analyse, un set de neuf métadonnées a été établi. Cependant, le projet d’introduire ce set minimal dans la norme 23081 n’a pas rencontré de consensus international favorable. Les résultats de l’initiative française, reconnue utile, seront diffusés sous la forme d’un livre blanc.

Gildas Illien et Chloé Besombes (Bibliothèques du Muséum national d’histoire naturelle) présentent un focus sur la problématique de l’interopérabilité des données de référence produites par le MNHN. Les données protéiformes (de collection, d’observation, de la recherche) sur le monde du vivant et sur la biodiversité sont produites et conservées dans des silos nombreux et hétérogènes. L’hétérogénéité marque aussi les pratiques disciplinaires et institutionnelles des référentiels, même si ceux-ci concernent les mêmes données : noms d’espèces animales, noms de personnes, localisation géographique, dates, etc. Le MNHN envisage la création d’un référentiel sur les noms de personnes et souhaite faire de ce projet un pilote du FNE 7.

Le quatrième et dernier volet de la journée a été consacré aux « Accès, diffusion et réutilisation ».

L’aspect juridique paraît particulièrement important quand il s’agit de l’ouverture des données. Bruno Ricard (Service interministériel des Archives de France) dresse un état des lieux. Les lois Valter (2015) et Lemaire (2016) instaurent le « droit d’accès » aux documents administratifs (sauf s’ils comportent des secrets protégés par la loi). En outre, la diffusion sur Internet devient désormais une obligation légale (sauf pour les petits organismes). La réutilisation des informations publiques est soumise au droit européen, renforcé par les lois Valter et Lemaire, et repose sur deux principes généraux : elle est de droit et elle est gratuite (sauf réserves et exceptions). En réponse à une question de la salle, B. Ricard confirme la complexification de la juridiction et un certain manque de compétences chez les acteurs concernés. D’après lui, deux solutions peuvent être envisagées : soit continuer l’acculturation à la juridiction existante soit travailler à sa simplification.

Les droits de propriété intellectuelle constituent l’exception au droit de réutilisation. C’est ce qui explique, en grande partie, la diversité des cas d’accès aux documents numérisés dans Gallica : les documents entiers – ou seulement des extraits – sont visibles uniquement dans l’enceinte de la BnF – ou bien à l’extérieur, etc. L’enrichissement des contenus de Gallica a généré le besoin d’un outil de publication des documents numériques (OPDN). En présentant sa création, qui est l’un des projets en cours à la BnF, Emmanuelle Bermès (BnF) précise qu’OPDN facilitera l’aiguillage des documents dans Gallica et permettra la gestion de la qualité (le désherbage) et l’historicisation des métadonnées.

La juridiction sur l’ouverture des données administratives concerne également les données scientifiques. Odile Hologne (INRA) rappelle que leur ouverture n’est possible que si les données sont trouvables, accessibles, interopérables et réutilisables. Elle présente une initiative internationale dans le domaine de l’interopérabilité (la Research Data Alliance, http://rd-alliance.orgg et http://wheatis.org). Et elle constate que la réutilisation des données scientifiques requiert un changement de culture et de pratiques, notamment dans le domaine de la documentation qui doit être la plus exhaustive et structurée possible (protocoles expérimentaux, plans de gestion de données), mais aussi dans le domaine des droits de réutilisation (une définition claire est nécessaire en amont dans les contrats de recherche). Enfin, la traçabilité des réutilisations est un vrai enjeu (DATA culture vs API Culture).

Enfin, l’importance des identifiants uniques pour la réutilisation et la diffusion des données est indiscutable. Véronique Backert (Dilicom) en apporte une preuve tangible en soulignant que l’utilisation de l’ISNI 8 a optimisé (réduction des coûts et meilleure traçabilité) et fluidifié les échanges de données dans la chaîne du livre. Celle-ci est, en plus, un exemple parfait de la synergie entre les secteurs privé et public.

Enfin, Frédérique Joannic-Seta (directrice du département des Métadonnées de la BnF) a conclu la journée en soulignant deux aspects. D’une part, la dimension humaine liée à la gouvernance de l’information. La formation et la sensibilisation des agents, leur montée en compétence et la valorisation des apports des spécialistes, mais aussi la capacité d’impliquer la strate managériale et les DRH à la gouvernance de l’information sont autant de défis à relever. D’autre part, la notion de qualité qui, sans surprise, s’est trouvée au rendez-vous autour d’une double thématique : référentiels de qualité et qualité des référentiels. F. Joannic-Seta termine en évoquant deux chantiers en cours qui s’inscrivent dans la logique de la production de référentiels de qualité et dans lesquels sont impliqués la BnF et l’ABES : celui de la Transition bibliographique 9 et celui du FNE.