Transition bibliographique : en avant marche !

Philippe Cantié

Le 26 juin dernier se déroulait une journée co-organisée par la BnF et l’Afnor/CN46 intitulée :

La Transition bibliographique aujourd'hui. La préparer et la mettre en œuvre dans les bibliothèques, les archives, les musées, etc.

Au même moment étaient mis en ligne un site dédié à la Transition bibliographique ainsi qu’un livre blanc sur RDA-FR

On désigne sous le terme de « Transition bibliographique » un programme national qui se donne pour finalité l’exposition des catalogues de bibliothèques dans le web de données. Il participe d’un mouvement qui vise à faciliter l’accès aux données, à maximiser leur utilisation et à s’adapter aux pratiques de recherche et de navigation sur le web. L’ouverture des silos de données et l’interconnexion de ces données entre elles sont la condition pour parvenir à ces objectifs.

De RDA à RDA-FR

La Transition bibliographique qui comporte de nombreux enjeux juridiques, politiques, économiques, technologiques, professionnels etc. a pour origine la publication en 2010 d’un nouveau code de catalogage, RDA (Ressources : description et accès), dont les ambitions affichées ne pouvaient être accueillies que très favorablement : prise en compte du nouvel environnement numérique des catalogues, description des ressources numériques et de leurs spécificités, conformité au modèle FRBR. Une analyse fine des règles RDA a mis cependant en évidence un certain nombre de risques de régression par rapport à ce que la tradition catalographique française comporte de meilleur mais surtout a mené à la conclusion que le code de catalogage RDA n’était pas rigoureusement conforme au modèle FRBR.

Portée par une structure organisationnelle remaniée, la Transition bibliographique répond à une feuille de route cosignée par les deux agences bibliographiques nationales (la BnF et l’ABES) et leurs ministères de tutelle respectifs. Entre immobilisme et ralliement inconditionnel à RDA, le cap stratégique de la Transition bibliographique consiste en un double mouvement de convergence. L’élaboration d’un profil français (RDA-FR) doit permettre d’une part de valider la structure générale de RDA, d’en reprendre les éléments et les règles tout en s’accordant le droit souverain de les modifier, de les supprimer ou d’en ajouter. D’autre part, la position française vise à extraire RDA de son ancrage historique et culturel particulier non seulement pour le rapprocher de ses propres analyses mais aussi pour le rendre authentiquement international.

Transition bibliographique et conduite du changement

Comme l’a souligné en ouverture Sylviane Tarsot-Gillery, directrice générale de la BnF, les métadonnées sont au cœur du métier des bibliothèques et celles-ci ont une responsabilité sociétale en la matière. La Transition bibliographique ne se réduit pas à un changement de norme de catalogage : c’est l’ensemble des acteurs qui gravitent dans l’écosystème des métadonnées de bibliothèques qui seront nécessairement affectés. D’où l’importance de former les catalogueurs et d’organiser la formation de formateurs dans la perspective de la production de données nativement FRBRisées ainsi que de partager de l’information avec les administrateurs et les éditeurs de logiciels de gestion de bibliothèques. Le succès de la Transition bibliographique dépendra également de la capacité à gérer les différences de temporalité entre d’une part les évolutions normatives et d’autre part les progrès technologiques ou l’évolution des usages.

La prééminence du modèle conceptuel
sur le code de catalogage

Pour Philippe Le Pape, chargé de mission normalisation à l’ABES, la Transition bibliographique n’a de sens que si les règles de catalogage permettent la mise en œuvre du modèle FRBR dont il a illustré la logique à partir d’un seul exemple.

La structuration des données selon le modèle FRBR 1, c’est-à-dire la réorganisation de l’information bibliographique sur la base d’entités (Œuvre, Expression, Manifestation, Item etc.) et de relations est la condition première pour construire le graphe qui permet d’exposer des données liées sur le web.

Bien qu’antérieur au web sémantique, le modèle FRBR constitue le moyen de faire évoluer des catalogues informatisés traditionnels qui, d’une ergonomie obsolète, ne font que reproduire la logique des anciens fichiers papier et se bornent à décrire les niveaux de la Manifestation et/ou de l’Item. On y décrit des produits éditoriaux sans les inscrire dans un contexte.

Le modèle FRBR répond également à l’évolution des usages. Bien que présents sur la Toile, les catalogues de bibliothèques ne sont plus des points d’entrée vers les données. En outre, l’internaute d’aujourd’hui ne cherche que rarement une ressource spécifique préalablement identifiée. Dans le web de données, la FRBRisation est ce qui permet, par un système de liens et de rebonds, de démultiplier les possibilités de découverte 2 par l’usager de ressources dont il n’avait pas a priori connaissance.

Influer sur les évolutions de RDA

Le code de catalogage RDA n’est pas un produit fini définitivement stabilisé. Des propositions d’évolution sont ainsi régulièrement examinées et le cas échéant approuvées avant publications de mises à jour en fonction d’un calendrier bien défini. Dans le paysage de la normalisation bibliographique internationale, Françoise Bourdon, adjointe au directeur du département de l'Information bibliographique et numérique (BnF), a souligné le rôle éminent joué par la Section de catalogage de l’IFLA qui est chargée de définir des règles internationales de catalogage et supervise entre autres la révision de l’ISBD, des modèles FRBR, FRAD et FRSAD, des Principes internationaux de catalogage etc. Dans le monde anglo-saxon, l’acteur principal se nomme le Joint Steering Committee (JSC). C’est lui qui, après avoir supervisé le passage aux AACR2 (Anglo-American Cataloguing Rules) en 1978, pilote RDA depuis 2004. Les groupes de travail créés par le JSC sur les agrégats, les majuscules, les entités fictives, les codes de fonction, RDA/ONIX Framework, sont en relation avec des groupes d’intérêt qui opèrent au sein de l’IFLA. Le président du JSC en personne, Gordon Dunsire, sert d’agent de liaison auprès de l’IFLA. Un nouveau modèle de gouvernance est en gestation dont les principaux objectifs sont l’internationalisation de RDA, l’implication de communautés produisant d’autres types de données culturelles et l’extension de l’usage de RDA en relation avec le Linked Data. EURIG, groupe d’intérêt européen sur RDA, est un autre levier d’action pour faire évoluer RDA dans un sens favorable à l’approche française car un représentant d’EURIG est invité à siéger dans les groupes de travail du JSC. Parce que l’élaboration d’une norme de catalogage est dans une certaine mesure le reflet d’un rapport de force, il est important d’assurer une présence française dans les instances de l’IFLA et d’EURIG et de suivre les évolutions de RDA afin de défendre le point de vue et les intérêts.

RDA en ligne de mire :
la position française et celle des autres pays

Tous les pays font route vers RDA. Certes chacun fait chemin à son rythme. Comme le souligne Mélanie Roche (BnF, département de l'Information bibliographique et numérique), les pays de tradition AACR font preuve d’un plus grand entrain que les pays de tradition ISBD comme l’Espagne ou la France. Tous les pays sont néanmoins confrontés à des problématiques similaires : licences d’accès à RDAToolkit, traduction de RDA, évaluation des nouvelles règles et formation à l’application de ces règles.

Thierry Clavel, coordinateur du catalogage au sein du Réseau des bibliothèques de Suisse occidentale (RERO), s’est livré à un état des lieux des bibliothèques suisses dans un pays marqué par le multilinguisme, la grande autonomie des cantons, et des traditions bibliographiques plurielles avant d’évoquer le projet D-A-CH d’implémentation de RDA qui a permis à l’Allemagne, à l’Autriche et à la Suisse de développer un profil d’application commun aux pays germaniques.

L’adapter puis l’adopter : le titre de l’intervention de Françoise Leresche (BnF), responsable du volet Normalisation au sein de la Transition bibliographique, résume à merveille la position française vis-à-vis de RDA. Elle a présenté RDA comme un outil destiné à FRBRiser les catalogues non pas a posteriori mais à la source et à garantir l’exposition de leur contenu sur le web grâce à une structuration des données en RDF. L’adoption officielle de RDA par la France est suspendue à la résolution de certains désaccords majeurs concernant les règles ou l’interprétation du modèle FRBI 3. Son intérêt immédiat pour l’interopérabilité et la dérivation de notices est singulièrement limité par les nombreuses alternatives proposées dans l’application des règles et par l’émergence de profils spécifiques. D’autre part, les conditions techniques et pratiques d’un catalogage frbrisé à la source n’étant pas réunies pour l’heure, le coût d’un changement prématuré excéderait de loin les bénéfices escomptés.

Le code de catalogage s’avère finalement secondaire par rapport au chantier de la FRBRisation qui est abordé par le biais de la diffusion, avec des réalisations telles que data.bnf.fr ou theses.fr. La FRBRisation des notices existantes passe par la création de notices d’Oeuvre auxquelles elles seront rattachées, par un travail sur l’articulation entre types de support pour les ressources numériques et physiques ou encore par la construction de l’interopérabilité grâce à des identifiants trans-métiers comme l’ISNI ou le partage de données d’autorité, relatives notamment aux Agents…

Une nouvelle organisation au service
de la Transition bibliographique

F. Leresche a présenté la nouvelle organisation qui porte désormais le programme de Transition bibliographique. Au sommet, un comité stratégique bibliographique réunit les deux agences bibliographiques nationales (BnF et ABES) et leurs ministères de tutelle respectifs. Le pilotage stratégique de la Transition bibliographique est confié aux directeurs de ces agences. Une coordination technique collégiale composée de trois volets (Formation, Systèmes et données et Normalisation,) est chargée de la mise en œuvre de la Transition bibliographique.

Géraldine Lucerna (Centre Régional de Formation aux Carrières des Bibliothèques de Normandie), a détaillé les objectifs du groupe Formation dont elle est responsable : construction de cursus de formation, animation d’un réseau national de formateurs, réalisation de supports nationaux, programme de formation de formateurs.

Le groupe Systèmes et données, dirigé par Philippe Bourdenet (Université du Mans) a pour vocation de communiquer des informations utiles aux administrateurs de SIGB (préconisations en vue d’une réinformatisation, implications des nouvelles règles sur les systèmes) et aux éditeurs de SID (fourniture de jeux de données FRBRisées, implications des nouvelles règles sur les formats). Il a également pour but d’assurer une veille autour d’initiatives, de produits et ou technologies. Les retours d’expérience sont collectés sur un site web dédié .

Le groupe Normalisation, piloté par Françoise Leresche, est composé de 4 groupes de travail articulés autour des entités FRBR (description des manifestations et des items, autorités Œuvres et Expressions, Données Personnes et Familles, Données Collectivités), d’un groupe consacré aux relations entre entités FRBR et d’un dernier groupe sur la Musique.

RDA-FR : vers une éclipse progressive des normes Afnor

Le travail du groupe Description des Manifestation et des Items, par exemple, consiste à partir de la traduction francophone de RDA pour identifier les points de divergence qui justifient un maintien de l’analyse française et nécessitent une reformulation, un ajout, une suppression, un déplacement, une précision etc. Les membres du groupe substituent également des exemples français aux exemples de RDA.

Le groupe se réfère à la fois aux règles de RDA et à son organisation qu’il suit respectueusement. La structuration par éléments de données permet cependant de définir un programme de travail qui épouse de manière assez souple les priorités de catalogage. En 2016, les travaux porteront ainsi sur les éléments pour la description matérielle des ressources électroniques, sur les éléments relatifs à l’adresse bibliographique et sur les types de support.

Les premiers éléments de RDA-FR qui viennent d’être publiés sont destinés à remplacer progressivement les normes Afnor. Ni adaptation systématique (puisque RDA-FR reprend à l’identique une grande partie des règles de RDA), ni adoption officielle et globale, RDA-FR est un exemple d’ad(o/a)ptation.

Pour la Transition bibliographique, le chemin se fait donc en marchant. Il n’y aura pas de grand soir mais pour paraphraser encore Antonio Machado, un jour, on regardera en arrière et on verra le sentier que jamais on ne doit à nouveau fouler.

Du Linked Data comme horizon
de la Transition bibliographique

Pour Emmanuelle Bermès, BnF, adjointe aux questions scientifiques et techniques, direction des Services et des réseaux, la Transition bibliographique ne saurait être réduite à la simple problématique du remplacement des formats MARC. Son horizon est le Linked Data. Le formalisme du web sémantique a ceci de particulier qu’il se fonde sur une grammaire élémentaire universelle. Les triplets qui associent un Sujet, un Prédicat et un Objet ont ainsi la capacité de faire la jointure entre des briques ou des vocabulaires hétérogènes.

Différents modèles du web sémantique existent pour accompagner les bibliothèques vers le Linked Data : BIBFRAME , développé au sein de la Bibliothèque du Congrès, se définit non pas comme un nouveau format mais comme un cadre qui ne réalise qu’une implémentation partielle du modèle FRBR. Le modèle schema.org, utilisé par les éditeurs de sites web et autres webmestres, permet quant à lui d’exposer des données structurées sur le web pour qu’elles soient exploitées efficacement par les moteurs de recherche. Malgré une multitude de classes, ce modèle issu du web ne couvre pas tous les besoins des bibliothèques. C’est pourquoi OCLC a développé une extension de schema.org baptisée Bibliograph.net . Le site data.bnf.fr incarne un modèle fondé sur l’agrégation de briques existantes simples en vue de la diffusion de données. Le projet FiGraLiDa (Fine-Grained Bibliographic Linked Open Data) vise quant à lui à développer une ontologie RDF basée sur FRBRoo pour exposer le contenu selon une granularité plus fine.

Tous ces modèles ont un seul et unique but qui est de relier des données hétérogènes, qu’elles proviennent des éditeurs, des bibliothèques ou de contributions des usagers, tout en évitant la duplication de ces données d’un environnement à l’autre. Le web sémantique suscite dans le monde des bibliothèques de nombreuses interrogations quant à la qualité des données, à l’interface de production ou encore à la charge de travail induite. La complexité technologique et le degré de maturité insuffisant du web sémantique inspirent également des inquiétudes, en particulier chez les fournisseurs de SIGB.

Le web sémantique passe par un travail préalable sur la modélisation des données et la création de passerelles d’interopérabilité entre formats grâce à des conversions ou des enrichissements automatiques. La mise en place de systèmes intelligents capables d’exploiter les entrepôts de données et de relever le défi de l’hétérogénéité permettra également de masquer la complexité et d’en neutraliser le potentiel d’effroi…

Voies et moyens de l’interopérabilité

La question de l’alignement par rapport à RDA place la problématique de l’interopérabilité au cœur de la Transition bibliographique. Une table ronde animée par Jérôme Villeminoz (BnF, Département de l’information bibliographique et numérique) et réunissant Claire Sibille (Service interministériel des Archives de France), Katell Briatte (Ministère de la Culture et de la Communication) et Vincent Boulet (BnF, Département de l’information bibliographique et numérique) a abordé la question de l’interopérabilité entre les bibliothèques et les autres communautés professionnelles 4(archives, musées, administrations etc.). L’utilisateur s’intéresse à des contenus et non aux institutions qui les détiennent et les référencent dans leurs bases de données. L’interopérabilité est un moyen de remédier à la dispersion des fonds et des collections. L’interopérabilité opère à plusieurs niveaux : à l’intérieur de chaque communauté professionnelle, à l’intersection d’une ou plusieurs communautés ayant en commun des objets similaires qu’elles abordent avec des points de vue spécifiques (on trouve par exemple des archives aussi bien dans des bibliothèques que dans les fonds conservés par les services d’archives), entre communautés susceptibles de dialoguer ensemble grâce à des concepts, des référentiels, des vocabulaires soit communs soit modulables entre eux (alignements).

En clôture de la journée, Gildas Illien, BnF, directeur du Département de l’information bibliographique et numérique, a souligné que le changement de SI et le changement de format n’était pas inscrit, du moins dans l’immédiat, au programme de la Transition bibliographique. De plus, RDA ne concernera pas nécessairement toutes les ressources (comme les bases d’articles par exemple). Le catalogue n’est qu’un réservoir de données parmi d’autres. L’accès aux ressources électroniques en particulier ne se fait pas toujours par le biais du catalogue. Il importe dès lors d’identifier les gisements pour lesquels s’impose la nécessité d’une description établie ressource en main selon les règles de RDA-FR. Pour le reste, il est tout à fait concevable de procéder essentiellement à des manipulations et retraitements de données ou encore à des regroupements sur le modèle du Hub de métadonnées développé par l’ABES, en respectant une politique préalablement établie de qualité des données.

Citant la proposition 79 du Rapport Lescure de mai 2013 qui préconise la création de registres ouverts de métadonnées, il insiste cependant sur la nécessité de conserver la maîtrise des données dans un environnement où évoluent nombre d’acteurs commerciaux à dimension multinationale et conclut la journée par un éloge de l’interopérabilité et de la convergence. Il cite notamment la Société des gens de lettres qui dans son projet BALZAC s’appuie sur le fichier d’autorité Personnes physiques de la BnF pour la gestion des droits mais appelle surtout de ses vœux la réalisation prochaine d’un outil de co-production des autorités BnF et des autorités Sudoc qui soit totalement indépendant des systèmes.