Journée d’étude BnF/Afnor CG46
Référentiels et données d’autorité à l’heure du web sémantique
Cécile Kattnig
Le 27 mai 2011, la journée d’étude organisée dans le grand auditorium de la Bibliothèque nationale de France par la commission générale Afnor CG46 du 27 mai 2011 a rassemblé 280 professionnels 1. Elle faisait suite à celle du 28 mai 2008 2, et y furent présentés les travaux de normalisation et les réalisations rendues possibles par l’exposition des référentiels en Linked Data 3 utilisés comme pivots dans plusieurs applications pour faciliter la recherche et la mise en relation des ressources numériques.
La matinée fut consacrée à des exposés théoriques sous forme de trois tutoriels resituant les systèmes d’organisation des connaissances dans le contexte des technologies et usages du web sémantique, et l’après-midi à des retours d’expériences issues de communautés différentes (archives, bibliothèques, société de gestion de droits…).
Les systèmes d’organisation des connaissances de Babel aux Linked Data
Pour illustrer « la visibilité inédite sur le web » que l’approche Linked Data donne aux systèmes d’organisation des connaissances, Bruno Menon 4 en retraça l’historique et présenta les analogies entre les dispositifs existants : thesaurus/ontologies, classifications bibliographiques/classification de sciences, modèles de données/ontologies, arts de la mémoire/classifications bibliographiques… Les travaux linguistiques produits au XVIIe siècle ainsi que l’élaboration des listes lexicales à l’époque babylonienne qu’il présenta illustrèrent « la nécessité d’instrumenter la saisie de la connaissance ».
Publier et exploiter les référentiels sur le web sémantique
Emmanuelle Bermès 5 exposa avec clarté les principes de l’utilisation des technologies du web sémantique pour la représentation des référentiels et leur publication en Linked Data. Elle rappela que le web sémantique s’appuie sur des standards et des protocoles et insista sur les avantages du vocabulaire SKOS (Simple Knowledge Organization System) pour décrire les référentiels et permettre des alignements de vocabulaires, ainsi que sur l’importance des URIs (Uniform Resource Identifier) 6.
Gautier Poupeau 7 présenta des exemples d’exploitation de référentiels : le multilinguisme du thesaurus Agrovoc de la FAO 8, le service Faviki pour rattacher un tag à un concept déclaré dans un référentiel 9, Open Calais pour le repérage d’entités nommées – lieu, entreprise, personne – s’appuyant sur des référentiels 10 et enfin la plateforme de recherche Isidore du TGE Adonis du CNRS 11 portant sur 800 sources dans le domaine de la recherche en sciences humaines et sociales 12.
Réalisations et prototypes en ligne
VIAF 13 est un fichier d’autorité international dont l’objectif est de créer des liens entre les fichiers d’autorité des bibliothèques nationales. Il regroupe à ce jour 19 établissements et 22 fichiers d’autorité personnes physiques et collectivités. L’alignement des notices se rapportant à la même personne ou collectivité s’effectue à partir des notices d’autorité ainsi que des notices bibliographiques liées. Les données de VIAF sont utilisées dans différents projets comme celui de la BnF 14, Arrow 15, etc.
ISNI 16 est un identifiant international ISO pour les personnes, organismes ou personnages fictifs connus sous leurs identités publiques dans le secteur des industries des médias. L’ISNI est conçu comme une passerelle entre les différents systèmes propriétaires d’identification d’ayants droit (IPN et IPI) 17 et des outils publics comme VIAF.
IdRef 18 est une application dédiée à la diffusion des référentiels Sudoc pour l’enseignement supérieur et la recherche : personnes physiques, collectivités, titres, Rameau, MesH... L’Abes développe une gamme de services permettant l’utilisation de ses données par ses partenaires comme pivot de l’information scientifique et technique.
SNAC 19 est un projet visant à générer des données d’autorité archivistiques enrichies à partir des instruments de recherche de plusieurs institutions aux États-Unis. Une toile de relations permet ensuite d’explorer l’information archivistique. Les données d’autorité sont en EAC-CPF 20. Le projet se sert de VIAF pour les formes des noms.
Autre nouveauté : la nouvelle norme ISO 25964 « Thésaurus et interopérabilité avec d’autres vocabulaires », présentée par Hélène Rabaut et Hélène Zysman, qui prend en compte les standards du web et notamment SKOS 21.
Jamal Rezzouk 22 illustra l’apport du web sémantique à l’information juridique distinguant la ressource de la connaissance avec deux projets européens : MetaLex 23 pour l’échange de textes juridiques et Estrella 24 pour la création des connaissances.
Une promenade dans les sites mentionnés sera la meilleure illustration de cette journée. •