Métadonnées et vocabulaires

Conférence Dublin Core 2006

Jacques Ducloy

La conférence, qui s’est déroulée cette année du 3 au 6 octobre à Manzanillo (Mexique), est organisée par le DCMI 1 (Dublin Core Metadata Initiative), forum ouvert pour le développement des standards de métadonnées. Cette communauté s’est bâtie autour des mythiques 15 éléments dans une réunion fondatrice à Dublin (Ohio, et non Irlande) en 1995. Afin d’améliorer la pertinence des recherches sur le web devenu sémantique, elle aborde maintenant tous les aspects de l’interopérabilité. Depuis 2001, les rendez-vous annuels sont des colloques avec des communications scientifiques et des réunions de groupes de travail.

Cette année, le thème général, « Metadata for Knowledge and Learning 2 », place en fait les problématiques de la recherche et de l’enseignement supérieur au cœur des débats pour donner des éléments de réponse à la question : comment augmenter la visibilité des informations scientifiques ? Les participants représentant 4 continents, 25 pays, une dizaine de communautés linguistiques, ont donc exploré deux axes de l’interopérabilité : les formats de métadonnées et les vocabulaires.

Interopérabilité des formats de métadonnées

La problématique des formats de métadonnées est parfois simplifiée par une formule lapidaire : « On réinvente le catalogage. » En fait, les objectifs sont assez différents. Dans un Opac, le bibliothécaire importe des données pour servir une communauté bien définie. Dans une archive ouverte, il exporte des informations scientifiques vers un grand nombre de populations difficiles à identifier.

Les aspects techniques peuvent paraître rébarbatifs. Par exemple, dans sa conférence d’introduction, au milieu de mots-clés comme XML, RDF, application profile ou méta-modèle, Thomas Baker a présenté « une formule magique » : Core Element + Information Model = Application Profile. En réalité, ceci concerne surtout les développeurs qui doivent jongler avec plusieurs couches d’abstraction pour fédérer des applications qui n’ont pas été conçues dans cet objectif. Les principaux intervenants sur ce sujet sont les Américains liés à l’université de Cornell, les Britanniques fédérés par le JISC (Joint Information Systems Committee) et UKOLN 3 (UK Office for Library and Information Networking), les pays nordiques et l’Australie.

En pratique, les applications commencent à atteindre une taille significative avec, par exemple, le réseau NSDL (National Science Digital Library) aux États-Unis ou avec Scielo (Scientific Electronic Library Online, 300 périodiques) dans le monde hispanique. Elles démontrent que les bibliothécaires ont su s’approprier cette technologie.

Parmi les points forts de cette conférence, citons un atelier sur les profils d’application des publications en libre accès, lors duquel Julie Allison (Bath) et Andy Powell ont montré la puissance du formalisme FRBR (Functionnal Requirements for Bibliographic Records).

Interopérabilité des vocabulaires

L’interopérabilité des contenus est un thème récurrent du DCMI 4. Là encore, les mots-clés ont des consonances barbares : « SKOS et OWL ».

SKOS (Simple Knowledge Organisation System) est un standard du W3C (World Wide Web Consortium) pour décrire des vocabulaires et thésaurus. Alistair Miles (Rutherford) a montré son intérêt dans un univers distribué 5. Il s’agit de dépasser le stade « normaliser l’indexation » pour permettre une collaboration entre applications où les fonctions de définition de vocabulaire, indexation, recherche sont multiples et distribuées. Là où nos réflexes sont « centralisés », il faut maintenant penser « distribué » Toujours sur NSDL, Diane Hillmann (Cornell) et Jon Phipps (Washington) ont montré des applications en vraie grandeur.

OWL (Web Ontology Language) fait franchir un pas de plus dans la distribution. Dans un tutorial, Joseph Tennis (British Columbia) a rappelé que chaque concept d’une ontologie est implanté dans un document web repéré par une URL. Parmi les applications pratiques, Margherita Sini (FAO) a exposé la transformation du thésaurus Agrovoc en ontologie.

Du côté des francophones

Lors d’une session francophone, Marie-Claude Côté (gouvernement canadien) a posé le problème de la multiplication des traductions françaises des documents normatifs. Dans le monde anglophone, tout document émis par le DCMI ou le W3C devient immédiatement une référence universelle. Dans le monde francophone, une traduction n’est valide qu’au niveau d’une entité. Par exemple, le gouvernement canadien ne reconnaît pas la traduction de l’Afnor (cadre français et non francophone).

La conférence met en évidence la construction d’une véritable cyberinfrastructure. Elle est entraînée par deux initiatives de référence, le réseau NSDL aux États-Unis et le duo britannique JISC/UKOLN qui fédère l’ensemble du monde anglophone dans un gigantesque réseau interconnecté. D’autres communautés s’y insèrent comme les pays nordiques et surtout le monde hispanisant avec le réseau Scielo. Seul représentant d’une institution française au milieu de 200 acteurs, j’ai pu mesurer la distance qui nous sépare encore de cette infrastructure informationnelle de la recherche mondialisée.

Cependant, au nom d’un groupe d’acteurs issus de diverses institutions (Abes, Agence bibliographique de l’enseignement supérieur ; CCSD, Centre pour la communication scientifique directe ; Inist, Institut de l’information scientifique et technique ; Inra, Institut national de la recherche agronomique ; universités de Paris I et Lyon II), j’ai présenté une communication intitulée « Metadata towards an e-research cyberinfrastructure, the case of French RhD Theses 6 ». En tant qu’auteurs, nous étions inquiets car nous avions plutôt identifié une juxtaposition d’applications centralisées dans un contexte peu fédéré. En réalité, elle a été très bien reçue par les auditeurs qui ont estimé que nous possédions tous les ingrédients d’un projet assez exceptionnel.

De retour en France, j’ai pu lire dans la presse des articles parlant des difficultés de la recherche française dans sa visibilité internationale. Et si une simple prise de conscience des décideurs suffisait pour y remédier…