Journée d’étude 2013 de la Fulbi
« Et 1 et 2 et 3.0 ! » Le web de données : quelles opportunités pour nos missions ? Quelles incidences sur nos outils ?
Cécile Kattnig
On a pu noter une forte présence des professionnels de l’information à la journée annuelle de la Fulbi 1, ce 17 janvier 2013, dans l’auditorium de la médiathèque Marguerite Duras à Paris. L’accompagnement de vélotypie (transcription instantanée) pour malentendants fut très appréciée (dans le cadre de l’initiative de la ville de Paris « Bibliothèques et handicap »). Le propos des organisateurs était, au-delà du décryptage par des spécialistes des « linked data », « Open Data » et « web sémantique », un point sur la réalité législative et une illustration des enjeux des nouveaux services. La deuxième partie de la journée fut d’ailleurs centrée sur des présentations de trois réalisations majeures.
Du web sémantique au web de données
Emmanuelle Bermès 2 choisit comme accroche à son propos l’observation de l’usager actuel sur le web, « volatile et impatient », et du postulat que « c’est à la bibliothèque de venir vers lui », d’où la nécessaire « bibliothèque hors les murs ». Elle adopta ensuite la métaphore d’une langue vivante pour parler des standards du web sémantique à appliquer aux données structurées de catalogues traditionnels : une grammaire (RDF), des vocabulaires exprimés en RDFS ou OWL, des règles d’écriture comme RDFa et un langage de requêtes pour communiquer (SPARQL) ; et insista sur l’importance des URI, identifiants pérennes qui s’appliquent à chaque entité (personne, lieu, concept, etc.) et sans lesquels le linked data ne pourrait fonctionner.
Le principe du web de données (linked data) basé sur les URI est démontré à travers des exemples d’interopérabilité fondée sur les liens : entre la liste d’autorités Rameau des bibliothèques et le Thésaurus W des Archives nationales 3, ou encore l’interconnexion des référentiels en plusieurs langues, notamment entre Rameau – son équivalent en langue anglaise de la Library of Congress LCSH 4 – et la partie matière de GND 5, référentiels de la Deutsche Nationalbibliothek. « Être dans le web », tel est l’enjeu. Ainsi, l’OCLC 6 a pu mettre les données de WorldCat dans schema.org, le vocabulaire commun élaboré pour les moteurs de recherche déjà intégré par Google, Bing et Yahoo 7.
Visualisation interactive des données et Open Data
Caroline Goulard, cofondatrice de Dataveyes, spécialisée dans la visualisation interactive et la valorisation des données, résuma son métier : « Raconter des histoires avec des données 8. » Les exemples cités, comme l’accessibilité donnée par le Groupe Pages Jaunes canadien à leur API 9 asservie de limites fixées 10, la présentation visuelle du budget proposé par Barack Obama lors des élections présidentielles par le New York Times 11 avec jeux de couleur, nuage dynamique, etc., ou encore la visualisation des données issues du recensement Insee exploitées par Rennes Métropole dans le cadre des débats sur les nouvelles technologies engagés en octobre 2012 12 sont autant d’applications de réutilisation de données ouvertes par la réalisation de nouveaux services et de « création de valeur 13 ». Sa dernière démonstration a porté sur la visualisation des données issues de la Banque mondiale pour présenter la situation de sept pays sur lesquels Arte a produit des documentaires 14.
Législation, normalisation, usage…
Lionel Maurel 15 posa le cadre législatif français avec la loi du 17 juillet 1978 16 sur le principe de la libre réutilisation des informations publiques mais rappella que l’Open Data n’a pas de cadre juridique particulier. Sa mise en place est limitée par de multiples contraintes dues notamment aux différentes licences, à l’exception culturelle et scientifique revendiquée par certaines institutions et à l’absence d’obligation de format ouvert interopérable. Les structures françaises ont ainsi opté pour la licence ouverte Etalab 17 (choisie par l’Abes), ou pour l’ODbl 18 (ville de Paris), ou pour la CC0 19 (Europeana). Les différents exemples d’ouverture ou d’interprétation restrictive, voire de tentative de « reprivatisation » confirment la difficile ouverture des données 20.
Peut-on faire de l’Open Data sans normalisation ? Stéphane Pouyllau 21 exposa la mise en place de MédiHAL 22, archive ouverte dédiée aux chercheurs en sciences humaines et sociales pour leur permettre de déposer, publier et réutiliser leurs images dans un environnement pérenne, normalisé et ouvert, complémentaire des initiatives portant sur des contenus textuels. Ce réservoir alimente la plate-forme de recherche Isidore d’Adonis-CNRS.
L’usage des référentiels dans data.bnf.fr
Que deviennent les référentiels dans le web sémantique ? Romain Wenz 23 axa sa présentation du projet data.bnf.fr sur l’importance de l’apport des référentiels Dewey et Rameau ainsi que d’autres vocabulaires comme Agrovoc, Thésaurus W, Geonames, id.loc.gov qui, en lien avec DBpedia, démultiplient les points d’accès entre les collections exposées sur le web. Le développement d’alignements de personnes, d’œuvres, de lieux permet d’interconnecter des informations de provenances diverses, notamment de catalogues, d’inventaires et de la bibliothèque numérique comme l’exemple présenté du flibustier et cartographe Exquemelin 24.
Bertrand Sajus 25 exposa la méthodologie appliquée à la réalisation du module HDA-BO portant sur le tagging 26 du corpus du site Histoiredesarts.culture.fr qui propose des ressources en ligne pour l’enseignement de l’histoire des arts. L’expérimentation 27 porte sur la liaison des tags existants à wikipedia, choisi comme référentiel, et s’est étendue par la réalisation d’une interface de recherche, HDA-Lab. Alexandre Monnin 28 clôtura en présentant l’enjeu de la plate-forme de collaboration tripartite Sémanticpédia 29, lancée en novembre dernier.
En guise de conclusion, Marianne Clatin 30 annonça la présentation au Salon du livre de la première expérience d’utilisation des données de data.bnf.fr avec le catalogue de la bibliothèque de Fresnes, le projet OpenCat 31. •