entête
entête

Journée d’étude 2013 de la Fulbi

« Et 1 et 2 et 3.0 ! » Le web de données : quelles opportunités pour nos missions ? Quelles incidences sur nos outils ?

Cécile Kattnig

On a pu noter une forte présence des professionnels de l’information à la journée annuelle de la Fulbi  1, ce 17 janvier 2013, dans l’auditorium de la médiathèque Marguerite Duras à Paris. L’accompagnement de vélotypie (transcription instantanée) pour malentendants fut très appréciée (dans le cadre de l’initiative de la ville de Paris « Bibliothèques et handicap »). Le propos des organisateurs était, au-delà du décryptage par des spécialistes des « linked data », « Open Data » et « web sémantique », un point sur la réalité législative et une illustration des enjeux des nouveaux services. La deuxième partie de la journée fut d’ailleurs centrée sur des présentations de trois réalisations majeures.

Du web sémantique au web de données

Emmanuelle Bermès  2 choisit comme accroche à son propos l’observation de l’usager actuel sur le web, « volatile et impatient », et du postulat que « c’est à la bibliothèque de venir vers lui », d’où la nécessaire « bibliothèque hors les murs ». Elle adopta ensuite la métaphore d’une langue vivante pour parler des standards du web sémantique à appliquer aux données structurées de catalogues traditionnels : une grammaire (RDF), des vocabulaires exprimés en RDFS ou OWL, des règles d’écriture comme RDFa et un langage de requêtes pour communiquer (SPARQL) ; et insista sur l’importance des URI, identifiants pérennes qui s’appliquent à chaque entité (personne, lieu, concept, etc.) et sans lesquels le linked data ne pourrait fonctionner.

Le principe du web de données (linked data) basé sur les URI est démontré à travers des exemples d’interopérabilité fondée sur les liens : entre la liste d’autorités Rameau des bibliothèques et le Thésaurus W des Archives nationales  3, ou encore l’interconnexion des référentiels en plusieurs langues, notamment entre Rameau – son équivalent en langue anglaise de la Library of Congress LCSH  4 – et la partie matière de GND  5, référentiels de la Deutsche Nationalbibliothek. « Être dans le web », tel est l’enjeu. Ainsi, l’OCLC  6 a pu mettre les données de WorldCat dans schema.org, le vocabulaire commun élaboré pour les moteurs de recherche déjà intégré par Google, Bing et Yahoo  7.

Visualisation interactive des données et Open Data

Caroline Goulard, cofondatrice de Dataveyes, spécialisée dans la visualisation interactive et la valorisation des données, résuma son métier : « Raconter des histoires avec des données 8. » Les exemples cités, comme l’accessibilité donnée par le Groupe Pages Jaunes canadien à leur API  9 asservie de limites fixées  10, la présentation visuelle du budget proposé par Barack Obama lors des élections présidentielles par le New York Times 11 avec jeux de couleur, nuage dynamique, etc., ou encore la visualisation des données issues du recensement Insee exploitées par Rennes Métropole dans le cadre des débats sur les nouvelles technologies engagés en octobre 2012  12 sont autant d’applications de réutilisation de données ouvertes par la réalisation de nouveaux services et de « création de valeur  13 ». Sa dernière démonstration a porté sur la visualisation des données issues de la Banque mondiale pour présenter la situation de sept pays sur lesquels Arte a produit des documentaires  14.

Législation, normalisation, usage…

Lionel Maurel  15 posa le cadre législatif français avec la loi du 17 juillet 1978  16 sur le principe de la libre réutilisation des informations publiques mais rappella que l’Open Data n’a pas de cadre juridique particulier. Sa mise en place est limitée par de multiples contraintes dues notamment aux différentes licences, à l’exception culturelle et scientifique revendiquée par certaines institutions et à l’absence d’obligation de format ouvert interopérable. Les structures françaises ont ainsi opté pour la licence ouverte Etalab  17 (choisie par l’Abes), ou pour l’ODbl  18 (ville de Paris), ou pour la CC0  19 (Europeana). Les différents exemples d’ouverture ou d’interprétation restrictive, voire de tentative de « reprivatisation » confirment la difficile ouverture des données  20.

Peut-on faire de l’Open Data sans normalisation ? Stéphane Pouyllau  21 exposa la mise en place de MédiHAL  22, archive ouverte dédiée aux chercheurs en sciences humaines et sociales pour leur permettre de déposer, publier et réutiliser leurs images dans un environnement pérenne, normalisé et ouvert, complémentaire des initiatives portant sur des contenus textuels. Ce réservoir alimente la plate-forme de recherche Isidore d’Adonis-CNRS.

L’usage des référentiels dans data.bnf.fr

Que deviennent les référentiels dans le web sémantique ? Romain Wenz  23 axa sa présentation du projet data.bnf.fr sur l’importance de l’apport des référentiels Dewey et Rameau ainsi que d’autres vocabulaires comme Agrovoc, Thésaurus W, Geonames, id.loc.gov qui, en lien avec DBpedia, démultiplient les points d’accès entre les collections exposées sur le web. Le développement d’alignements de personnes, d’œuvres, de lieux permet d’interconnecter des informations de provenances diverses, notamment de catalogues, d’inventaires et de la bibliothèque numérique comme l’exemple présenté du flibustier et cartographe Exquemelin  24.

Bertrand Sajus  25 exposa la méthodologie appliquée à la réalisation du module HDA-BO portant sur le tagging  26 du corpus du site Histoiredesarts.culture.fr qui propose des ressources en ligne pour l’enseignement de l’histoire des arts. L’expérimentation  27 porte sur la liaison des tags existants à wikipedia, choisi comme référentiel, et s’est étendue par la réalisation d’une interface de recherche, HDA-Lab. Alexandre Monnin  28 clôtura en présentant l’enjeu de la plate-forme de collaboration tripartite Sémanticpédia  29, lancée en novembre dernier.

En guise de conclusion, Marianne Clatin  30 annonça la présentation au Salon du livre de la première expérience d’utilisation des données de data.bnf.fr avec le catalogue de la bibliothèque de Fresnes, le projet OpenCat  31. •