entête
entête

Numelyo, la bibliothèque numérique de Lyon

Nicolas Gros

Pierre Guinard

Une multitude de fonds offerts au public

Ouverte le 12 décembre 2012, Numelyo  1, la bibliothèque numérique de Lyon, répond à quelques principes simples :

  • Mettre à disposition du public gratuitement, sous forme numérique, les collections conservées à la bibliothèque municipale de Lyon (BML).
  • Proposer des outils permettant aux internautes d’interroger ces données, de les stocker, de les copier en différents formats, de faire le lien avec d’autres services de la BML.
  • Proposer des parcours permettant la découverte ou l’approfondissement au sein de ces collections.
  • Inviter le public à participer.

Numelyo regroupe, d’une part, des éléments numérisés depuis longtemps et, d’autre part, donne à voir de nouveaux pans très importants des riches collections lyonnaises.

Illustration
Page d’accueil de Numelyo.

Elle accueille des collections déjà numérisées, tirant profit des expériences lancées depuis 1993. La collection d’enluminures compte plus de 12 000 images, celle des estampes a dépassé les 6 000 images ; celle des affiches, 1 000 ; les marques de provenance, 1 100 ; et ces ensembles continuent à être enrichis. Numelyo intègre d’autres blocs qui avaient fait l’objet de développements spécifiques et qui sont en cours d’homogénéisation :

  • Les manuscrits mérovingiens et carolingiens (16 000 pages).
  • La presse lyonnaise de 1790 à 1944 avec plus de 270 titres (340 000 pages) dans l’attente du versement de deux des grands quotidiens lyonnais : Le Courrier de Lyon (1832–1901) et Le Salut public (1848–1944).
  • La section Photographes en Rhône-Alpes (environ 32 000 photographies) présente l’originalité de proposer côte à côte des collections conservées à la bibliothèque et lui appartenant  2 et des images provenant du public et intéressant la région Rhône-Alpes (environ une cinquantaine de contributeurs à ce jour). Les photographies déposées à la BML sous forme de copie numérique font l’objet d’une cession de droits non exclusifs, pour laquelle tout usage commercial par la BML est interdit. L’auteur reste libre d’exploiter, comme il le souhaite, les droits liés à ses photographies. Il est possible de circuler dans ces ensembles par collection, par lieu, par genre, par date, par album,

Un accroissement toujours en cours

L’ouverture de Numelyo a permis d’intégrer des collections nouvellement numérisées. La masse la plus importante est constituée par des livres imprimés avant 1920 et libres de droits pour lesquels la ville de Lyon avait lancé un appel d’offres, remporté en 2008 par la société Google. La numérisation, commencée fin 2009, est toujours en cours (plus de 300 000 ouvrages déjà numérisés). Si ces fichiers sont déjà consultables sur Google Books en grande quantité, ils alimentent progressivement Numelyo. Le but n’est évidemment pas de chercher à concurrencer un réservoir comme Google Books, mais de faciliter l’accès aux ouvrages, d’une part, en donnant des clés de recherche efficaces, d’autre part, en mettant les documents en perspective dans les parcours proposés.

Un second ensemble est constitué par les archives du canut Pierre Charnier (1795–1857). Les milliers de pages numérisées peuvent être vues à partir de l’inventaire encodé en EAD (Encoded Archival Description).

Enfin, plusieurs photographes contemporains (Jean Dieuzaide, Pierre Jamet, Jean-Baptiste Carhaix, René Basset, Georges Baguet) ou leurs ayants droit ont donné leur autorisation pour publier une partie de leur production dans la base Photographies.

Au total, ce sont déjà plus de 62 000 entités  3 qui ont été numérisées, ce qui représente plus de 2 500 000 pages. Ce chiffre est appelé à grossir rapidement avec l’introduction continue des ouvrages imprimés anciens et de la presse régionale. Si la quantité des données proposées est un critère très important et une nécessité, Numelyo souhaite aussi proposer des accès de qualité.

Outre le fait de donner accès directement et gratuitement aux collections numérisées, Numelyo fait donc le lien avec d’autres services proposés par la bibliothèque comme le Guichet du Savoir, qui permet d’obtenir une réponse à toute question dans les 72 heures ou les Points d’Actu développés par les bibliothécaires. Elle propose à un public plus enclin à la découverte qu’à la recherche ciblée des expositions virtuelles et des parcours thématiques. Ceux-ci sont rédigés par des bibliothécaires mais aussi par des spécialistes extérieurs qui apportent leurs compétences sur tel ou tel aspect des collections. Des liens sont créés avec d’autres bibliothèques numériques, encyclopédies ou sites spécialisés. L’usager peut ainsi appréhender les collections et leur histoire dans un contexte plus large. Numelyo lui offre aussi la possibilité de créer sa propre bibliothèque numérique et l’invite à participer à son enrichissement par le biais de précisions ou de corrections apportées aux documents déjà mis en ligne. Numelyo permet aux malvoyants d’avoir accès à un service de lecture vocale leur permettant de naviguer dans le site et d’accéder au contenu des textes numérisés en mode texte.

Au cœur du projet : l’innovation

La BML a fait le choix de travailler en interne sur ce projet et de réaliser elle-même les produits et services associés. Des bibliothécaires formés aux nouvelles technologies et une équipe technique à l’écoute des besoins ont permis de réaliser Numelyo.

L’innovation a été placée au cœur du projet, en rendant possible l’évolution constante du produit. Le travail a été orienté selon trois axes : la pérennisation des données au sein d’un système ouvert et ne dénaturant pas les données stockées, l’évolutivité des outils choisis et l’accessibilité des données et des services.

La première étape a été de choisir une architecture technique qui assure la pérennisation des données de façon simple mais robuste. La solution adoptée se décompose en quatre serveurs de gestion de données (voir schéma ci-dessous).

Illustration
Architecture technique de Numélyo.

La solution open source Fedora  4, robuste, fiable et suivie a été choisie, couplée au moteur de recherche Solr  5 qui présente les mêmes avantages. Ces deux solutions ont d’abord été testées sur des projets de valorisation qui ont permis de capitaliser de la compétence au sein des équipes de la BML avant de déployer ces deux outils sur le projet Numelyo. Le choix a été fait d’utiliser des technologies open source, qui impliquent un fort investissement interne, mais permettent une grande souplesse d’utilisation et d’évolution.

Notre deuxième approche a porté sur la structuration de l’objet numérique. La définition de cette entité peut être simple ou complexe tant il est possible de chaîner les éléments constitutifs. Il faut définir de quoi est constitué un objet numérique et valider qu’il réponde bien au document physique que l’on veut décrire. L’ensemble des données techniques, administratives, structurelles, sécuritaires, qui est ainsi défini constitue l’objet numérique, identifiable.

Le choix des données qui constituent l’objet numérique tient compte des contraintes de pérennisation, d’échange et de portabilité. Les formats choisis sont tous des formats ouverts, basés sur le XML pour la majorité.

La principale préoccupation est de conserver les données à l’aide de formats exploitables rapidement et facilement, et de les stocker grâce à un outil qui ne les dénature pas. En cas de perte de l’outil de gestion, il sera toujours possible de récupérer les données brutes car elles restent lisibles et accessibles.

La structuration des objets numériques nécessite le concours des conservateurs et des bibliotechniciens. Ils aident à la réalisation des modèles et des instances de ces modèles, ils peuvent aussi réviser les contrats de numérisation en fonction de ces nouvelles contraintes, et souvent proposer de nouveaux services aux usagers.

C’est grâce à ces structures de données que Numelyo peut évoluer vers de nouveaux services. D’abord Numelyo se veut accessible et compatible avec les formats portables (tablette, smartphone) grâce à une réalisation en responsive design. Dissocier les données à valoriser et la mise en page n’est possible que si les données sont structurées. La gestion en template du site dépend directement de la structuration des données sources pour calculer de façon uniforme les rendus à paginer. Les services héritant de cette facilité de rendu, il devient donc aisé de proposer des outils de téléchargement unitaire, globaux, structurés (ePub, PDF…). Surtout, il devient aisé de valoriser les métadonnées des documents et du site via tout type de services d’échange.

Sur Numelyo, la collection des Marques de provenance inaugure le passage aux micro-data qui seront progressivement appliquées à l’ensemble des documents présentés.

L’innovation autour de Numelyo est possible car elle est portée et suivie en interne par des équipes qui trouvent dans l’outil les moyens de valoriser et de sauvegarder le patrimoine présent, grâce à des technologies ouvertes et évolutives.

Les chantiers ouverts

Toute jeune bibliothèque numérique, Numelyo voit s’ouvrir devant elle de nombreuses pistes parmi lesquelles :

  • Augmenter la volumétrie des collections existantes (imprimés, manuscrits médiévaux, documents sur la guerre de 1914–1918, estampes, photographies…) et intégrer des collections sonores et vidéo.
  • Intensifier l’interactivité avec le public.
  • Accroître le nombre de partenaires participant à la rédaction de dossiers, notamment dans le monde de la recherche et multiplier les liens.
  • Renforcer l’interopérabilité et améliorer le référencement.
  • Perfectionner la recherche et fluidifier la circulation entre les différents modules de Numelyo, entre eux et le catalogue, entre eux et les autres services développés par la bibliothèque.

Au final, l’architecture mise en place est amenée à évoluer au fil de la croissance de Numelyo. •

Septembre 2013