Vers une numérisation globale des savoirs

L'ambition de Google, les perspectives européennes

Emmanuelle Chevry

Le ministère de la Culture et de la Communication et la Direction régionale des affaires culturelles de Champagne-Ardenne ont organisé, le 3 juin 2005 à Troyes, un colloque intitulé « Vers une numérisation globale des savoirs : l’ambition de Google, les perspectives européennes » 1. La problématique posée s’inscrit à la fois dans un enjeu culturel, identitaire et économique, affirma Michel Rudent, conseiller municipal à la ville de Troyes.

Éric Gross, alors directeur du livre et de la lecture, a souligné l’évolution récente de la numérisation. D’abord principalement dédiée aux images, elle se recentre actuellement sur les textes à enjeux pédagogiques et scientifiques. On atteindra, selon lui, une diffusion utile du savoir lorsque la numérisation proposera un travail de médiation accompagnant les textes numérisés. C’est cette valeur ajoutée, comparable à celle qu’apporte un éditeur, qui permettra le saut qualitatif nécessaire. Aussi, un comité français de pilotage analyse actuellement les modalités scientifiques et financières de la future Bibliothèque numérique européenne, qui offrira 1 à 3 millions de documents.

Philippe Rey, préfet de l’Aube, a encouragé à relever ce formidable défi pour la démocratisation du savoir, à condition que cette bibliothèque numérique préserve la diversité culturelle et linguistique.

La diffusion du savoir, du parchemin au numérique

Jean-Paul Bouhot (Institut de recherche et d’histoire des textes) a expliqué comment, au XIIe siècle, la diffusion des manuscrits par les copistes des abbayes s’inscrivait dans une véritable chaîne du savoir (pratique, historique, idéologique). Celle-ci a évolué au gré des sauts technologiques et la numérisation va naturellement faciliter le travail du chercheur, à condition qu’elle s’accompagne d’une notice détaillée, effectuée livre en main, seule capable de restituer dans son originalité et son histoire cet objet unique qu’est le manuscrit.

Hélène Richard (Bibliothèque nationale de France) a montré comment la numérisation peut résoudre des problèmes spécifiques aux cartes en permettant de reconstituer des collections éclatées, de réaliser des zooms ou de visualiser des cartes de grande taille. Cependant, cette technologie présente des contraintes techniques de conservation et d’accès aux originaux.

Selon Michel Melot, si le numérique constitue une révolution, elle n’est pas tant technique qu’économique et juridique. L’économie du contenu glisse vers une économie du contenant. Aussi, transposer le modèle économique du livre à celui du numérique serait impossible.

Les bibliothèques virtuelles : mythe ou réalité ?

Pour ouvrir le débat, Hervé Le Crosnier (Université de Caen) a défini les concepts de moteur de recherche et de bibliothèque numérique 2.

Google a été présenté par John Lewis Needham comme un outil complémentaire des bibliothèques virtuelles, qui étend et favorise l’accès à l’information. L’entreprise privée Google prendra 5 à 10 ans pour créer un fonds numérisé de 15 millions d’ouvrages ventilés selon plusieurs entrées (Google Print, Google Scholar, etc.).

Librissimo, présenté par son créateur Henri Le More, a un objectif très différent : non pas numériser en masse, mais répondre à la demande précise d’un client, et résoudre pour lui, à un coût acceptable, le problème des livres épuisés. Henri Le More a passé des conventions d’édition avec de grandes bibliothèques qui mettent à sa disposition les ouvrages en échange de leur copie numérique.

Pour illustrer ce que peuvent être les bibliothèques virtuelles, trois bibliothèques municipales françaises et un service d’archives ont présenté leurs démarches en matière de numérisation.

La numérisation à la Bibliothèque municipale de Montpellier, dirigée par Gilles Gudin de Vallerin, doit dorénavant s’appuyer non seulement sur les documents disponibles, mais aussi sur les habitudes des visiteurs : lecture globale, promenade, approfondie ou partielle.

Monique Hulvey a présenté la démarche de la Bibliothèque municipale de Lyon 3 qui s’appuie sur une offre de nouveaux services en ligne comme le Guichet du savoir® 4‚ ou Catalog+, et sur le partage des données grâce au protocole des archives ouvertes 5. Ces services ne visent pas à établir une bibliothèque numérique en tant que telle, mais à enrichir une gamme globale de services  comblant les nouvelles attentes du public.

Thierry Delcourt a attiré notre attention sur les risques d’une démarche sous-estimant les besoins réels des visiteurs. Il nuance maintenant son choix initial de numériser en priorité les documents les plus prestigieux à la Médiathèque de l’agglomération troyenne, car les visiteurs souhaitent en majorité l’accès à la presse et aux ouvrages du XIXe et du début du XXe siècles 6. Deux manières complémentaires de numériser peuvent cohabiter : un accès à un contenu de masse, tel que le propose Google, et une offre moins large mais enrichie de services éditoriaux que viserait à offrir la future Bibliothèque numérique européenne.

Xavier de La Selle (Archives départementales de l’Aube) a évoqué les problèmes propres à la numérisation d’archives. Contrairement aux livres, celles-ci n’ont, à l’origine, ni auteur, ni public clairement identifiés. Leur nature, forme et structure présentent donc des obstacles spécifiques.

Enfin le colloque s’est clos sur la dimension européenne des savoirs. Christophe Dessaux et Thierry Claerr (ministère de la Culture) ont présenté le catalogue des fonds culturels numérisés 7 et son développement vers le projet européen Michael (Multilingual Inventory of Cultural Heritage in Europe). Créé en 2001, à l’initiative du Comité scientifique pour la documentation informatisée et le multimédia, le catalogue répertorie les réalisations de numérisation des établissements culturels en France. Coordonné par la Mission de la recherche et de la technologie, il recense 232 projets patrimoniaux réalisés par les bibliothèques.