Les documents numérisés en ligne

Des outils pour la recherche

Odile Jullien

Le 24 novembre dernier, le Pôle universitaire européen Lille Nord-Pas-de-Calais a organisé une journée d’étude consacrée aux documents numérisés en ligne. Cette réunion s’est tenue à la maison de la recherche de l’université de Lille III. Essentiellement informative et pédagogique, elle avait pour but de familiariser les usagers aux bibliothèques numériques et électroniques.

Dans une allocution introductive, Jacques Duveau, président du Pôle universitaire européen, a rappelé les objectifs du catalogue collectif régional : augmenter l’attractivité, favoriser les projets, mutualiser les opérations et décloisonner. La collaboration des enseignants-chercheurs et des bibliothécaires est indispensable, c’est pourquoi des commissions scientifiques ont été créées afin de déterminer et valider les choix de documents à numériser.

Panorama des bibliothèques numériques

Emmanuelle Chevry (mission de la recherche et de la technologie, ministère de la Culture) a dressé une typologie des bibliothèques numériques et électroniques. La bibliothèque virtuelle est un centre de ressources numériques que l’on peut caractériser par des textes (sans exclure les images et le son) sous forme numérique, une information organisée, une publication en ligne et une accessibilité à distance par un public élargi. L’accès aux sites des bibliothèques numériques se fait par l’URL du site, par des liens hypertextes, des portails, des catalogues, des moteurs de recherche généralistes ou spécialisés.

Emmanuelle Chevry a détaillé le Catalogue des fonds culturels numérisés 1 du ministère de la Culture, qui référence (sous forme de déclaration volontaire) les projets et réalisations de numérisation des institutions culturelles en France et qui tend à se rapprocher du projet européen Michael (inventaire multilingue du patrimoine culturel européen), en cours de finalisation.

Elle a proposé différents critères pour classer les bibliothèques numériques : la nature du fonds (exemples : Gallica, Medic@) ; l’organisme producteur (exemples : bibliothèques municipales de Lyon et de Troyes) ; la quantité de vues ou d’œuvres numérisées ; le mode de numérisation (mode image ou mode texte). Elle a énuméré les différents moyens d’accéder aux documents numérisés : par table des matières, index, moteur de recherche interne, feuilletage. Il est également possible d’afficher l’historique de la recherche, de télécharger, de redimensionner, de disposer d’un apparat critique.

Peu à peu, la bibliothèque numérique se détache de son établissement d’origine pour acquérir son autonomie. Elle évolue vers une transversalité en intégrant des ressources issues de tous les secteurs culturels. Mais quelles sont les perspectives pour les bibliothèques numériques ? Il s’avère nécessaire de développer leurs fonctionnalités et leurs services : favoriser le mode texte, améliorer l’exploitation des données afin d’obtenir un référencement correct permettant ainsi une accessibilité accrue par des moteurs de recherche. Afin de mieux les exploiter, il faudrait tendre vers une indexation partagée, une normalisation des formats, une interopérabilité des systèmes, des logiciels libres, une conservation à long terme des contenus.

Comment exploiter les ressources en ligne ?

Frédérique Joannic-Seta (Bibliothèque nationale de France) a dressé un état des lieux du projet Gallica, la bibliothèque numérique de la BnF : 80 000 documents imprimés (tous tombés dans le domaine public), en ligne depuis 1997, dont 1 250 grands classiques en mode texte.

Gallica est plus fréquentée que l’ensemble des salles de lecture de la BnF ; cette situation pose problème. Quels sont les nouveaux enjeux pour Gallica ? Une charte documentaire pour une bibliothèque numérique raisonnée (articulation en corpus) ; des accès fins aux collections ; de grands ensembles de presse à valoriser ; un lien avec la bibliothèque numérique européenne. L’évolution vers la notion de portail permettra à Gallica de donner à la fois accès à ses propres collections et à celles numérisées par les pôles associés.

Isabelle Westeel (bibliothèque municipale de Lille) a passé en revue l’utilisation des bases iconographiques. Elle souligna que 80 % des recherches passent par des moteurs de recherche généralistes, et que deux tiers des étudiants utilisent exclusivement Internet pour leurs recherches. Comment chercher et trouver des images sur Internet ? Quels sont les sites officiels faisant autorité ? Comment utiliser les images ? Le travail de recherche est renouvelé grâce à des corpus iconographiques riches et accessibles, mais le droit d’auteur doit être respecté, et une coopération est essentielle entre chercheurs et professionnels pour indexer les images. Cette indexation prend entre 75 et 80 % du temps de mise en ligne d’une image, contre 20 à 25 % pour la numérisation.

Paulette Taieb (université Paris I – Panthéon Sorbonne) a présenté l’expérience d’une bibliothèque virtuelle particulière, celle du Centre d’histoire de la pensée économique, devenu Phare (Pôle d’histoire de l’analyse et des représentations économiques) 2. Cette bibliothèque est à la fois fonds propre de textes et recension de ressources externes. Un travail artisanal et bénévole de numérisation d’ouvrages – signalant les modifications typographiques selon les éditions et transcrivant certains textes anciens dans une graphie moderne – est à l’origine du projet. -Paulette Taieb précisa que cette entreprise a une vocation heuristique et non exhaustive. La bibliothèque virtuelle doit susciter l’envie d’aller voir l’ouvrage original, mais ne doit pas supprimer sa consultation physique.

Jean-Émile Tosello-Bancal (Sous-direction des bibliothèques et de la documentation) a quant à lui présenté le portail Persée 3. Ce portail en libre accès sur Internet recense les grandes revues francophones en sciences humaines et sociales. Le droit d’auteur est respecté, les autorisations systématiquement recherchées. Ce portail s’appuie sur la norme XML et adhère au protocole OAI-PMH. La navigation sur Persée est intuitive, ce portail est un modèle du genre qui regroupe les fonctionnalités de recherche les plus utiles. Le souhait de Persée est de structurer une communauté d’usagers permettant d’enrichir les textes (annotations, apparat critique, etc.). Une analyse des usages de Persée va être conduite en 2006.

Cécile Martini (SCD de l’université de Lille III) a brossé un panorama des bibliothèques patrimoniales virtuelles, et précisé leur mode d’utilisation. Elle a pour finir posé le problème suivant, sous-jacent tout au long de la journée : les bibliothèques virtuelles ont-elle vocation à se substituer à la consultation physique des ouvrages ?

La journée s’est achevée par une table ronde (animée par Isabelle Westeel) entre trois utilisateurs et trois professionnels des bibliothèques virtuelles.