Bibliothèques électroniques

Christine Okret

Joël Huthwohl

Le 5 décembre 1997, s’est tenu à l’École nationale supérieure des sciences de l’information et des bibliothèques, un séminaire intitulé « Bibliothèques électroniques » et animé par Jean-Michel Salaün. De façon croissante, le traditionnel circuit du livre est remis en question par l’irruption dans les bibliothèques de documents présentés sous forme électronique. En effet, la coexistence de documents offerts aux usagers sur des supports aussi différents que le papier et l’écran engendre des pratiques d’accès différencié à l’information. Toutefois, la construction de corpus de documents électroniques et leur mise à disposition sous forme numérique présentent, d’ores et déjà, des qualités et une convivialité d’utilisation qui restent encore à optimiser.

Le support sur lequel un document est stocké induit un ensemble de pratiques de consultation qui lui sont spécifiques, et détermine, de fait, l’organisation bibliothéconomique qui sert de cadre à sa communication.

Une bibliothèque traditionnelle comprend ainsi une collection de documents présentés sous forme de codex organisés et classés, physiquement conservés dans ses locaux, et communiqués par prêt. Ce modèle patrimonial d’offre documentaire repose sur un principe de partage qui assure le respect de l’intégrité des collections. Celles-ci sont disponibles pour un temps de consultation (sur place ou à domicile) particulier, puis le document est remis en place. Le prêt entre bibliothèques permet d’opérer un accès élargi à l’information, en ayant recours aux sources documentaires d’autres établissements.

Une configuration différente

La bibliothèque électronique possède, en premier lieu, une capacité supérieure d’offre de documents, parce que tous ne sont pas physiquement disponibles dans ses locaux. En effet, si une collection de ce type de documents peut avoir pour origine un exemplaire papier numérisé pour une consultation plus aisée ou par souci de conservation, ou encore si elle est directement saisie sur ordinateur, elle peut également comprendre des éléments virtuels, repérés dans des collections extérieures et accessibles en activant un lien.

En second lieu, l’information que contiennent ces sources documentaires n’est pas obtenue par consultation, mais par appropriation. De fait, les textes intégraux numérisés peuvent être téléchargés sur disquette ou imprimés depuis un poste de travail. Cette fonctionnalité permet la communication des informations en évitant les déplacements des usagers jusqu’au centre de documentation. Sa rapidité de service dépasse très largement celle des envois postaux, utilisés pour les articles commandés par l’intermédiaire du prêt entre bibliothèques.

Elle respecte, par ailleurs, l’intégrité des collections, tout en libérant leurs modalités d’accès : la création d’un site électronique traduit un choix de libre accès, à tout moment, aux informations présentées. Ce site se visite sans autorisation préalable et se différencie ainsi du modèle coopératif traditionnel.

Le développement de serveurs de documents électroniques répond à deux attentes non exclusives l’une de l’autre. Ces sites, d’une part, sur un plan utilitaire, permettent une recherche d’information rapide, d’autre part, assurent une fonction promotionnelle en valorisant des collections patrimoniales.

Gallica

Le serveur Gallica présente ces deux caractéristiques, comme l’a expliqué Éric Dussert, de la Bibliothèque nationale de France (BnF), en rappelant la politique de l’établissement en matière de documents électroniques. Cette entreprise, qui faisait partie du projet de la Très grande bibliothèque, avait pour objet de constituer une base de plus de cent mille documents électroniques. L’ambition du projet était triple : promouvoir l’image de la BnF en France et à l’étranger, permettre l’accès aux collections à des lecteurs distants via Internet et être un test pour l’avenir. À ce jour, le visiteur du serveur Gallica peut consulter 2 300 documents numérisés en mode image, 300 œuvres en mode texte tirées de la base Frantext et 7 000 photographies. Toutes ces œuvres sont libres de droit puisque le parti a été pris de constituer la collection sur le XIXe siècle français essentiellement.

Ce corpus est accessible de deux manières. Des textes introductifs autour de thèmes comme l’histoire ou la philosophie, auxquels sont associées des chronologies, offrent au grand public une voie balisée vers les œuvres. Les lecteurs avertis préféreront utiliser la grille d’interrogation par titre, auteur, éditeur, date et sujet. Cette recherche se fait sur les notices catalographiques, mais il est aussi possible de faire une requête en texte intégral sur les tables des matières, les légendes des photos et les sommaires de périodiques. Les maîtres d’œuvre du projet revendiquent la démarche éditoriale qui le sous-tend et soulignent que Gallica permet, en outre, une meilleure conservation des documents, un désengorgement des salles de lecture de la BnF et des liens vers d’autres sites.

Suite à cette démonstration, Jean-Michel Salaün a fait découvrir à l’assistance le site Internet de l’université de Pennsylvanie http://www.library.upenn.edu/, en insistant sur son ancrage local, sur les usages pédagogiques du réseau et sur le choix qui a été fait, de développer les liens, plutôt qu’une politique de numérisation coûteuse, et de construire ainsi une bibliothèque virtuelle. Dans ce cas, le caractère utilitaire l’emporte sur la promotion.

Amélioration du service rendu aux utilisateurs

La deuxième partie de la journée était consacrée à l’amélioration du service rendu aux utilisateurs, ainsi qu’au développement des sites proposant des documents électroniques, leur succès reposant sur une qualité principale : la fiabilité de la recherche par mots-clés.

Le projet Callimaque

Le centre de recherche Xerox (XRCE), comme l’a montré Laurent Julliard, de la société Xerox, a précisément attiré l’attention sur cette question qui conditionne également une mise en valeur étendue du fonds numérique. Le projet Callimaque, lancé il y a deux ans et demi, a ainsi permis de créer une bibliothèque électronique de thèses et rapports techniques relatifs à l’histoire de l’informatique en France depuis quarante ans et rédigés en français. Son originalité réside dans la conception d’un moteur d’interrogation dit « intelligent » autorisant des recherches à la fois pointues et pertinentes.

Ce moteur de recherche conjugue deux fonctionnalités. Tout d’abord, les recherches peuvent être conduites avec un mot-clé français ou anglais. Des chercheurs étrangers peuvent ainsi accéder à ce fonds sans avoir besoin de connaître le français. Le mot-clé saisi en anglais est traduit en français grâce à un dictionnaire de termes techniques spécifiquement conçu pour cette application. De plus, le mot-clé n’est pas uniquement considéré comme une chaîne de caractères, ce qui est le cas en général. Il est replacé à l’intérieur de son contexte linguistique et syntaxique, et est pris en considération dans toutes ses variations linguistiques simples (singulier/pluriel, masculin/féminin.). Les recherches s’avèrent ainsi plus complètes. Cependant, ce processus de recherche de document ne constitue qu’une étape de la collecte d’information. Après avoir localisé le document, sa communication rapide fait l’objet d’une très forte demande de la part des sites à vocation utilitaire industrielle ou scientifique.

Le projet Calliope

Le XRCE expérimente également un système interne de transmission d’informations par le réseau, dénommé « projet Calliope ». Fruit d’une coopération entre les centres de recherche de l’IMAG (Institut de mathématiques appliquées de Grenoble), de l’INRIA (Institut national de recherche en informatique et automatique) et du XRCE, Calliope offre les sommaires d’environ 650 revues scientifiques utilisées par les chercheurs de ces institutions. Fondé sur une architecture client/serveur, ce système relie des sites géographiquement dispersés (Rennes, Nancy, Grenoble, Rocquencourt). Il est accessible depuis les postes de travail.

Son principal intérêt réside dans la possibilité d’obtenir en moins d’une journée de délai un article sélectionné parmi les sommaires, en cliquant simplement sur un bouton. Aux sommaires ne sont pas joints les résumés des articles, ce qui rend aléatoire le choix d’un document (30 % de rejet enregistré), à moins qu’il n’ait déjà été numérisé auparavant. Néanmoins, cette formule permet une accélération de la transmission d’information très appréciable dans le domaine scientifique, tout en réduisant les coûts de stockage des documents. La question du paiement d’un droit de consultation est résolue par l’affichage sur écran des documents sous format image. Le texte apparaît flou à l’écran, mais est restitué avec netteté à l’impression. Le paiement est effectué par page ou article imprimé.

Ainsi, la réussite de ces expériences menées à petite échelle augure de bouleversements à venir dans le mode de collecte d’information. Les réflexions s’orientent vers la mise au point de moteurs de recherche documentaire plus précis et une utilisation plus complète des possibilités offertes par le réseau pour obtenir des documents plus rapidement. Ainsi s’amorce le développement de bibliothèques électroniques dans lesquelles la recherche sera conviviale et les résultats trouvés pertinents. Leur réalisation représente un défi de taille au sein d’une société où la fluidité de circulation de l’information est un enjeu essentiel de la mondialisation des échanges.