Bibliotheca Universalis
Vers une catalogue commun des documents numérisés accessibles par les réseaux télématiques
Gaëlle Béquet
Le projet Bibliotheca universalis, lancé en février dernier lors d'une réunion des sept pays les plus industrialisés à Bruxelles, a pour objectif de constituer un catalogue de documents numérisés disponibles sur les serveurs des bibliothèques participantes. Un premier recensement des programmes de numérisation en cours implique l'ensemble des pays du G7 et la Commission européenne et montre la nécessité d'une concertation internationale.
The project Bibliotheca universalis was launched last February during a G7 meeting held in Brussels. This project aims at creating a catalog of the digitalized documents available on the participating libraries’ servers. A brief survey of the existing digitisation programs involves all the G7 countries and the European Commission and asserts the need of international cooperation.
Das Vorhaben Bibliotheca universalis entstand im Februar 1995 im Rahmen einer Versammlung der sieben größten Industrieländer in Bruxelles. Damit soll ein Katalog der digitalisierten Dokumente aufgebaut werden, die auf den Btx-Anbietern der teilnehmenden Bibliotheken vorhanden sind. Dank einer ersten Zählung der laufenden Digitalisierungsvorhaben (in G7-Ländern und EG) wird erwiesen, eine internationale Abstimmung ist heute nötig.
Un texte fondateur a été adopté à Bruxelles en février 1995, lors de la conférence du G7 sur les autoroutes de l‘information.
Le projet Bibliotheca universalis doit donner accès aux œuvres principales du patrimoine culturel et scientifique mondial par le biais des technologies multimédias. Il doit favoriser les échanges culturels et améliorer les services rendus aux utilisateurs finals. L’objectif principal est de constituer, à partir des nombreux programmes de numérisation existants, une collection des savoirs de l’humanité disponibles sur les réseaux pour un large public.
Le projet Bibliotheca universalis, dirigé conjointement par la France et le Japon, fournit un cadre pour une coopération internationale qui doit s’attacher à traiter les problèmes techniques et administratifs d’interopérabilité et créer un environnement qui favorisera au-delà des pays du G7.
Cette coopération stimulera la mise en œuvre des programmes de numérisation des ressources culturelles et scientifiques dans une perspective de développement d’accès aisés à l’information pertinente. Une telle réalisation doit répondre aux besoins du public le plus large, ainsi qu’à des chercheurs et des étudiants.
Bibliotheca universalis a pour but de définir les lignes directrices d’un système d’information multimédia distribué, donnant un accès virtuel au contenu. Chacune des bases de données, régie par des organismes locaux ou nationaux ayant autorité pour numériser et classer les ressources sélectionnées, sera accessible à travers les réseaux de télécommunication existants et à partir de simples ordinateurs équipés de modems.
Au-delà de ces principes, quels sont les programmes de numérisation sur lesquels s’appuiera le projet, tant en France qu’à l’étranger ? Quelle est l’architecture proposée pour le projet ?
La numérisation en France
En France, plusieurs bibliothèques publiques s’intéressent de près à la numérisation.
La Bibliothèque municipale de Lyon
Le BM de Lyon a numérisé les dossiers de presse du département de documentation Rhône-Alpes en mode image, ceci afin de conserver la mise en page : le document est affiché tel quel à l’écran et son impression restitue une copie conforme à l’original. L’indexation de ces « images » est nécessaire, car on ne peut pas faire une recherche sur les mots du texte, puisqu’ils n’ont pas été reconnus. L’inconvénient majeur de cette opération est que l’espace mémoire nécessaire au stockage de ces fichiers est important.
La BM de Lyon a aussi numérisé des tables des matières, des brochures, des tableaux statistiques et des collections iconographiques pour constituer une banque d’images offrant un échantillon représentatif de chaque type de document possédé par la bibliothèque (enluminures, estampes, affiches et photographies).
Le catalogue de la BM de Lyon est déjà accessible sur Internet (bm.univ-lyon1.fr), et la bibliothèque a pour projet l’implantation d’un serveur Mosaic et l’installation des fonds numérisés sur le World Wide Web.
La Bibliothèque municipale de Besançon
La BM de Besançon a un projet de numérisation qui s’inscrit dans le cadre plus large du câblage de la ville en fibre optique.
La bibliothèque, qui prépare pour la fin de l’année un CD Interactif sur le passage du livre manuscrit au livre imprimé et a recours pour cela à plus de 600 documents iconographiques numérisés, souhaiterait utiliser la numérisation pour faciliter l’accès aux collections iconographiques (principalement des dessins français du XVIIIe siècle, cartes et plans de la région Franche-Comté, manuscrits médiévaux) et mettre à disposition du public des dossiers de presse consacrés à l’actualité.
Les bibliothèques municipales de Valenciennes et Lille
La BM de Valenciennes a numérisé un fonds de cartes postales, première étape avant la numérisation de 50 000 livres rares antérieurs au XIXe siècle, de 15 000 manuscrits, 10 000 estampes et photographies. La bibliothèque dispose d’un scanner et d’un appareil photo-numérique Ilford relié à l’ordinateur. Elle a en projet l’édition d’un CD-Rom.
La Bibliothèque municipale de Lille a installé une station de numérisation en 1991, afin de numériser le fonds des périodiques régionaux anciens. C’est le Grand hebdomadaire illustré (1911-1914 et 1919-1938) qui a été numérisé sur Disque optique numérique (DON). Ce disque permet la conservation et l’archivage, mais se révèle inutilisable pour la consultation. Une société privée a transféré les donnes du DON sur CD-Rom à cette fin. À présent, la collection du Grand hebdomadaire illustré occupe dix CD-Rom, est consultable sur place et commercialisée par les services municipaux.
La station de numérisation, installée en 1991, est aujourd’hui inutilisée, mais une étude est en cours pour examiner l’opportunité d’une remise en service de cette station. La bibliothèque projette également la numérisation des fonds de cartes postales et d’hebdomadaires du XIXe siècle.
La Bibliothèque publique d’information
La BPI a créé une banque de 130 000 images appelée Sémaphore, organisée en dossiers thématiques. Cette banque est consultable sur place et à distance par le réseau Numéris. Trois bibliothèques municipales sont associées à la BPI : Lyon, Rennes et Saint-Quentin-en-Yvelines. La BPI a lancé aussi un programme de numérisation des dossiers de presse.
Il faut également rappeler, pour mémoire, le projet de la Bibliothèque nationale de France qui prévoit la numérisation de 100 000 documents d’ici l’ouverture du bâtiment de Tolbiac.
Les bibliothèques universitaires
Les BU et les instituts de recherche ne sont pas en reste dans le domaine de la numérisation.
Le projet européen EDIL, financé pour moitié par la DG XIII, fédère plusieurs bibliothèques universitaires françaises (Bibliothèque interuniversitaire de Jussieu, BU de Lyon-I, BU de Bordeaux, Reims et Strasbourg), autour de la société Télésystèmes et de l’Institut de l’information scientifique et technique (INIST).
Ce projet vise à créer des relais d’informations nationaux et des infrastructures permettant la transmission de documents numérisés (principalement des périodiques). Les relais EDIL, existant dans chaque pays partenaire (France, Pays-Bas, Royaume-Uni, Allemagne), assurent une fonction technique d’interopérabilité des systèmes nationaux – leurs protocoles de messagerie et de transmission sont différents – et une fonction de système d’information permettant d’identifier tout document transmis.
Les bibliothèques participent soit en tant qu’emprunteur (Lyon, Bordeaux, Reims et Strasbourg), soit en tant que prêteur (Jussieu et l’INIST). La bibliothèque prêteuse, après avoir numérisé les documents, les transmets à la bibliothèque emprunteuse par File Transfer Protocol (FTP) en utilisant le réseau Renater. Ce projet devrait arriver à terme en décembre 1995.
Les instituts de recherche
L’INIST a aussi expérimenté avec la Bibliothèque universitaire Henri-Poincaré de Nancy la numérisation et le transfert de documents en temps réel. L’Institut de mathématiques appliquées (IMAG), le Centre interuniversitaire de calcul de Grenoble, l’Institut national pour la recherche en informatique et automatisme de Rhône-Alpes et la société Rank Xerox ont lancé ensemble le projet Callimaque, qui permet l’accès, via Internet, à plus de 3 000 documents retraçant l’évolution des mathématiques appliquées et de l’informatique au cours des 40 dernières années.
L’Institut national de la langue française du CNRS a créé Frantext, base de données textuelles : 3 400 textes français littéraires, scientifiques et techniques de 1507 à 1992. Son logiciel d’interrogation, appelé Stella, est constitué d’un corpus de travail, de repérages de mots, et de statistiques d’occurrence. Cette base en ligne est sur le Centre serveur CIRIL, Centre interuniversitaire de ressources informatiques de Lorraine. Une version abrégée de la base – 300 œuvre littéraires de 1827 à 1923 – est disponible aussi sur CD-Rom : Discotext 1, édité par Hachette supérieur.
Les partenaires américains et européens
Le Canada a déjà constitué un comité pour la bibliothèque numérique chargé notamment d’améliorer les infrastructures de réseaux. Il s’agit du réseau Canarie, auquel participent 14 universités et 30 sociétés privées. Le budget de 80 millions de dollars canadiens prévoit la constitution d’une bibliothèque virtuelle constituée d’œuvres littéraires et scientifiques, mais aussi de textes administratifs.
Il existe aussi un réseau Schoolnet qui lie les écoles et les bibliothèques publiques et la Bibliothèque nationale du Canda possède déjà deux serveurs (gopher et web).
Aux Etats-Unis, la Bibliothèque du Congrès a commandité une étude entre 1990 et 1994 afin d’identifier les documents appartenant aux collections historiques de la bibliothèque, susceptibles d’être numérisés. 200 collections ont été constituées qui rassemblent des unica, des photographies, des enregistrements sonores et des films.
Pour mener à bien la numérisation de ces documents, la Bibliothèque du Congrès a lancé le « National Digital Library Program », qui a pour objectif de numériser 5 millions de documents d’ici à l’an 2000. Un budget de 25 millions de dollars est nécessaire à la bibliothèque pour effectuer, dans l’ordre, la préparation des collections, la numérisation et l’archivage, les programmes de coopération, l’étude du copyright et la gestion générale (5).
La Bibliothèque du Congrès possède déjà son serveur Web appelé Thomas (http://www.loc.gov), sur lequel sont disponibles les lois américaines, les actes du Congrès américain et des informations juridiques diverses.
Il faut rappeler par ailleurs que la Bibliothèque du Congrès dispose de plusieurs services accessibles sur le réseau : gopher : marvel.loc.gov, port 70 ; anonymous ftp : ftp.loc.gov; locis : locis.loc.gov.
La Bibliothèque nationale d’Italie, à Rome, a plusieurs projets en cours. Celui des manuscrits prévoit la numérisation des manuscrits et leur consultation sur un ordinateur isolé sous standard SGML. L’Italie participe au programme européen Esprit et au projet Jukebox 1 avec l’Angleterre et le Danemark.
La British Library a diffusé un document de planning stratégique (Strategic objectives for the year 2000) dans lequel la numérisation et la transmission électronique des documents figurent en bonne place. Parmi les projets en cours, il faut mentionner particulièrement la numérisation des manuscrits de Beowulf et de la Magna Carta. Tous ces documents sont disponibles sur le serveur W3 de la British Library (http://portico.bl.uk).
La Commission européenne finance 51 projets dans le secteur Bibliothèques du programme Applications télématiques de la DG XIII. Plusieurs directions de la Commission sont intéressées par les développements du projet Bibliotheca Universalis, dont la DG X (affaires culturelles) et la DG XV (affaires légales, protection de la propriété intellectuelle).
Le Japon
La Japon mène plusieurs programmes parallèles.
La Bibliothèque de la Diète
Le Japon a organisé son propre projet-pilote de bibliothèque électronique, parrainé par le MITI et la Bibliothèque de la Diète. Ce projet comporte trois sous-projets :
- la National Union Catalog Network Project, qui consiste à relier entre elles 25 bibliothèques japonaises, afin d’échanger des informations bibliographiques et de localiser les documents ;
- l’expérimentation de fourniture de documents numérisés, par le réseau, en utilisant les techniques actuelles, afin de déterminer les besoins d’une bibliothèque électronique par la pratique effective de cette bibliothèque ;
- le développement de la technologie nécessaire au contrôle et à l’accumulation de différents types d’information (multimédia) et à la recherche de ces documents.
Le National Centre for Science Information Systems
Le NACSIS propose un accès Internet à une bibliothèque électronique expérimentale. Son objectif est de promouvoir la diffusion de l’information scientifique et technique dans le monde.
Le système héberge des pages de documents et les délivre par Internet. Ma banque de données est constituée à partir de revues scientifiques et techniques publiées par des sociétés savantes japonaises. Le système intègre des données bibliographiques et la livraison électronique de documents.
L’Université de Tokyo
La bibliothèque de l’université de Tokyo veut constituer une bibliothèque électronique de documents rares japonais et l’installer sur le World Wide Web. L’étude de faisabilité a déjà commencé ; la numérisation et l’installation du système débuteront en 1996.
Le ministère des Postes et Télécommunications
Ce ministère pilote le projet Kansai Science City d’un budget de 140 millions de dollars (environ 700 millions de francs). Ce projet réunit les trois communes de Kyoto, Osaka et Nara qui seront reliées entre elles par fibre optique.
Les services proposés seront principalement la vidéo à la demande, la vidéophonie, des catalogues multimédias en ligne (VPC), des programmes éducatifs, de la CAO (construction assistée par ordinateur) pour la construction de maisons personnalisées, une bibliothèque numérique, un service d’information multimédia, des téléphones portables.
L’architecture de Bibliotheca Universalis
La mise en œuvre de ce projet se fonde sur les principes d’une architecture en réseau avec des serveurs répartis. Le projet reprendra les normes existantes en matière de numérisation de textes, d’images et de sons et aussi en matière de protocole de communication. Il suppose l’utilisation d’une interface commune pour les outils de recherche. Disponibles sur les réseaux télématiques existants, ces services documentaires seront développés dans une perspective d’innovation et de qualité.
Bibliotheca universalis se base sur les approches techniques suivantes :
Un environnement réseau
Un utilisateur ayant accès à des réseaux tels que le Réseau téléphonique commuté, Numéris, Renater ou d’autres inforoutes, aura toute latitude pour accéder à l’ensemble des ressources disponibles en temps réel, indépendamment de la localisation physique de l’information.
Un système distribué
Les éléments d’information appartiendront aux différentes bibliothèques mentionnées ci-dessus et seront stockés sur des serveurs localisés dans les pays participants.
Des fonctions de recherche avancée
Le projet nécessite des outils de recherche qui permettront à l’utilisateur final de :
- rédiger sa question en langage naturel au sein d’un environnement graphique et textuel ;
- suivre les liens hiérarchiques et les relations sémantiques entre les documents ;
- feuilleter les documents et images sélectionnés et explorer leur contenu.
Des normes communes
La réalisation du projet sera conditionnée par l’adoption de normes internationales liées aux protocoles d’accès et de communication, aux techniques d’interfaçage, à la capture d’images (en particulier les techniques de compression) et aussi aux modèles de formats.
Bibliotheca universalis bénéficiera de normes reconnues pour la représentation, l’indexation et la communication de l’information. Seront pris en compte les formats bibliographiques (Unimarc, ISBD, ISSN…), les formats d’encodage de textes et des images (HyperTxet Markup Language, Standard Generalized Markup Language), les protocoles de communication (TCP/IP, http), ainsi que les outils de recherche (Wais, W3, Mosaic…).
Les bibliothèques multiplieront ainsi les échanges d’informations spécialisées notamment dans le domaine des bases distribuées et des techniques de pointe pour la recherche documentaire.
La présentation des différents programmes de numérisation des pays impliqués dans le projet Bibliotheca Universalis montre bien la nécessité d’une concertation internationale pour éviter la duplication des documents 2.
Juillet 1995