Le document électronique au SCD Lyon 3

Frédérique Molliné

Jean Bernon

Carole Letrouit

Thierry Samain

Jusqu’à une date récente, l’accès aux documents primaires passait par les catalogues et les bibliographies. Aujourd’hui, l’information en ligne redonne la possibilité d’accès direct aux documents primaires sous leur forme électronique.

Le catalogue général de la Bibliothèque nationale de France est d’abord devenu base de données en ligne, puis cédérom. La base Gallica depuis 1997, et bientôt, le système d’information, vont donner accès au document primaire. Les bibliothèques municipales et universitaires suivent une évolution analogue, par exemple, la bibliothèque municipale (BM) de Valenciennes ou le Service commun de la documentation (SCD) Lyon 3, qui a installé depuis novembre 1996 un Système d’information des bibliothèques d’études et de recherche (SIBER) 1.

Une typologie sommaire des documents électroniques permet de dégager quatre grandes catégories de documents :

– les documents qui n’existent que sous forme électronique en ligne : certains périodiques sur Internet, par exemple la revue de droit maritime Neptunus (ISSN 1266-6912), accessible sur le Web de l’université de Nantes 2 ;

– les documents numérisés à partir du support papier pour constituer des bases de données ou des cédéroms commercialisés (par exemple, les sommaires et articles de périodiques diffusés par Europériodiques ou Dawson, le BBF accessible sur le site Web de l’ENSSIB, certains textes du Journal officiel accessibles sur Lexilaser Lois et Règlements ou sur Lexis) ;

– les documents numérisés en local à partir de collections appartenant à un établissement et accessibles en réseau local (par exemple, les dossiers de presse de la Documentation régionale de la BM de Lyon), par Internet (par exemple, le fonds normand de la BM de Lisieux 3) ou sur cédéroms locaux (par exemple, des textes anciens de la BM de Grenoble) ;

– les documents édités localement par l’université, accessibles en Intranet ou en Internet (par exemple, les supports de cours, corrigés, bibliographies spécialisées, prépublications et littérature grise académique en général).

Chaque type de document numérisé soulève des problèmes de droits différents. Ce sont les troisième et quatrième catégories qui laissent le plus de liberté.

Trois axes de numérisation

Au SCD Lyon 3, les quatre types sont représentés : réseau de cédéroms multisite sur le réseau de l’université, accès contrôlé à Internet (logiciel AIE) et documents numérisés ou édités en local. La numérisation se développe autour de trois grands axes :

– l’enrichissement de la base bibliographique par l’alimentation d’une base multimédia qui lui est liée : numérisation des tables des matières des thèses de Lyon 3, des livres étrangers et plus particulièrement des livres en caractères non latins ;

– la constitution d’une base de littérature grise comprenant les publications non commercialisées des enseignants-chercheurs de l’université, les dons extérieurs (ministères, collectivités locales, etc.) et des documents produits par/sur le SCD. L’ensemble de ces documents a été catalogué et numérisé. Toutes les notices de catalogue ont été intégrées à la base bibliographique générale. En revanche, seuls sont accessibles en plein texte les documents en rapport avec le SCD, qui sont libres de droit. Cet accès peut se faire par le réseau local ou par le Web 4 ;

– la création de corpus spécifiques réservés à la consultation par le réseau local sur mot de passe (par exemple, des bibliographies thématiques).

Le choix des formats

Le choix des formats est déterminant dans l’usage qui pourra être fait des différents types de documents. La première décision est de choisir entre image brute et image traitée en mode texte et, dans le mode texte, entre texte linéaire et hypertexte.

Pour l’image, on peut différencier le format standard utilisé pour faire de « belles » images (TIFF) et le format de diffusion sur le Web (GIF, JPEG). On pourra utiliser le format de diffusion comme format de stockage si l’on souhaite réduire l’espace de stockage ou un format plus riche pour des besoins spécifiques (archivage patrimonial ou besoins éditoriaux).

Pour le texte, les formats de type traitement de texte (par exemple, Word) permettent une mise en page plus fine, mais restreignent la diffusion, dans la mesure où ils sont hétérogènes et nécessitent un logiciel externe spécifique pour la lecture.

Le format HTML, plus fruste, offre en revanche un accès universel immédiat et les avantages de l’hypertexte. En attendant le développement des outils grand public de production et de lecture du format SGML, il offre une solution transitoire qui ménage l’avenir. Le HTML est en effet une application particulière très répandue du SGML, lequel reste essentiellement utilisé par les éditeurs comme format de stockage.

Concernant la diffusion, il n’est pas exclu que les documents puissent à terme être convertis « à la volée » dans le format le plus adapté au mode de communication choisi et à la définition souhaitée.

Au SCD Lyon 3, cette démarche est encore en phase expérimentale et évoluera très certainement dans un proche avenir. Elle gagnerait sûrement à être confrontée à d’autres expériences pour le plus grand profit de chacun 5.

Pour finir, cette réflexion sur la documentation électronique nous a fait prendre conscience de deux tendances complémentaires : l’accès au document primaire se simplifie et se généralise ; en sens inverse, le traitement de l’information relève de services personnalisés d’accès réservé. Ainsi, il existe deux façons de se connecter à SIBER : un accès anonyme aux trois grands réservoirs d’information (catalogue multimédia, cédéroms, choix de sites Internet) et un accès nominatif avec mot de passe permettant la constitution d’un « album » (bloc-notes, sélection de notices et de documents numériques) intégré au dossier du lecteur.