Le world Wide Web et ses technologies

Annie Le Saux

Le 28 novembre dernier, ceux qui, malgré la grève naissante des transports en commun, avaient réussi à venir assister à la journée organisée par le British Council et la British Library sur le World Wide Web et ses technologies, n’ont pas eu à le regretter : la richesse des interventions, les nombreuses projections d’images et de diapositives illustrant les propos, associées à une organisation exemplaire ont été appréciées par tous.

Deuxième du genre 1, ce colloque, tout comme le précédent, avait pour objectif d’informer les professionnels français sur les derniers développements réalisés par la British Library dans le domaine des technologies de l’information et sur les programmes de recherche en cours. Leurs nombreuses implications, bibliothéconomiques, techniques ou commerciales ont été présentées par des intervenants, qui, bien qu’en majorité de la British Library, représentaient aussi des organismes tels Silicon Graphics, Virtual Science Park de Leeds et la bibliothèque de l’University of East Anglia. L’invitée française fut Sonia Zillhardt, qui décrivit la présence et les perspectives de la Bibliothèque nationale de France sur Internet.

L’impact commercial du Web

Le XXe siècle aura vu le passage des médias analogiques – les films, par exemple – aux médias numériques, comme les CD-Rom, les disques laser... Ce passage de l’analogique au numérique a multiplié, en vitesse et en quantité, les possibilités de la communication. Les performances des outils électroniques ont doublé en deux ans, alors que leur prix a été, en général, divisé par deux durant cette même période. Des enjeux économiques et sociaux interviennent désormais dans le développement des réseaux.

D’abord utilisé pour publier ou rechercher de l’information, limité au monde universitaire, Internet évolue, au fur et à mesure de l’incorporation toujours plus performante d’images, de son, de vidéos et des développements de l’interactivité. Jouissant d’une forte popularité, en essor constant, ses possibilités toujours plus vastes ont commencé à intéresser le monde de l’entreprise et ses activités s’étendent, petit à petit, à un usage commercial. Athanasios Goulas, de l’université de Leeds, remarque que, même si le Web – système hypermédia donnant un accès convivial à une masse de documents hypertextes sur Internet – comme service commercial multimédia n’en est encore qu’à ses débuts, certaines sociétés offrent déjà leurs prestations et leurs produits sur ce réseau. Certaines limites cependant dans la qualité, dans la fiabilité des services, une interaction encore peu développée freinent pour l’instant l’extension du Web dans le monde commercial.

La sécurité sur les réseaux faisant elle aussi partie des critiques retenues contre Internet, des études sont actuellement en cours pour rechercher des systèmes fiables . Quelques solutions sont expérimentées, avec des clés d’accès différentes selon que l’on désire un accès public ou un accès privé, donc secret : citons en exemple le système RSA (Rivest-Shamir-Alderman), connu également sous le nom de MIT algorithm, offrant une sûreté de passage aux clés et aux messages, ou le protocole de sécurité SSL, adopté par Netscape.

Outre cette question de sécurité, la commercialisation du Web est aussi confrontée au problème du payement des transactions. Des études et des expérimentations sont également en cours pour régler cette difficulté.

D’autres recherches, concernant les développements des « butineurs », ouvrent des horizons de plus en plus illimités. Les langages de programmation deviennent toujours plus performants : JAVA et PERL (Practical Extraction Report Language) notamment. Mais, c’est surtout VRML (Virtual Reality Modeling Language) qui va transformer Internet : le premier butineur VRML, Webspace, fonctionne déjà sur les équipements de Silicon Graphics, où il propose quelque chose d’absolument nouveau : un espace en trois dimensions.

L’extension d’Internet aux entreprises signifie un financement de plus en plus important par le secteur privé et, l’on risque, demain, de ne plus naviguer sur le réseau que pour obtenir les meilleurs prix et les meilleurs services.

La numérisation à la British Library

Pour l’instant, c’est la quête d’informations et les recherches faites dans ce domaine qui nous concernent. Jonathan Purday, de la British Library, a exposé les projets de numérisation de cette bibliothèque. Dans le débat qui anime le monde des bibliothèques sur le fait de savoir si la numérisation est d’abord faite pour conserver plutôt que pour en élargir l’accès, ou l’inverse, la British Library a clairement pris position en faveur de l’accès, comme l’indique le nom donné à son programme de recherche : Initiatives for access.

Les quelque dix-huit millions d’imprimés et les collections importantes de documents non imprimés de la British Library laissent imaginer la complexité que représente un programme de numérisation de documents d’époques, de formes et de supports différents.

La numérisation a été envisagée comme substitution aux microformes – la BL en a 200 000, dont la plupart sont des copies d’originaux –, mais aussi comme leur complément. John Purday fit une description précise des technologies utilisées pour numériser les microfilms (scanner Mekel M400XL à une résolution de 200 dpi, compression des fichiers selon le mode de compression de fax Groupe IV...), ouvrant des perspectives nouvelles à l’étude des manuscrits.

L’exemple présenté fut celui d’un texte fondamental de la littérature épique anglo-saxonne, The Beowulf. A partir d’un manuscrit unique et fragile, endommagé par le feu, on a vu, grâce à des câbles de fibre optique et à des radiations ultraviolettes, apparaître du texte qui avait, pensait-on, disparu à jamais. Entièrement numérisé, ce manuscrit sera, l’an prochain, disponible sous une version électronique, sur CD-Rom, produit par la British Library et ses partenaires américains.

D’autres procédés ont été expérimentés pour numériser des documents précieux tels que des manuscrits enluminés, des miniatures orientales... la numérisation offre en effet l’avantage de voir toutes les pages d’un ouvrage et non plus seulement celles, sélectionnées et rares, que l’on montre lors d’expositions.

Il existe actuellement des archives photographiques numérisées, qui seront à terme consultables sur Internet, par une recherche soit à partir du folio, de la désignation du manuscrit ou par mots-clés – une indexation claire et précise étant l’une des conditions du succès de l’accès aux documents numérisés. Parmi les procédés d’indexation utilisés, furent cités la reconnaissance optique des caractères (OCR), d’une efficacité toute relative, et EFS, logiciel issu de Excalibur Technologies, qui utilise la technologie de reconnaissance souple des formes.

Dans le cadre de son programme Initiatives for access, la British Library se penche sur la question de la qualité de l’image numérisée, celle-ci n’étant pas, pour l’instant, suffisamment satisfaisante pour les chercheurs.

La numérisation et la lecture électronique d’images

Un système de visualisation à l’étude en Grande-Bretagne fut donné en exemple par John Fletcher, du Département des collections et de la préservation de la British Library. Pix est un outil qui devrait permettre un butinage interactif de vastes collections d’images, de manuscrits et de photographies possédées par les bibliothèques, sous une forme numérisée. Ce projet, commencé en 1993, avait le double objectif de donner au public accès à des collections souvent fragiles et de limiter l’utilisation des documents originaux. Pour répondre à ces besoins, Pix devait être rapide, fiable, convivial et avoir une grande capacité de mémoire. Chacun sait que la visualisation d’images est souvent longue du fait de la quantité de données et de mémoire qu’elles demandent, Pix a résolu ce problème et la plupart des images apparaissent quasi instantanément.

Trois stations Pix sont ouvertes au public depuis quelques mois, utilisables par des non-spécialistes en informatique comme par des personnes ne parlant pas l’anglais et peu de critiques ont été faites à ce système jusqu’à présent. Le projet arrivant bientôt à son terme, John Fletcher espère qu’il a suffisamment fait ses preuves pour pouvoir envisager non seulement son existence mais encore des développements futurs : mise en réseau des stations Pix, connexion au Web... Simplement, à ce stade, se poseront des problèmes de reproduction et de vente à d’autres bibliothèques.

Coopération nationale et internationale

La numérisation dont il fut question fut bien sûr celle de documents anciens, pour lesquels soit le problème du copyright n’existe pas, soit la bibliothèque en détient elle-même les droits. Pour les autres ouvrages, des accords avec les éditeurs sont à l’étude, encouragés par un récent protocole entre la British Library et la UK Copyright Licensing Agency. Un groupe de travail se penche aussi sur le problème, que tous les pays connaissent ou ont connu, du dépôt légal des documents électroniques.

Une coopération internationale, une coordination des activités ne peuvent que faire avancer les programmes de numérisation entrepris par les bibliothèques, et permettre, fait non négligeable, de réaliser des économies financières.

En Grande-Bretagne, le Joint Information Systems Committee, le Computer Interchange of Museum Information aux Etats-Unis, les programmes de la Commission européenne, l’Unesco, à travers son programme Mémoire du monde, travaillent sur l’élaboration de normes, non seulement techniques, mais aussi concernant les descripteurs donnant accès à la recherche bibliographique, ainsi que des normes permettant de garantir l’authenticité des documents.

Nouveaux rôles, nouvelles responsabilités

Les changements radicaux qui touchent les mondes de l’information et de l’édition ont amené Phil Barden, du British Library Document Supply Centre, à la conclusion qu’il va devenir nécessaire de réinventer une nouvelle structure des industries de l’information 2.

Dans le même ordre d’idées, David Baker, de la bibliothèque de l’University of East Anglia, s’est interrogé sur les dangers que courent les bibliothèques traditionnelles. Internet entraîne, dans ses bouleversements – qui se produisent à une période où les bibliothèques universitaires voient leurs ressources décroître, manquent de place et subissent les conséquences de la crise économique et sociale –, une redéfinition du rôle et des responsabilités des bibliothécaires. Comment trouver un équilibre entre les services traditionnels de la bibliothèque et des technologies toujours nouvelles ? Certains des programmes de recherche du UK Higher Education Electronic Libraries Programme (e-Lib) étudient ces questions : le programme EDDIS (Electronic Document Delivery : the Integrated Solution) de la bibliothèque de l’University of East Anglia en fait partie.

Dès 1992, l’avenir des bibliothèques était problématique, ajoute Mike Curston, du service du développement des CD-Rom de la British Library. On envisageait même les bâtiments de bibliothèques comme des vestiges du passé.

Nous sommes à l’ère de l’éphémère : les logiciels et le matériel informatique ont une durée de vie limitée, les programmes de formation sont en perpétuelle mutation. Ce qui existe actuellement survivra-t-il longtemps sous sa forme présente ? Question de pure rhétorique. Alors, est-ce réaliste de créer des index de recherche toujours plus sophistiqués pour permettre à des utilisateurs toujours plus nombreux d’accéder à des banques de données toujours plus abondantes ?

Utiliser Internet l’après-midi, quand l’Amérique s’éveille, frise l’exploit... Or, plus nous avons des possibilités d’accéder rapidement à l’information, moins nous tolérons le moindre délai. Ce qui incite à penser que, si l’accès électronique aux sommaires et résumés des publications papier a une place reconnue et appréciée, l’accès au texte intégral en temps réel est, lui, moins envisageable, car il demande trop de temps. De là à conclure que les publications uniquement électroniques ne sont pas pour demain...

Dans ce contexte, le CD-Rom semble donc être une bonne option pour le multimédia. Ses capacités de stockage croissent et on aura toujours besoin de stocker l’information, même ou surtout électronique ; les développeurs l’ont bien compris, qui continuent à investir dans cette technologie, peu chère à produire et encore moins coûteuse à l’achat. Mais seules les forces du marché pourront dire l’avenir du CD-Rom et du Web.

Le web et la BNF

La présence de la Bibliothèque nationale de France sur le Web fut exposée par Sonia Zillhardt. Outre des services qu’elle offre déjà sur Internet – le serveur WWW.bnf.fr donne accès aux informations sur l’établissement (horaires, collections...) et présente 1 000 enluminures numérisées –, la BNF a entrepris de donner accès à ses catalogues, dans un premier temps à BN Opale et, dans un second temps, à BN Opaline, d’informer sur ses programmes de recherche, ses liens avec les pôles associés, d’offrir des services à distance à l’utilisateur final – réservation de place, recherches bibliographiques ponctuelles, et accès aux documents numérisés...

A la fin de cette journée, tout en projection dans le futur, la mention de l’enquête menée au niveau européen par l’ancien directeur de la DG XIII replongea le public dans une réalité où 43,5 % d’Européens, dont 60 % de Français, n’ont jamais entendu parler du Web. L’existence des bibliothèques ne semblerait donc pas pour l’instant remise en cause... tant, bien sûr, qu’elles satisferont leurs utilisateurs.