Internet, un puzzle à reconstituer
Du réseau de communication restreint à l'espace d'information étendu
Alexandre Bezsonoff
Après avoir décrit la logique de développement du réseau Internet, le texte se propose de guider la réflexion sur l'usage des très nombreux outils et services disponibles. Il tente de montrer qu'ils sont complémentaires. Il conclut sur le rôle des bibliothèques dans la mise à disposition des informations, sous forme électronique, à travers le réseau.
After the description of the Internet logic of development, the text proposes to guide a reflection about the use of many available tools and services. It tries to show their complementarity. It concludes about the role of libraries in the putting at disposal of infonmations, in an electronic form, through the network.
Nach einer Vorstellung der Entwicklungslogik des Netzes Internet will der Verfasser eine Überlegung führen über die Benutzung der zahlreichen vorhandenen Werkzeuge und Dienste, die er als gegenseitige Ergänzungen beschreiben möchte. Als Schlußfolgerung erwähnt er die Rolle, die die Bibliotheken spielen sollen, um die Information durch dieses Netz in elektronischer Fassung zu Verfügung zu stellen.
Dans les années 1970 émerge le concept d'un réseau d'ordinateurs dont le centre est nulle part ; il devient rapidement un outil de communication pour des groupes de chercheurs restreints.
En 1964, naît l'idée d'un réseau qui, pour résister à une guerre nucléaire, n'aurait aucun centre vital ; même réduit en lambeaux, il garderait ainsi son efficacité. Pour ce faire, tous ses noeuds ont le même statut. Les messages circulent, divisés en paquets. Seuls les points de départ et d'arrivée comptent ; chaque paquet suit sa propre route, au gré de la disponibilité des noeuds sur son trajet. Ce concept est à la base des protocoles de communication qui fourniront au réseau Internet son ciment actuel : TCP/IP (IP - Internet Protocol - achemine des paquets d'informations d'une machine à une autre ; TCP - Transmission Control Protocol - contrôle l'information transmise, puis en assure la fiabilité et la mise en ordre).
En 1969, le Département de la défense américaine (DOD) et sa Division de recherche avancée (DARPA) créent un réseau de lignes téléphoniques dédiées entre quatre gros établissements de recherche détenant des ordinateurs puissants dont on veut optimiser l'usage. L'objectif est de permettre l'échange de données informatisées et la connexion à distance. Mais, dès la deuxième année d'existence du projet, on constate que les chercheurs utilisent ces liaisons pour se créer un réseau de messagerie électronique.
Le fondement du développement du réseau est déjà là : partage d'une ressource rare et chère (l'ordinateur), outil de communication et de convivialité entre chercheurs. Lorsque apparaîtra l'idée d'un réseau de réseaux indépendants dans leur fonctionnement administratif et leur financement, lorsque le prix des ordinateurs et des modems baissera aussi vite que croît leur puissance, tous les ingrédients seront réunis pour l'expansion actuelle d'Internet.
Un formidable essor
En effet, dans les années 1980, le nombre de réseaux par disciplines ou par types de machines se multiplie ; Arpanet puis NSFnet deviennent une épine dorsale qui permet leur interconnexion. L'expansion est favorisée par des machines de plus en plus puissantes et de plus en plus faciles à utiliser. Le nombre de chercheurs non-informaticiens augmente alors de façon significative. En 1984, on atteint plus de 1 000 machines. Afin de les repérer facilement dans le réseau, le système DNS (Domain Name System) permet une correspondance entre le numéro d'identification d'une machine et un nom « en clair ». Ainsi on ne devra plus mémoriser « 134.157.253.129 », mais « bleuet. bius. jussieu. fr » pour désigner une machine en France, sur le site de Jussieu, dans le sous-réseau de la bibliothèque interuniversitaire scientifique et dont le nom mnémonique est bleuet.
Ce formidable essor des années 1980-1985 sera favorisé par la prolifération de stations de travail utilisant le système d'exploitation Unix. La DARPA, qui finance l'Unix de Berkeley, décide d'inclure le nouveau protocole dans le noyau. La nouvelle version est échangée contre l'ancienne. Tous les propriétaires de machines Unix ont, de ce fait, la possibilité de se connecter au réseau sans frais supplémentaires. Aucun constructeur particulier ne peut peser sur ce réseau construit autour d'un protocole indépendant.
Dans les années 1990, Intemet a une croissance de plus en plus forte ; les épines dorsales à grand débit se multiplient ; le grand public est touché. La National Science Foundation crée à l'échelle mondiale en 1986 un réseau de réseaux universitaires à haut débit. En 1989, le seuil de 100 000 machines est franchi. Il y a alors 200 universités raccordées et 516 réseaux. L'épine dorsale passe à un débit de 1,5 million de bits/seconde. Il y a probablement 2 millions d'utilisateurs. Devant ce succès de NSFnet, Arpanet disparaît en 1990. Le débit augmente encore jusqu'à 45 millions de bits/seconde.
Des réseaux à protocole différent offrent des passerelles pour se connecter à Intemet.
En 1991, à l'initiative d'Albert Gore, vice-président des Etats-Unis, apparaît le programme NREN (National Research and Education Network), qui prévoit pour 1995 une épine dorsale à 3 milliards de bits/seconde. Actuellement, Internet compte 20 millions d'utilisateurs et près de 3 500 000 machines réparties sur 84 pays, dont un peu plus de la moitié se situe aux Etats-Unis. Des passerelles existent pour que des individus puissent se connecter. Un usage commercial se développe.
Le réseau européen et français
Dans les années 1970, les premiers réseaux pour la recherche sont créés. Dix ans plus tard, ce sont les réseaux nationaux qui se constituent. En France, ce développement se fera autour des supports Transpac et Teletel.
Dans les années 1990, Renater (Réseau national de télécommunication pour la technologie, l'enseignement et la recherche) naît de la volonté de France Télécom et des ministères de l'Education nationale et de la Recherche. En 1993, des établissements publics mettent en place un Groupement d'intérêt public.
Renater repose sur une architecture à trois niveaux : réseaux de campus, réseaux régionaux, réseau national d'interconnexion, lui-même raccordé vers l'Europe et les Etats-Unis. Des liaisons vers des pays méditerranéens sont également assurées.
En 1993, la croissance sur Renater était de l'ordre de 17 % par mois contre 10 % pour Internet. Renater apparaît actuellement comme le plus grand réseau TCP/IP d'Europe.
Le développement a coïncidé avec celui des ordinateurs de tous types et de toutes tailles, parlant tous une « langue commune » - TCP/IP - fournie gratuitement.
Il tient également à son usage gratuit ou très peu onéreux pour l'utilisateur final : les interconnexions internationales sont prises en charge par des organismes nationaux, la connexion aux épines dorsales nationales par des réseaux régionaux. Quant aux établissements, ils ne financent que leur raccordement au réseau régional. L'individu situé à l'extérieur ne paie que les frais de sa connexion à une passerelle. Le mode de calcul du prix incite à un usage intensif : seul est facturé le droit à un certain débit d'informations. On ne tient compte ni de la durée, ni du volume réel d'informations échangées.
L'évolution retracée est celle du support matériel qu'est Internet. Ce réseau sans tête, ce puzzle de machines hétérogènes et de sous-réseaux dispersés n'est coordonné que par des organismes techniques qui veillent au progrès de ce moyen de communication. Le seul rôle de l'Internet Activities Board est d'améliorer le réseau ; les instances qui le composent ont pour but d'explorer des voies nouvelles en matière de réseau, de faire évoluer TCP/IP, de maintenir la base DNS et de publier des notes de recommandations et d'informations.
Une mosaïque d'outils et de foncions
Depuis l'origine, le seul fait de pouvoir se connecter à Internet donne également accès à trois fonctions essentielles étroitement liées à Unix et à TCP/IP. On peut accéder à distance à un ordinateur comme si on se trouvait devant un de ses terminaux (Telnet) et transférer des fichiers (FTP). Enfin une messagerie, bien qu'apparue deux ans après les autres fonctions, a très vite pris une place prépondérante (Mail).
La messagerie
Comment rassembler des individus isolés en communautés virtuelles ? La messagerie est un « téléphone évolué » dont l'usage est encouragé par une gratuité apparente et la disponibilité de nombreux logiciels du domaine public permettant de gérer l'infommtion émise ou reçue. Un type de communication nouveau apparaît lorsque l'on peut participer à des débats collectifs, centrés sur un thème (actuellement plus de 3 000), au sein d'un « groupe de news » regroupant plusieurs machines ou par le biais de listes de diffusion (Listserv) auxquelles on peut s'abonner. Plus que l'occasion d'échanger de l'information en débattant une question, ces forums sont le moyen de renforcer son appartenance à une communauté fondée sur des intérêts communs. Beaucoup de réseaux extérieurs à Intemet ont accès à ces services au moyen de passerelles.
Le transfert de fichiers
Comment obtenir des informations, mais aussi les logiciels qui permettent d'y accéder plus facilement ? Le transfert de fichiers (File Transfert Protocol) permet le transport d'un très grand nombre d'informations : textes, logiciels, images fixes, images animées, son. Sur un serveur « FTP anonyme », il suffit d'entrer « anonymous » comme nom d'utilisateur, sans mot de passe, pour transférer les fichiers qu'un serveur a décidé de mettre à la disposition de tous sur le réseau. Mais les opérations de connexion peuvent s'avérer fastidieuses. Il faut se souvenir du nom ou du numéro de la machine sur laquelle on veut se connecter, connaître les commandes pour se déplacer dans les répertoires, à la recherche des fichiers. Des programmes, sur le micro-ordinateur de l'utilisateur, peuvent faciliter toutes ces opérations en affichant les arborescences des répertoires dans une interface graphique. Le choix d'une rubrique provoque soit le transfert d'un fichier, soit l'affichage du contenu d'un répertoire. L'installation d'un tel serveur et son alimentation sont rapides et faciles. Le logiciel FTP est fourni systématiquement à l'utilisateur.
Ce mode de diffusion est en passe de devenir un véritable mode d'édition tant pour des textes que pour certains logiciels.
L'accés à distance
Par Telnet, on peut accéder à une machine indépendamment de la distance à laquelle elle se trouve (il faut néanmoins faire attention aux fuseaux horaires). Par ce biais, les scientifiques ont accès aux machines puissantes dont ils ont besoin ; les informaticiens exécutent des programmes sur certaines machines alors qu'ils les développent sur d'autres. Enfin, grâce à ce moyen, les catalogues électroniques des bibliothèques sont accessibles.
Les outils de recherche étendue
Où trouver le fichier recherché ? Pour travailler avec FTP sans connaître d'avance la machine à utiliser, on peut penser qu'on n'a pas d'autres ressources que de compulser des listes imprimées, si elles existent et sont à jour.
Archie
En se connectant à un serveur Archie, on lance une commande de recherche par un groupe de lettres du nom du fichier recherché. Une liste répondant à la question apparaît. Si on dispose d'une interface graphique, on sélectionne des fichiers pour obtenir la connexion FTP et le chargement du fichier.
Sans logiciel spécifique sur son micro-ordinateur (logiciel « client » du serveur Archie), il suffit de se connecter au serveur par Telnet en donnant Archie comme nom d'utilisateur. On peut également utiliser Mail pour adresser des requêtes et recevoir des résultats à travers une boîte aux lettres électronique.
Wais
Wais est spécialisé dans la recherche par index au sein de bases au contenu le plus divers : texte, références bibliographiques, répertoires. Il permet même d'accéder au répertoire Archie ou à des documents multimédias par l'intermédiaire de leur description. Sa très grande diffusion tient à la simplicité et à la puissance de son interrogation.
Un programme d'indexation paramétrable, Waisindex, permet de construire une base Wais. Le logiciel suit le protocole Nizo 239 50 qui régit le dialogue entre un « client » et un serveur. Le « client » pose une question par des mots-clés liés implicitement par un « ou ». Dans les versions récentes, tous les opérateurs booléens (et, ou, sauf), la troncature et les expressions entre guillemets sont utilisables. Le serveur envoie en retour une liste qui donne, pour chaque document, des éléments d'identification, sa taille, son type et un poids traduisant l'importance statistique des mots de la question.
L'utilisateur sélectionne alors les documents qu'il désire consulter et éventuellement décharger. Wais permet la transformation d'une réponse en question. Il utilise alors tous les mots de cette réponse pour formuler une nouvelle question.
Une des possibilités les plus remarquables est de pouvoir interroger simultanément autant de serveurs Wais connus qu'on le désire. A partir d'une liste modifiable, Wais se connecte automatiquement en posant la même question. Il affiche en retour la liste classée de toutes les réponses.
La compilation de catalogues multiples est possible grâce à Wais. A l'aide de logiciels spécifiques, on va créer des bases Wais à partir de bases de références bibliographiques construites par des logiciels différents. On a ensuite le choix de les fondre en une base unique ou de les gérer séparément et de les rassembler en une même liste au moment de l'interrogation.
Pour accéder à une base Wais, le logiciel « client » a besoin d'un petit fichier appelé « source », qui donne différents renseignements sur cette base : noms de l'index, du serveur et de l'administrateur, description du contenu de la base... Mais comment connaître les bases Wais existantes et se constituer un fichier des sources sur le « client » ? On utilise un répertoire mondial des bases Wais : le Directory-of-servers, lui-même base Wais. Il existe également des listes plus spécialisées comme celle des bases Wais en France.
L'évolution de FreeWais se fait actuellement vers une recherche booléenne meilleure, la possibilité de faire une recherche sur des champs, d'utiliser des thésaurus, de procéder à des contrôles d'accès.
Les outils d'information interactive
Comment s'affranchir de la multiplicité des fonctions disponibles et des sites ? Changer de service ou de machine demande à chaque fois une opération particulière. Les opérations d'« exploration » et de « butinage » s'avèrent très rapidement fastidieuses.
Gopher
Gopher a été conçu d'abord comme un système global d'informations à l'échelle d'un campus. Les ressources présentées peuvent être des fichiers de données de tout type mais aussi des passerelles vers d'autres services : banques de données, catalogues de bibliothèques, d'autres Gophers... sur de nombreuses machines. Elles peuvent être organisées selon un plan thématique, par type de supports, géographiquement... Pour accéder à toutes ces ressources, Gopher met en oeuvre les outils appropriés - Telnet, FTP, News de Usenet, Archie, différents annuaires, bases indexées par Wais.
Le logiciel « client » se connecte à un serveur et lui envoie une requête. Le serveur répond en retournant l'item demandé (fichier, répertoire ou lien) vers un autre programme et clôt immédiatement la connexion. Ce mécanisme rend ce logiciel très économique pour le serveur et les logiciels « clients » sont très faciles à installer.
Veronica
D'un Gopher donné, on n'accède pas à l'ensemble des Gophers publics existants. Un outil spécialisé, Veronica permet ce type de recherche. On a la possibilité de l'interroger par mot et d'utiliser les opérateurs booléens. Les réponses peuvent se limiter à un nombre donné ou à certains types de documents. Elles parviennent sous forme de menu au « client » qui est alors capable d'accéder immédiatement à tous les items affichés.
World Wide Web
Créé pour les besoins de chercheurs en physique des hautes énergies, dispersés dans le monde entier, WWW (World Wide Web) est le demier-né des outils d'information interactive. Il se réfère à l'hypertexte. Au sein d'un texte, certains mots ou expressions déclenchent l'accès à des ressources très variées. Ce peuvent être des fichiers de toutes sortes, y compris d'autres hypertextes, mais également l'activation de services Wais, Gopher, FTP, autres WWW... On rend le lien actif en sélectionnant le mot ou l'expression.
Au départ, le projet n'incluait pas d'aspects hypermédias (son, images, vidéo). Actuellement, surtout après les très nombreuses contributions internationales au projet à partir de 1992, les documents sur WWW sont graphiquement très élaborés.
La richesse fonctionnelle de tous ces outils et la possibilité, pour les plus évolués, d'en intégrer de plus élémentaires permettent la création d'un environnement de travail intellectuel sur mesure, permanent ou correspondant à un travail temporaire. Comme celui d'Internet, le développement des différents « clients » est étroitement lié au développement de la micro-informatique. En rendant abordables des puissances de calcul de plus en plus grandes, de plus en plus de fonctions ont pu être déportées en local, sur le « client ». L'intérêt du producteur - avoir le serveur le plus « léger » possible - rejoint l'intérêt de l'utilisateur - avoir l'interface la plus confortable et la maîtrise la plus grande possible de son utilisation.
Logiciels de traitement de fichiers
Pour pouvoir bénéficier pleinement du transfert de fichiers, il est nécessaire d'utiliser toute une série de logiciels qui rendent utilisable l'information. En effet, pour des raisons d'économie de place et pour gagner du temps lors des transferts, la plupart des fichiers sont compactés. Il faut donc utiliser les décompacteurs qui correspondent à chaque méthode de compression.
D'autre part, dans le cadre d'une utilisation multimédia, des logiciels particuliers sont nécessaires pour restituer des sons ou des images fixes ou animées. Là encore, à la variété des formats correspond une variété d'outils. La maîtrise des transferts de fichiers et de la restitution du multimédia passe donc par la connaissance des formats. Cette identification se fait en examinant les suffixes qui suivent les noms des fichiers. Lors de l'installation des logiciels « clients », il est souvent demandé d'établir une correspondance entre les différents formats et les outils dont on dispose pour les traiter.
Exploration, utilisation, création : le rôle de la bibliothèque
Comment rassembler le puzzle des outils et des services à offrir ?
Que l'on soit dans la perspective d'un producteur ou d'un utilisateur, il faut d'abord obtenir un accès à Renater. C'est généralement aisé sur un site déjà connecté. Sinon, il faut se relier à un site d'accueil ou à un prestataire de services. Un faible débit ne permettra pas l'accès à des interfaces graphiques évoluées ni au multimédia.
Le deuxième problème matériel à régler est celui de l'interface utilisateur. Quelles seront les possibilités des terminaux ? Seront-elles réduites (sans interfaces graphiques ni multimédias) ou riches, comme dans le cas d'un micro-ordinateur avec écran couleur et possibilités sonores ? Si l'on veut une restitution correcte des textes imprimés, il vaut mieux avoir une imprimante qui sache interpréter Postcript.
Il faut alors construire, sur son terminal, un environnement de travail qu'on adaptera à ses propres besoins dans le cas d'une utilisation individuelle, ou aux besoins supposés de ses lecteurs si ce terminal est à usage collectif. Dans ce dernier cas, on pourra également se poser des questions sur les différents types de restrictions d'accès à mettre éventuellement en place.
Les ressources sont sur Intemet. Beaucoup de sites informatiques ont rassemblé des « paquets » qui permettent de franchir plus facilement cette étape. En complément, on utilisera FTP aidé éventuellement par Archie. On possède alors les programmes « clients », les interfaces et les logiciels de traitements de fichiers nécessaires.
La phase suivante consiste à fixer les paramètres et les options de chacun des logiciels. Il faudra décrire son environnement informatique et réaliser, à l'aide des différents outils, les connexions sur les serveurs les plus intéressants, puis les mémoriser. On trouvera les informations nécessaires dans les livres et les articles, mais surtout auprès des utilisateurs du réseau. Les outils de recherche, quand ils existent - Archie, Veronica, index des bases Wais - peuvent être très utiles.
Cet environnement de base une fois créé, il sera nécessaire de le faire évoluer au gré d'un réseau changeant en se procurant, au fur et à mesure, les nouvelles versions des programmes installés.
Quelle que soit l'activité envisagée : consulter un catalogue, lire un document, rechercher des références, participer à un débat, il faut accéder à une ressource. Or, s'il est déjà difficile de suivre l'évolution de ressources connues (certaines disparaissent ou changent d'adresse, et de nouvelles, parfois bien plus utiles, sont là sans qu'on le sache), que dire de l'exploration de ressources nouvelles ? Une découverte intéressante sur un serveur ne conduit pas automatiquement à la consultation d'un autre. Les liens établis dans Gopher ou WWW ont été choisis par leurs concepteurs. Ceux-ci organisent les accès aux ressources de façon diverse : grandes catégories, sujets, subdivisions géographiques, noms d'institutions... La logique de tous ces serveurs n'est pas forcément apparente.
Si on est producteur, il faudra se poser la question des services : offrir un FTP anonyme pour proposer fichiers et programmes du domaine public ; donner accès par Telnet à l'Opac (Online public access catalogue) de la bibliothèque en prévoyant de signaler, dans un fichier d'informations, le nom d'utilisateur et le mot de passe nécessaire ; créer une base Wais à partir de son système documentaire ; présenter un service Gopher ou WWW.
Dans ce dernier cas, les moyens à mettre en œuvre peuvent être importants. On se place alors le plus souvent dans le système de communication global de l'université. Un tel service présente des informations générales sur le campus, la scolarité, l'administration, un service d'annonces, un annuaire et, pourquoi pas, la visite d'une exposition virtuelle ?
Dans ce cas, le choix non seulement des ressources mais également d'une logique d'enchaînement et de présentation a son importance, sans oublier l'accès à des dispositifs de guidage. Là encore on veillera à suivre l'évolution des multiples ressources présentées.
Exploration, utilisation, création des ressources disponibles sur le réseau sont des tâches que les bibliothèques doivent assumer. On a besoin de localiser les ressources, de les évaluer, de les décrire et de diriger vers elles les utilisateurs. Des spécialistes, grâce à leur expérience et à leurs stratégies de recherche, utilisent au mieux les outils de recherche automatique disponibles et peuvent suggérer des pistes hors des territoires balisés. Ils peuvent former les utilisateurs à l'exploration et à l'utilisation du réseau. Parallèlement, pourvoyeurs de documents et d'information électronique, ils devront transposer leur savoir-faire en matière d'organisation des accès à l'information.
Septembre 1994