La recherche d'information sur les réseaux Internet
pour en savoir plus
Comme tous les deux ans depuis 1982, l'INRIA (Institut national de recherche en informatique et en automatique) propose la transcription du cours qu'il a organisé en octobre 1996. Après avoir constaté, dans Le traitement électronique du document, publié aux mêmes éditions en 1994 1 que l'avènement du document électronique, disponible en ligne de (presque) n'importe quel point de la planète, était inéluctable, les présentes contributions s'efforcent d'ordonner l'accès à la masse désormais foisonnante disponible sur le plus médiatique des réseaux informatiques, Internet.
Une gigantesque somme de connaissances
Introduisant les exposés, Jean-Claude Le Moal résume les enjeux de l'accès à l'information sur le réseau des réseaux : une gigantesque mais peu structurée - somme de connaissances, où il faut souligner, « d'une part, la disparition des barrières du temps et de l'espace ; et d'autre part la mise en oeuvre de l'hypertexte ou plutôt de l'hypermédia ».
Il souligne que, devant une information si difficile à trouver et dont il faut aussi, au rebours des formes plus traditionnelles de diffusion (les revues scientifiques), s'interroger sur la validité et la crédibilité, « les professionnels de l'information... sont bien placés » pour faciliter et viabiliser l'accès à cet univers numérique.
Corrado Pettenati dresse un inventaire des types de ressources virtuelles, et de leurs modes de présentation et d'accès, soulignant que « le comportement professionnel du bibliothécaire doit changer pour s'adapter à la possibilité d'organisation de la bibliothèque virtuelle », mais aussi (et cela en réjouira plus d'un...) « que les bibliothécaires ont laissé depuis trop longtemps Internet aux mains des informaticiens et [qu']il est temps d'inverser les rôles et de mettre chacun à sa juste place ».
Robots de recherche et méta-outils
Dans un long exposé, Ghislaine Chartron présente de manière extrêmement détaillée les outils disponibles pour la recherche sur Internet, certains très connus (Yahoo), mais rudimentaires, d'autres, du type robots de recherche (InfoSeek, Lycos) ou « méta-outils » plus sophistiqués.
On apprend ainsi le fonctionnement des robots de recherche et leur « éthique » (Asimov n'est pas loin), et l'on explore la notion de « méta-outils », qui consiste à interroger des outils de recherche qui, eux-mêmes, vont interroger d'autres outils de recherche et traiter, en retour, leurs réponses. Plus avancés encore, les « "agents intelligents" permettent eux de poser une question extrêmement spécialisée, laissant "l'agent" [gérer] ces stratégies en évoluant dans l'univers (généralement hétérogène) où il se déploie ».
Christine Vanoirbeek, dans « Avantages et limites des hypertextes pour la gestion de l'information », tempère quelque peu les enthousiasmes de Jean-Claude Le Moal, en montrant que « le syndrome de "l'utilisateur perdu dans l'hyperespace" » engendre parfois des modes de recherche complexes. Elle souligne aussi que, si le réseau doit être plus fortement structuré, ce doit être le cas aussi des documents le développement de sgml (Standard Generalized Markup Language) en témoignant largement.
L'exposé de Philippe Théret sur le besoin en traitements automatiques du langage naturel pour la recherche d'information sur les réseaux laisse plus perplexe : d'une part, parce que, adapté au cadre d'Internet, il ne lui est pour autant pas spécifique ; d'autre part, et surtout, parce qu'il s'agit une fois de plus d'un brillant exposé théorique sur la question, alors que les concepteurs et utilisateurs de catalogues en ligne le savent bien on attend depuis longtemps de véritables, simples et fonctionnelles applications pratiques qui permettent réellement la fameuse et mythique « interrogation en langage naturel ».
Une sottise journalistique
L'exposé suivant, signé Michel Vivant, sur les problèmes juridiques dans la recherche d'information sur les réseaux, est sans conteste le plus exemplaire de ce recueil. Exemplaire, car il présente avec simplicité les problèmes et surtout les solutions juridiques applicables en France à la circulation et à la diffusion d'information sur Internet. Exemplaire surtout parce qu'il fait pièce au « vide juridique » si médiatisé, « qui n'est rien d'autre qu'une sottise journalistique » : sur ce point précis, facilement généralisable (notamment aux contraintes techniques du réseau), il montre que la compétence et la précision sont, hélas, l'apanage de peu, là où ignorance et approximation sont bien souvent de règle.
François Druel, dans « Sécurité et paiement sur les réseaux, illustrés par le modèle de paiement Globeid » prouve que l'on n'est pas loin de résoudre les problèmes de sécurité des transactions (notamment financières) sur le réseau, gage de son développement commercial dont on ne sait trop s'il faut se réjouir. On regrettera simplement, que, orienté autour de la présentation d'un produit spécifique, l'exposé ne s'en tienne pas à une évocation plus large des solutions en oeuvre, sur Internet, dans ce domaine.
La pensée informatique unique
Enfin, Olivier Andrieu, dans « Kiosques, BBS, bouquets de services », montre, en guise de pirouette, que déréglementation et évolutions techniques rendent impossible toute prédiction fiable à dix ans d'évolution des réseaux et des modes de communication, et que le Minitel (mais oui) et les réseaux « propriétaires » sont « malgré leurs défauts... les outils les plus performants aujourd'hui ».
Mais Internet, bénéficiaire en quelque sorte d'une « pensée informatique unique », semble vouloir tout balayer sur son passage, et « deviendra la source d'information principale ».
Une fois de plus, l'inria, dont on sait le rôle qu'il joue dans la diffusion de la culture informatique en France, livre un ensemble précieux de contributions de haute tenue, où la clarté, la rigueur, la précision, s'allient pour offrir un « compagnon de route » bientôt indispensable au voyageur d'Internet.