Information retrieval research

par Michel Sestier

ed. by R.N. Oddy,... S.E. Robertson,... C.J. van Rijsbergen,... P.W. Williams,... - London ; Boston ; Sydney ; Wellington : Butterworths, 1981 - IX-389 p. ; 25 cm.
Bibliogr. p. 384-385. Index p. 387. - ISBN 0-408-10775-8 : £ 19.50.

Du temps des ordinateurs à « lampes », dans les années cinquante, l'informatique élaborée à Cambridge passait pour être alambiquée jusqu'à l'ésotérisme. Depuis, avec les matériels à transistors, on a câblé in extenso des programmes de plus en plus longs, et certains auteurs pensent que c'est la théorie qui est aujourd'hui en retard.

A l'origine du présent volume, les actes du symposium tenu par la « British Computer Society » et l' « Association for Computing Machinery ». Sous la direction de quatre universitaires des Iles britanniques, voici donc une assez grosse « brique », américaine à 50 % par les auteurs des contributions qui y figurent.

On attend la machine qui représentera des phénomènes à n dimensions sous une forme lisible, qui raisonnera, comme le sujet humain, sur un espace à coordonnées polaires et non linéaires, mais ce qui freine l'essor immédiat des bases de données, au regard de la puissance de calcul déployée, c'est la pauvreté des procédés d'indexation que l'on utilise pour les rédiger. Le progrès passe ici par la mesure des fréquences à l'intérieur de chaque document.

Ceci dit, les systèmes sont de plus en plus pratiques. On en est à interconnecter les programmes. Certaines machines acceptent un texte entier comme thème de recherche, d'autres présentent à la sortie une information déjà rudimentairement rédigée, d'autres encore reconnaissent des arrangements significatifs de mots et forgent à partir de cela des résumés. Les progrès de l'analyse du langage naturel stimulent ces études dont l'objectif le plus ardemment poursuivi est la souplesse de communication avec l'ordinateur.

On reconnaît dans les longues bibliographies les noms de N. Chomsky, T.S. Kuhn, Y. Bar-Hillel, I. Illich, et, p. 291-292, les formes de la courbe du χ2 symétrisé. La mise au point de la base de données interrogeable en langage naturel semble avoir encore à gagner du progrès de disciplines voisines comme la classification automatique et l'analyse factorielle, qui évoluent depuis déjà vingt ans.

Cet ouvrage en fin de compte lisible laisse la question ouverte. Il intéresse les bibliothèques spécialisées. Index des termes, mais pas des personnes citées, qui sont trop rarement francophones.