Machine documentaire

Les Comptes rendus hebdomadaires des séances de l'Académie des sciences ont publié (tome 250, n° 4, 25 janvier 1960, p. 659) une note de M. Marcel Locquin, présentée par M. Gaston Dupouy.

Nous reproduisons in extenso cette note intitulée « Théorie de l'information; identification d'une structure complexe dans une collection ».

Comparaison de la structure recherchée avec sa complémentaire et détection globale de celle-ci grâce à l'uniformité du signal spatial résultant. Applications à la documentation : les eccetrons.

Pour détecter dans une collection une structure de type donné on dispose de procédés analytiques. Pour que l'opération soit économiquement acceptable il faut que le travail préalable ou simultané d'analyse soit d'un ordre de grandeur égal ou inférieur au travail proprement dit de recherche, de comparaison et de sélection. Or, la quantification symbolique de cette analyse croît, dans un espace à trois dimensions, comme le cube de ce qu'on peut appeler la complexité élémentaire. Ceci explique qu'une mémoire magnétique classique soit inadaptée, malgré son énorme capacité alphanumérique, à l'enregistrement indéfini et à la restitution finie des informations documentaires en croissance exponentielle dans le monde moderne.

Une généralisation du principe de compensation de Babinet permet l'économie de l'analyse et de sa quantification symbolique en détectant globalement une structure à n dimensions de complexité quelconque par comparaison et compensation avec sa structure complémentaire. Si nous recherchons, par exemple, parmi une suite de graphismes : mots de langues différentes, formules chimiques développées, formules mathématiques, tableaux, courbes, etc. un graphisme de forme déterminée, à des fins possibles de recherche documentaire, nous ferons défiler cette suite, enregistrée, par exemple, photographiquement sur une « piste » négative, devant une « question » qui sera l'image photographique complémentaire, donc positive, du graphisme cherché.

Lorsque les deux graphismes : négatif et positif, complémentairement identiques seront en présence, et dans ce cas seulement, un flux lumineux global traversant l'ensemble sera uniforme; dans tous les autres cas l'uniformité ne sera pas réalisée. Ce signal d'uniformité peut être utilisé pour déclencher tout processus de sélection, d'asservissement, de conduite de programme, dans un ensemble d'opérations.

Cet exemple nous conduit à des généralisations très nombreuses dans leur diversité et leurs complexités, car le flux traversant les deux structures complémentaires peut être électromagnétique ou corpusculaire; les images - au sens le plus large - utilisées pour « poser la question » peuvent être : photoniques, photochimiques, électroniques, magnétiques, thermiques, diélectriques, ioniques, acoustiques, etc., ou une combinaison de plusieurs d'entre elles.

Le procédé, dans sa généralité, consiste à faire moduler spatialement en superposition : un flux initialement homogène, par une image « négative » de la structure à identifier, et successivement, par chacune des structures « positives » de la collection ; l'identification de la structure cherchée étant permise par le fait qu'elle est la seule de la collection à laquelle correspond un flux résultant homogène.

Nommons « eccetrons » - du latin ecce - les ensembles matériels permettant cette recherche.

La « photonique » comme l'électronique qu'ils utilisent est des plus simples puisque, par construction, l'opérateur cherchera toujours à réduire l'uniformité à un signal de zéro facilement utilisable, l'essentiel étant de pouvoir poser physiquement la question de façon simple.

Prenons quelques exemples autres que celui que nous avons déjà cité. La détection d'un faux dans une série vraie, celle du déplacement d'un détail dans un ensemble sera faite par comparaison avec une image photographique complémentaire de l'objet vrai dans le premier cas, de l'objet à l'instant initial dans le second. Il en sera de même pour le contrôle d'une pièce à la sortie d'une chaîne, le contrôle d'une déformation mécanique dans le temps, le contrôle d'un moule par rapport à la pièce moulée, etc.

Ce principe nous a conduit à la conception, puis la réalisation de dictionnaires, répertoires, annuaires automatiques, de machines à traduire en plusieurs langues simultanément, de contrôleurs de pièces usinées, d'équipements de programmation et surtout de machines pour la recherche documentaire automatique à « mémoire » indéfinie, grammaticale et polyglotte dont les performances vont de la plus simple : réponse à une question de trois mots sur 100.000 documents en 1 mn, à la plus complexe : réponse à une question de 20.000 mots sur un milliard de documents en 1 mn sans que l'encombrement spatial de la mémoire excède 1 dm3 dans le premier cas et 1 m3 dans le second.

L'utilisation de ces ensembles en transférant ce qu'on peut appeler la « capitalisation cérébrale » des informations dans des « mémoires » photoniques libère l'homme des servitudes bien connues qui sont à l'origine de toute recherche documentaire.