La documentation automatique de l'« Armed services technical information agency » (ASTIA), Arlington, USA

Compte rendu de la conférence faite par le colonel Vann à la Bibliothèque nationale lundi 9 juillet 1962

L'« Armed services technical information agency » (ASTIA) est un centre de documentation automatique qui fournit des renseignements bibliographiques et des documents concernant les sciences et les techniques aux chercheurs, savants et ingénieurs.

Rôle d'ASTIA : Cet organisme, créé pour faciliter les recherches et les échanges de documents dans le domaine de la défense nationale, possède une des plus importantes collections scientifiques et techniques : 700 ooo documents (dont 300 000 enregistrés sur bande magnétique et fiches de catalogue, et 400 ooo documents allemands et japonais, etc... sur fiches de catalogue seulement). Il collabore étroitement avec vingt organismes officiels d'État : A. E. C. (Atomic energy commission), N. A. S. A. (National aeronautics and space agency), « National institute of health», « Ministry of health, education and welfare », « Library of Congress », etc... et avec de nombreuses grandes industries : Douglas, Lockheed, etc... L'ASTIA et les représentants de ces organismes se rencontrent un mercredi par mois pour mettre en commun leurs connaissances et pour élaborer une terminologie technique internationale. ASTIA voudrait pouvoir établir des contacts avec les pays étrangers, notamment avec les pays de NATO.

Personnel : ASTIA se compose actuellement de :
I. Un comité de dix conseillers (research advisors) qui constitue l'élément « intellectuel ». Ce comité se tient en liaison avec les milieux techniques et scientifiques extérieurs, s'assure que ASTIA reçoive toute la documentation essentielle et surveille les travaux d'analyse des documents et le perfectionnement du Thésaurus (voir ci-dessous).
2. Un groupe de dix techniciens qui étudie les méthodes d'information automatique et prépare les programmes de travail pour l'ordinateur électronique.
3. Trente-cinq analystes qui sont chargés du dépouillement des documents qui arrivent de l'extérieur.

Machine électronique . L'appareil électronique actuellement en usage est l' « Univac solid state computor system » (USS 90). Mais il est déjà trop petit. D'ici un an, ASTIA aura un nouvel appareil à grande mémoire. On ne sait encore quelle en sera la marque : IBM, « General Electric », R. C. A. (« Radio Corporation of America »), « Remington Rand ». L'ordinateur Univac reçoit les informations qu'il peut classer, identifier, sélectionner et imprimer. Le numéro code d'enregistrement est de six chiffres.

Activité présente: ASTIA répond, grâce à la machine électronique, à vingt-cinq questions (recherches bibliographiques) par jour et son service de documentation fournit 3 500 documents par jour (reproductions photographiques, xérographiques, etc...).

Il y a aujourd'hui trente-cinq analystes ou extracteurs dont la tâche est d'analyser les documents, d'en extraire les mots-clés (descriptors) et des vedettes secondaires (designators) qu'on enregistre dans la machine. Ils analysent 30 ooo documents par an. Le travail immédiat est de constituer la terminologie la plus précise et la plus pertinente possible, qui pourrait être agréée et utilisée non seulement par les chercheurs américains, mais aussi par des étrangers qui pourraient collaborer avec ASTIA.

ASTIA a publié en 1960 un premier Thésaurus d'environ 7 000 termes. Une nouvelle édition paraîtra ensuite (octobre 1962) comportant 6 000 termes; elle sera très largement diffusée aux États-Unis et en Europe et les chercheurs seront invités à apporter leurs critiques et leurs suggestions, afin de faire de l'édition définitive (prévue dans six mois), un instrument de travail précis et conforme aux conceptions scientifiques et techniques en vigueur partout. Il faudra sans doute cinq ou six ans pour unifier la terminologie aux États-Unis.

Aujourd'hui, quand une question est posée à la machine, elle fournit en moyenne deux cents documents dont deux sur trois ne sont pas exactement pertinents (dans la recherche manuelle, cet excès de documents fournis, est généralement de 25 %, soit trois fois moins). On a observé qu'une question précise posée par un chercheur est élargie d'abord par le bibliothécaire qui veut être sûr de couvrir la question et se trouve ensuite élargie de nouveau par le service d'ASTIA; elle est donc devenue si générale que les réponses sont beaucoup trop nombreuses. D'autre part, dans les deux jours qui s'écoulent entre le moment où le chercheur formule la question et où elle est reçue à ASTIA, le point de vue du chercheur a déjà évolué et il envisage son problème sous un autre angle. Aussi, dans 90 % des cas, ASTIA préfère téléphoner à l'ingénieur pour lui demander de préciser sa question, et, dans 70 % des cas, elle se trouve ainsi modifiée.

On envisage à ASTIA la préparation de listes de travaux en cours par spécialité et par auteur. Tout chercheur pourra s'abonner aux publications concernant telle spécialité, ou aux travaux publiés par tel auteur. D'une part, les abonnés seront priés d'informer ASTIA dès que les rapports qu'ils reçoivent ne les intéressent plus. D'autre part, les auteurs recevront la liste des abonnés à leurs travaux; un contact direct peut être ainsi établi entre auteurs de rapports et chercheurs.

Par ailleurs, ASTIA peut envoyer des copies de ses bandes magnétiques aux universités, laboratoires et instituts qui possèdent leur propre ordinateur. On parvient ainsi à décentraliser la recherche. Mais les machines électroniques n'étant pas standardisées, il faudra étudier le problème de la normalisation des bandes. Actuellement, ces bandes comportent le numéro code AD (ASTIA document), le titre et l'auteur du rapport et une brève notice bibliographique; par la suite on espère y ajouter le sommaire du rapport. A ce moment-là, ces sommaires pourront être inclus dans les « print out » fournis par les machines en réponse aux questions.

Activité future : Alors que ASTIA reçoit actuellement 30 000 rapports par an, dans deux ans, grâce à une nouvelle politique d'acquisition, il en recevra dix fois plus, soit 300 000. Il devra donc changer de technique d'exploitation de l'information et l'on prévoit qu'il faudra employer alors trois cents analystes.

Le traitement des documents se fera de deux façons :
I. Analyse des documents et mise au point du Thésaurus.
2. Publication par ASTIA même, de revues scientifiques et techniques.

Cinq cents chercheurs et industriels deviendront conseillers d'ASTIA sans cesser d'appartenir à leur établissement d'origine. Ces chercheurs apporteront leur aide dans le travail d'analyse et de terminologie, mais ils pourront aussi communiquer directement à leur organisme certains rapports reçus par ASTIA. 150 Ph. D. étudieront les techniques de l'information et 150 « Masters of science », participeront à la rédaction de revues spécialisées, éditées par ASTIA. On espère qu'en cinq ans 1 500 à 2 ooo spécialistes seront attachés à ASTIA et que tous les ingénieurs et scientifiques américains qui étudient des problèmes techniques pouvant avoir des applications militaires, deviendront des correspondants d'ASTIA.

Un an après l'installation du nouvel appareil électronique, ASTIA espère pouvoir répondre à 250 questions bibliographiques par jour. Il aura à traiter 600 000 notices par an (300 ooo rapports et 300 ooo notices de travaux en cours). En même temps, le nombre de contrats augmentera.

Différents index seront également mis à la disposition des abonnés avec de nombreux renvois d'une notice à l'autre :
I. Index par sujets, c'est-à-dire par mots-clés figurant dans le Thésaurus (descriptors) ou par sous-vedettes (designators), indiquant les sujets marginaux.
2. Index par auteurs.
3. Index par noms propres (open ended terms ou identifiers).

Un bulletin d'extraits techniques (Technical Abstract Bulletin) continuera de donner aux abonnés des informations sur tous les nouveaux rapports reçus. Ce bulletin comporte un index classé par sujets (en faisant appel au Thésaurus) et donne le titre, l'auteur, le numéro AD, etc... de chaque rapport. Un astérisque indique le rapport qui traite avec le plus de précision le sujet désigné par le mot-clé ou « descriptor ».