Le traitement de l'information documentaire par ordinateur à l'Institut français du pétrole

Jacqueline Funck

Magdeleine Moureau

Pour prévoir et satisfaire les besoins de ses usagers, le Centre de documentation de l'Institut français du pétrole utilise l'ensemble des possibilités offertes en documentation par les ordinateurs : sélection et impression automatiques de listes et d'index, début d'une gestion automatisée des périodiques, recherches bibliographiques rétrospectives et systématiques (exploitation de documents préparés aux États-Unis - par l'« American petroleum institute » et l'Université de Tulsa, - utilisation des fichiers de référence propres à l'Institut)

Pour placer les réalisations et travaux en cours que nous allons exposer dans une perspective correcte, il nous semble nécessaire de rappeler dans quel cadre et pour faire face à quels besoins ils se développent.

L'Institut français du pétrole a été créé au lendemain de la Libération avec, inscrites dans ses statuts, les trois missions de :
- recherche scientifique et technique;
- formation des cadres;
- documentation et information.

A l'origine principalement au service du développement de l'industrie française du pétrole, l'Institut se trouve aujourd'hui de plus en plus engagé dans des entreprises de coopération technique avec des organisations, tant nationales que privées, dans un nombre sans cesse croissant de pays étrangers (une soixantaine).

Le soin de concevoir et de remplir au mieux la mission de documentation et d'information est confié à la Direction de la documentation et de l'information qui met au point la politique, en anime l'exécution et en réalise, par ses propres services, une très large part.

L'un de ces services constitue l'un des instruments importants de cette politique qu'il participe, du reste, pour son secteur, à définir. C'est le Centre de documentation.

Au service des chercheurs et des étudiants de l'I.F.P. (effectif permanent actuel de l'I.F.P. : 1 500 personnes, plus, bon an mal an, de 300 à 600 étudiants ou stagiaires) comme au service de toutes les sociétés, organismes, techniciens, etc., tant étrangers que français, le Centre de documentation gère et exploite à leur profit une bibliothèque de quelque 55 000 ouvrages et les collections de quelque 2 330 séries de périodiques, en toutes langues.

Établissement de fichiers, analyses, bibliographies, études bibliographiques, rapports de synthèse, traductions, reproductions de documents, recherche et obtention d'informations et de documents par le maintien et le développement d'un réseau national et international très large de contacts, etc., font donc partie des travaux quotidiens du Centre de documentation pour prévoir les besoins de ses clients, tant extérieurs qu'intérieurs, et y répondre au mieux.

Politique choisie.

La nécessité d'une politique à long terme ne doit pas échapper aux organismes de documentation qui, comme toutes les autres entreprises, ont le devoir de prévoir leur évolution future et d'en ménager les étapes.

Depuis 1956, la Direction de la documentation et de l'information a poursuivi une politique basée sur les options suivantes :

ne pas engager l'Institut français du pétrole dans des systèmes mécanographiques intermédiaires qui se trouveraient obligatoirement dépassés un jour, étant donné le rythme de croissance des fichiers et leur extension à des domaines scientifiques très variés;

s'informer au maximum sur les systèmes existants et surtout sur les expériences d'utilisation réelle, afin d'en tirer tout le parti nécessaire pour un choix aussi judicieux que possible, lorsque serait venu le moment de le faire;

dès que possible, faire nous-mêmes des expériences limitées et bien chiffrées, dans le double objectif :
- d'acquisition personnelle de compétence;
- de préparation d'éléments chiffrés pour le jour où une proposition précise d'automatisation globale de la documentation serait faite à la direction générale.

Une documentation aussi complète que possible sur l'aide que peuvent apporter les méthodes automatiques de traitement de l'information à la résolution des problèmes documentaires a donc été rassemblée, surtout à partir de 1959, puis, bien entendu, tenue à jour. De même, ont été suivies de près, et continuent à l'être, toutes expériences concrètes d'organismes ayant des préoccupations voisines des nôtres.

Le choix des équipements qui se pose à tout centre de documentation désirant automatiser ses services est, finalement, limité; il se circonscrit à deux « familles » : les sélecteurs photographiques et les sélecteurs à mémoire magnétique.

De tous les équipements utilisables en sélection documentaire, les sélecteurs photographiques sont les seuls qui aient été réalisés spécialement dans ce but. Les supports photographiques permettent de condenser les documents sous un volume très réduit et des sélecteurs photo-électriques détectent automatiquement l'image d'enregistrements spécialement préparés dans une zone d'identification et qui correspondent à la codification du document. L'intérêt de l'enregistrement photographique réside dans le grand nombre d'informations que l'on peut enregistrer directement pour un coût réduit et dans la fidélité à l'original.

Quant aux sélecteurs à mémoire magnétique, ils sont conçus pour effectuer rapidement des calculs scientifiques complexes, ou spécialisés dans des tâches de gestion automatique, mais sont encore assez mal adaptés au traitement des grandes masses documentaires. Cependant, le débouché non négligeable constitué par ces activités et la pression des utilisateurs incitent les constructeurs à améliorer de manière régulière les performances des équipements. De toutes façons, en mettant à profit les possibilités spécifiques des ordinateurs, on peut produire automatiquement des instruments de travail imprimés pour la sélection bibliographique, en particulier des index construits par permutation automatique des mots significatifs des titres des documents (le KWIC, index IBM, en est la forme la plus connue).

Les centres de documentation adoptent, selon les circonstances et les possibilités, l'une ou l'autre de ces deux méthodes de sélection.

Le choix de la Direction de la documentation et de l'information de l'Institut français du pétrole s'est trouvé tout naturellement infléchi vers les sélecteurs à mémoire magnétique pour trois raisons :

l'annonce que l'I.F.P. disposerait en janvier 1964 d'un ordinateur à son Centre de calcul (IBM 7040);

la nature des problèmes les plus urgents à résoudre par le Centre de documentation, qui étaient précisément justiciables du traitement par ordinateur;

la décision annoncée en 1963 pour prendre effet au Ier janvier 1964 en ce qui concerne l'« American petroleum institute » dans le domaine du raffinage, et la décision annoncée en 1964 pour prendre effet au Ier janvier 1965 en ce qui concerne le « College of petroleum sciences » de l'Université de Tulsa, dans le domaine de la recherche et de la production, d'offrir aux abonnés à leurs fiches bibliographiques le service nouveau de toutes ces références sur bandes magnétiques et les programmes de recherche pour les traiter sur IBM 140I, 7090 et 7044. L'Institut, déjà abonné aux fiches, s'est aussitôt abonné aux bandes de ces deux organismes.

Ces trois raisons principales ont donc conduit à choisir puis à exercer aussitôt la documentation sur ordinateur.

Réalisations concrètes et travaux en cours.

Ces réalisations et ces travaux exploitent l'ensemble des possibilités offertes actuellement par les ordinateurs en documentation :

fabrication d'instruments de travail par sélection et impression automatiques de listes et d'index;

recherches bibliographiques, rétrospectives à la demande, et périodiques systématiques, sur « profil » documentaire.

Mais nous souhaitons tout d'abord faire un retour en arrière pour évoquer deux réalisations ayant utilisé des moyens mécanographiques :
- La partie français-anglais du Dictionnaire technique des termes utilisés dans l'industrie du pétrole, de M. Moureau et J. Rouge, du Centre de documentation de l'I.F.P., qui contient 40 000 termes techniques, a été faite à partir du tri alphabétique sur les termes français des cartes perforées des équivalences anglais-français constituant la première partie de l'ouvrage. Un temps considérable a ainsi été gagné puisque la mise au point de la deuxième partie à partir des documents mécanographiques n'a pris que quatre mois. De plus, l'ouvrage a été valorisé, puisqu'il permet l'accès de manière symétrique par chacune des deux langues auxquelles il est consacré. Ces travaux ont été exécutés en 1962, l'ouvrage paraissant en mai 1963 à l'occasion du 5e congrès mondial du pétrole.
- La dernière édition de l'index alphabétique du plan de classement de l'I.F.P. (classification décimale spéciale) a été réalisée par les mêmes moyens, par tri alphabétique des cartes perforées correspondant à toutes les rubriques du plan de classement idéologique. L'avantage de cette méthode est de permettre des mises à jour pratiquement instantanées. Au fur et à mesure que de nouvelles rubriques ou de nouveaux développements sont intégrés dans la classification, les mots-clés correspondant aux numéros matières sont reportés sur des cartes perforées. Il suffit de les intégrer mécaniquement dans l'ensemble des anciennes cartes et de les passer à la tabulatrice pour avoir une liste parfaitement à jour (fig. I). Ce travail a été exécuté en 1965.

a. Obtention d'instruments de travail par sélection et impression automatiques de listes et d'index

1. Rapports intérieurs de l'I.F.P.

Le nombre des rapports intérieurs de l'I.F.P. en présentation normalisée et numérotés de façon continue depuis 1953 atteint quelque 15 000 unités. Il s'accroit désormais de 150 à 200 par mois. Comment voir clair rapidement dans cette masse de documents techniques en n'utilisant aucun moyen supplémentaire de personnel en quantité et en qualification ? En se tournant vers l'auto-indexation des documents sur leurs titres.

Nous nous permettrons ici une digression pour rappeler rapidement les avantages mais aussi les limites de l'auto-indexation sur les titres.

Son principal avantage est la rapidité car ce système élimine l'effort intellectuel humain d'analyse du contenu des documents et les délais qui en découlent. La valeur de l'index est elle-même ensuite uniquement fonction de la pertinence des titres. La valeur du titre en tant qu'outil d'indexation varie en effet beaucoup : d'abord en fonction des sciences et des techniques, selon qu'elles possèdent ou non un vocabulaire bien déterminé, puis avec le sujet du document car plus le sujet est restreint, plus le titre est généralement précis, tandis qu'un ouvrage qui aborde des sujets multiples ne peut espérer les voir représentés tous dans le titre. Par ailleurs, le problème de la polysémie s'accentue au fur et à mesure que le temps passe, un même mot évoluant au cours des années et prenant des significations différentes.

Les titres des documents scientifiques sont généralement meilleurs que ceux des documents relatifs aux sciences humaines; ceux des rapports et des articles généralement meilleurs que ceux des livres, et les documents datant d'une même époque utilisent pour un sujet donné des mots dont les contenus et les acceptions ne présentent pas d'ambiguïté ou de glissement de sens.

Mais l'auto-indexation, même dans le cas de « bons titres », ne résoud aucun problème de synonymie, aussi chaque consultant doit-il faire l'effort de rechercher les matières auxquelles il s'intéresse sous les différents termes par lesquels les auteurs peuvent s'exprimer.

De nombreuses études dont on trouvera la bibliographie dans l'ouvrage de M. E. Stevens : Automatic indexing : a state-of-the-art report 1, (document qui fait le point de la question de l'indexation automatique), montrent que la présence dans les titres de mots pertinents permettant une indexation effective varie, suivant le genre de documents et le soin qu'apportent les auteurs à rédiger leurs titres, de 20 à 90 %. Il convient donc d'appliquer la méthode avec discernement, aux documents qui répondent bien à ce mode de traitement, dont les titres offrent un fort pourcentage de mots intéressants. Pour étendre la zone d'application de la méthode, il est également apparu nécessaire de former les auteurs à ce genre d'indexation. Aux États-Unis, des réunions sont organisées pour ce faire : on demande, par exemple, aux auteurs dont les textes sont signalés dans les Chemical titles par simple indexation des titres, d'inclure six mots significatifs dans leurs titres. Les dernières études montrent, de ce fait, une nette augmentation de la pertinence de ces titres.

Les rapports provenant d'un même organisme sont les documents qui permettent le mieux l'auto-indexation, du fait de l'homogénéité de style et de langue, et de la possibilité d'agir sur les auteurs pour qu'ils établissent les titres en fonction du traitement par ordinateur.

L'ensemble des rapports intérieurs de l'I.F.P. se présentait donc bien comme un cas favorable à l'application des méthodes de réalisation d'index matières par permutation automatique des mots significatifs des titres.

Le premier problème documentaire qui se pose pour le traitement des titres est celui de la confection du « dictionnaire des mots vides » ou « dictionnaire négatif », c'est-à-dire de la liste des mots qui ne seront pas retenus par l'ordinateur pour l'indexation. Ce sont les articles, adverbes, auxiliaires, ainsi que certains adjectifs et les substantifs généraux tels que : action, compte rendu, problème, possibilité, principe, système, etc., sous deux formes, chaque substantif figurant au singulier et au pluriel. Pour les adjectifs, la langue anglaise a une supériorité très nette sur le français car si l'adjectif ne revêt en anglais qu'une seule forme, invariable, il en revêt, la plupart du temps, quatre en français : masculin, féminin, masculin-pluriel, féminin-pluriel, d'où des dictionnaires de mots vides nécessairement plus importants en français qu'en anglais. Ceci allonge le temps de comparaison dans la machine de chaque mot des titres avec les mots « vides » du dictionnaire. Le dictionnaire de mots vides établi pour le traitement des rapports intérieurs de l'I.F.P. compte environ 900 mots. La seule difficulté rencontrée est celle des mots qui, ayant une orthographe identique, sont « vides » dans un sens (ex : son - adjectif possessif) et « pleins » dans un autre (ex : son - substantif).

L'AID-IP (nom donné au programme d'Auto-Indexation des Documents de l'Institut du Pétrole) est un programme aussi général que possible qui permet, dans ce cas particulier, la réalisation :
d'index matières sur les mots significatifs du titre;
d'index auteurs;

de listes très nombreuses : par numéros de série, par numéros de projets de recherche auxquels se réfèrent les documents, par divisions et départements d'origine, par langue, par année, selon le caractère confidentiel ou non, selon la forme du document : rapports de recherche, contrats, brevets, articles, conférences, communications à des congrès, etc...

Pour réaliser ce programme, le format de carte suivant a été choisi :
- une zone de codification de 18 colonnes permettant de classer les rapports selon les critères suivants : confidentiel, numéro d'inventaire, division de recherche, département ou service, année et forme : rapport, article, contrat, brevet, conférence, communication à un congrès, etc...
- une zone auteur de format variable selon le nombre des auteurs;
- une zone titre de format variable selon la longueur du titre;
- une zone numéro de projet de recherche.

La zone auteur permet un rangement alphabétique des auteurs, la zone titre un classement alphabétique sur chacun des mots significatifs. L'extraction et le classement des mots significatifs de la zone titre sont rendus possibles par comparaison avec le dictionnaire négatif ou dictionnaire des mots vides.

La présentation finale de l'index des titres est de la forme la plus classique : le titre, regroupé sur une seule ligne selon un schéma circulaire, est classé alphabétiquement sur le mot significatif situé dans la zone médiane, et réapparaît autant de fois dans l'index qu'il contient de mots significatifs. La longueur de la ligne (130 caractères) permet d'avoir 95 % des titres entiers.

Cette expérience s'est révélée très rentable, permettant d'avoir dans des délais fort rapides des listes classées par sujets, par auteurs, ou par forme (thèses, articles, brevets, etc...) selon les questions posées. Quelques minutes suffisent à établir des documents qui auparavant nécessitaient de longs travaux de tri et des heures de dactylographie.

Indépendamment de la réponse à des questions occasionnelles, un AID-IP sujets, auteurs et numéros de série des rapports intérieurs sortis dans le mois est diffusé chaque mois suivant aux collaborateurs de l'I.F.P. habilités à le recevoir.

Ce système fonctionne régulièrement depuis juillet 1965 (fig. 2).

2. Traductions.

L'AID-IP est appliqué, selon les mêmes principes de base, à ce « corpus » différent mais, lui aussi, assez homogène que représentent les traductions effectuées par le Centre de documentation de l'I.F.P. pour ses chercheurs.

3. Index de la Revue de l'I.F.P.

L'index cumulatif des années 1946 à 1960 de la Revue de l'I.F.P. a été fait selon les méthodes traditionnelles. L'index cumulatif suivant et les index annuels sont faits désormais par application du même programme AID-IP, avec quelques variantes destinées à enrichir les index réalisés.

En effet, s'il est impossible de passer du temps à analyser des rapports intérieurs qui défilent au rythme de 150 à 200 par mois, il est par contre possible de trouver le temps d'analyser le contenu des 80 articles environ publiés en une année dans la Revue de l'I.F.P. Cette analyse permet le choix de 1 à 8 mots-clés environ supplémentaires par rapport aux mots-clés qui apparaissent spontanément d'après le titre.

L'index des matières qui résulte de l'application du programme se trouve donc enrichi d'autant (fig. 3).

4. Gestion automatisée des périodiques.

Le Centre de documentation gère 2 330 abonnements à des périodiques. La gestion manuelle ayant été normalisée et simplifiée au maximum, la seule étape ultérieure est l'automatisation qui soulagera les personnes de tâches routinières mais multiples et compliquées en même temps et permettra d'obtenir sans effort supplémentaire l'édition régulière et complète du catalogue des périodiques et de nombreuses statistiques par pays, par langue, par division technique destinataire, par mode d'acquisition : achat, échange, etc, par date d'échéance des abonnements, etc.

Le travail, commencé au 2e semestre 1965, n'est pas encore totalement terminé.

b. Recherche rétrospective d'informations et fabrication automatique de bibliographies.

Il a été fait allusion, lors de l'énoncé des critères de choix de l'I.F.P., au service d'abonnement aux bandes magnétiques établies avec les références des documents analysés par l' « American petroleum institute » et l'Université de Tulsa.

Ces bandes sont le point de départ de notre service « SVP » de recherche d'information. Mais le nombre des documents ainsi enregistrés n'est pas encore suffisant pour que la recherche sur ordinateur soit d'une rentabilité supérieure à la recherche manuelle.

Au fur et à mesure que le nombre des informations disponibles sur bandes croîtra par réception de ces abonnements américains, par réception d'autres abonnements à de nouveaux services du même type dans d'autres spécialités, par mise sur bande des quelque 16 ooo analyses établies annuellement par l'I.F.P. lui-même, par mise sur bande des analyses échangées au sein d'une association de travail coopératif entre plusieurs organismes pétroliers français ou par intégration sur bande du fichier de quelque 400 ooo références du catalogue central de l'I.F.P., toutes possibilités :
de réponses à la demande,
d'envoi périodique de listes de références correspondant à des profils d'ingénieurs, de groupes d'ingénieurs, de sociétés,

seront ouvertes.

La plus ou moins grande rapidité d'accès à cette étape est très directement fonction des moyens qui pourront y être consacrés. L'importance de ces moyens suppose pratiquement un large intérêt coopératif autour de ces initiatives pour que, utiles au plus grand nombre possible, elles soient supportées et aidées par le plus grand nombre possible.

A l'heure actuelle, le travail concret à l'I.F.P., dans ce domaine, se présente ainsi :

1. Travaux sur documents préparés aux États Unis.

L' « American petroleum institute», par exemple, offre :
- une série de fiches analysant quelque 150 revues et les principaux congrès et meetings portant sur le raffinage du pétrole; ces fiches format 10 X 15 portent une numérotation continue (II 600 fiches en 1965);
- une série de fiches analysant les brevets déposés dans le domaine du raffinage, les analyses y étant beaucoup plus fournies en ce qui concerne les brevets anglo-saxons que les brevets des autres pays (14 500 fiches en 1965);
- Pour l'une et l'autre série existent des bandes magnétiques sur lesquelles sont enregistrés, pour chaque document : son numéro, son titre, ses auteurs, ses références bibliographiques, ses mots-clés.

Au moment de l'indexation des documents, les mots-clés sont choisis d'après un thesaurus hiérarchisé, la Subject authority list (SAL), qui fait l'objet de refontes successives (fig. 4). Ces mots-clés ou descripteurs sont utilisés en ajoutant certains indices de pondération qui, pour chacun, en indiquent l'importance : ce sont les signes : *, P, N, D et A. Ces indices de pondération sont principalement utilisés pour la fabrication d'index automatiques destinés à la recherche manuelle. Ces index sont au nombre de deux : l'Alphabetical Subject Index ou ASI et le Dual Dictionary ou DD.

L'ASI paraît mensuellement avec un cumulatif semestriel (fig. 5).

Cet index permet un accès rapide aux principaux documents sur un sujet bien déterminé. Il est fait à partir du classement alphabétique du mot-clé principal de chaque article (*) et du ou des mots-clés secondaires (permuted (P). Sous le mot-clé principal figurent le titre, le numéro du document, le ou les mots-clés (P) et d'autres mots-clés tertiaires (non permuted (N)) qui ne sont pas repris dans le classement alphabétique mais qui donnent, en plus du titre, un supplément d'information sur le sujet. C'est dans les mots-clés (N) qu'apparaissent des rubriques de formes : abstract, meeting paper, preprint, symposium, review, survey, news. Une quatrième catégorie de mots-clés, A (Autoposted), sont ajoutés automatiquement par la machine et se composent des termes génériques (ex : Europe pour France), ou des aspects chimiques d'un corps.

Les autres descripteurs (D) sont utilisés, en plus des précédents et avec eux, pour la confection du deuxième instrument manuel, le Dual Dictionary. Le Dual Dictionary est formé par deux exemplaires d'une liste alphabétique identique qui reprend tous les mots-clés figurant pour chaque document et l'indication du numéro des documents où il figure.

Pour une question donnée, la recherche sera faite par la comparaison des numéros des documents figurant sous chacun des termes caractérisant la question. Lorsqu'un même numéro figure sous chacun de ces termes, c'est que le document qu'il représente répond à la question. C'est dire que l'on peut faire manuellement la même opération de comparaison que fait automatiquement l'ordinateur. Par exemple, une recherche sur les additifs pour essence sera faite par comparaison des numéros de documents figurant sous le mot additives et sous le mot gasolines. (fig. 6).

Les mots-clés, en plus de leur indice de pondération, peuvent avoir un indicateur de rôle. Les rôles concernent uniquement les substances impliquées dans une réaction chimique et sont principalement :
Rôle A (Agent) matière première
Rôle P (Product) produit de réaction
Rôle 1 (Intermediate) produit intermédiaire
Rôle C catalyseurs de réaction
Rôle X substance analysée

Outre les indicateurs de rôle, il existe également des liaisons (links) qui ont pour but de créer des relations entre deux ou plusieurs mots-clés. Ils consistent en un signe identique : un même chiffre employé pour les termes reliés. Le link est principalement utilisé pour lier un corps à ses aspects chimiques, c'est-à-dire pour les composés organiques : le nombre d'atomes de carbone, la forme de la chaîne, l'état de saturation, etc...

La recherche bibliographique se fait à l'aide des mots-clés. Le programme permet de poser les opérations « et » ou « ou ». On peut obtenir plusieurs niveaux de réponse. Suivant le niveau demandé, la machine restituera seulement les numéros des documents comportant les mots-clés caractérisant la question, ou les références complètes ou les références complètes avec les mots-clés ou les références complètes, les mots-clés et les mots-clés supplémentaires ajoutés par la machine. (fig. 7 et 8).

Les bandes magnétiques sont fournies tous les quatre mois environ avec des cumulatifs annuels. Actuellement l'I.F.P. possède les bandes correspondant aux références portant sur la littérature du raffinage (1964-1965 : 24 000) et les bandes correspondant aux brevets (1964-1965 : 26 ooo). Nous pouvons donc actuellement traiter, pour une recherche sur le raffinage, 50 000 références sur ordinateurs.

L'Université de Tulsa fournit, dans le domaine de la recherche et de la production pétrolière, une documentation calquée sur le même modèle : fiches 100 X 150 portant résumé, bande magnétique, alphabetical subject index, dual dictionary, thesaurus. Les Petroleum abstracts de l'Université de Tulsa ont analysé, en 1965, 12700 documents correspondant à la fois à la littérature périodique et aux brevets. Actuellement, seule la première bande qui porte sur 4 000 références environ a été diffusée et reçue à l'I.F.P.

Si les deux systèmes sont compatibles, il existe cependant entre eux quelques différences liées à la nature des sujets traités. Tulsa n'utilise actuellement ni indicateurs de rôle, ni links.

Pour le moment, nous utilisons surtout les index manuels ASI et DD, qui permettent très rapidement l'établissement de bibliographies. Nous en sommes encore au stade où le temps humain consacré à cette recherche est moins cher que le temps-machine. Mais déjà certaines rubriques deviennent très lourdes à consulter et, d'ici un an, la situation sera inversée.

Notre stock de bandes magnétiques est d'ailleurs destiné à s'accroître rapidement. Chemical abstracts annonce en effet un nouveau service : POST (POlymer Science and Technology). POST J analysera 425 journaux et les rapports gouvernementaux, POST P analysera 20 ooo brevets par an. Des bandes magnétiques pour une recherche automatique seront fournies. Nous avons décidé de nous abonner à ce service bibliographique.

L' « American geological institute » annonce un service du même genre. La tendance à livrer les informations bibliographiques sous la forme de bandes magnétiques s'accentue de jour en jour.

Dans la mesure où ce développement se fait de manière intellectuellement concertée et matériellement compatible, il semble pouvoir assurer aux Centres de Documentation des services extrêmement précieux.

2. Travaux sur documents préparés en France.

L'abonnement à des services existants ou en cours de création ne dispense pas pour autant d'apporter sa pierre à l'édifice, surtout lorsqu'on a une large mission de documentation et d'information comme celle qui a été confiée à l'I.F.P. statutairement.

Depuis sa création, l'Institut a donc développé, au service de tout demandeur extérieur comme au service de ses propres chercheurs et étudiants, un fichier classique auteurs, matières, géographique, à partir des analyses d'articles de périodiques, de communications de congrès et d'ouvrages.

En 1965, 16 650 références se sont ainsi ajoutées au fichier, chiffre du même ordre de grandeur que ceux annoncés pour les organisations américaines pétrolières dont il a été longuement question plus haut. Ces références devront être mises en ordinateur à leur tour, étant entendu que celui-ci pourra être interrogé indifféremment en français ou en anglais.

Mais dans une action d'aussi vaste envergure que l'analyse et le traitement de la littérature scientifique, technique, économique relative à une industrie toute entière et à ses multiples ramifications, l'apport du maximum de bonnes volontés, de compétences et de moyens au sein d'associations coopératives est indispensable.

Sur le plan français, dans le domaine pétrolier, une Commission documentaire a été créée au sein du Comité des techniciens de la Chambre syndicale de la recherche et de la production du pétrole et du gaz naturel.

Le but principal de cette Commission est la mise en œuvre d'une documentation automatique dans le domaine de la prospection pétrolière (Sciences de la terre).

Elle est actuellement constituée par les responsables et des membres des services de documentation de la Compagnie française des pétroles (C.F.P.), de l'Entreprise de recherche et d'activités pétrolières (ERAP), de l'Institut français du pétrole (I.F.P.) et de la Société nationale des pétroles d'Aquitaine (S.N.P.A.) 2.

La politique de la Commission a été d'établir un choix de revues et documents à dépouiller, sans faire double emploi avec les Petroleum abstracts de Tulsa, d'établir un format de fiches en clair, d'établir un bordereau de perforations pour les références, et de constituer un vocabulaire organisé du sujet traité.

Les trois premiers points ont été résolus. Les revues à dépouiller ont été réparties entre les différents organismes qui, pour les revues qu'ils ont en charge, établissent une fiche en clair au format 85 X 190 (même format que les cartes perforées).

Outre les références, un résumé figure sur la carte, ainsi que la liste de mots-clés. Ces cartes sont rangées dans un ordre numérique. Pour chaque document est établie également une série de cartes perforées portant les mêmes indications, à l'exclusion du résumé. Fiches en clair et fiches perforées sont échangées par les participants, chacun récoltant le bénéfice du travail des trois autres (fig. 9 et 10).

Actuellement, les échanges ont déjà commencé, mais la mise au point du vocabulaire commun n'est pas encore terminée, certains problèmes se posant évidemment dans le choix des mots-clés pour assurer une bonne homogénéité d'indexation entre les quatre groupes participants.

En conclusion, il est nécessaire de remarquer que la plupart des travaux qui viennent d'être énumérés sont d'un caractère classique.

Mais les résultats concrets atteints sont très appréciés des utilisateurs et, parallèlement, l'équipe du Centre de calcul qui a travaillé sur ces problèmes de documentation y a acquis un degré nouveau et supplémentaire de maîtrise en matière d'utilisation de ses machines et de conception de ses programmes avec un haut niveau de généralité.

Le changement prochain de l'ordinateur qui a servi à ces réalisations (IBM 7040) pour un ordinateur beaucoup plus puissant, de la nouvelle génération, permettra, sur le plan du traitement de documents nombreux, des gains de temps extrêmement considérables. Il faut préciser cependant que ce prochain changement freine certains travaux nouveaux et l'amélioration des productions plus anciennes que nous souhaiterions réaliser; en effet, la conception et la mise en œuvre de nouveaux programmes qui ne seraient utilisés qu'un laps de temps très court n'est pas rentable. Aussi sommes-nous contraints de marquer le pas et d'attendre pour accomplir un certain nombre de modifications et donner l'essor à d'autres projets.

Les projets ne manquent pas, en effet, dont la réalisation devrait permettre à l'I.F.P. de prendre bonne place dans le réseau national et international de télédocumentation automatique, solution inéluctable de l'avenir.

Nous croyons cependant avoir montré que, sur la route qui y conduit, en s'attaquant modestement à des problèmes bien concrets, correspondant à des besoins réels des utilisateurs que l'on a mission de servir, on peut faire jouer aux ordinateurs un rôle irremplaçable.

Illustration
Figure 1

Illustration
Figure 2

Illustration
Figure 3

Illustration
Figure 4

Illustration
Figures 5 et 6

Illustration
Figures 7 et 8

Illustration
Figures 9 et 10

  1. (retour)↑  NBS Monograph 91. - Washington, National Bureau of Standards, 1965. - 220 p. 662 réf.
  2. (retour)↑  Au moment de la rédaction du manuscrit de cet article, soit août 1966.