Un Répertoire de mots-clés pour la documentation mécanisée dans le domaine de la technique nucléaire

Léon Rolling

Le Centre d'information et de documentation (C. I. D.) d'Euratom met actuellement au point un système de documentation semi-automatique. L'information qui lui est fournie sous forme de resumés est analysée par attribution de mots-clés suivant la méthode d'indexation coordonnée (« Coordinate Indexing »). La terminologie du domaine nucléaire a été compilée et condensée, par l'élimination des synonymes et des homonymes, en un répertoire de mots-clés comprenant environ 1 200 termes généraux, 1 800 composés de chimie minérale et 1400 isotopes. Afin de rendre plus précis le choix des mots-clés à attribuer, les termes généraux ont été groupés par sujets et représentés graphiquement avec leurs connexions de parenté et d'association. La fréquence d'attribution des mots-clés, qui est déterminée périodiquement par des méthodes statistiques, donnera des indications utiles pour la recherche documentaire

Introduction

Le Centre d'information et de documentation (C. I. D.) d'Euratom a été créé afin de fournir de la documentation sur l'utilisation de l'énergie nucléaire aux centres de recherches d'Euratom et des États membres ainsi qu'à leurs industries.

Outre la mise en place de bibliothèques techniques et scientifiques et la publication de rapports et de périodiques, la tâche principale du C. I. D. est de rassembler et de rendre accessible l'ensemble de la littérature existant dans le domaine de la physique nucléaire et de la technologie des réacteurs, ainsi que dans les domaines connexes comme la protection contre les rayonnements, l'utilisation des isotopes, l'étude des matériaux, l'électronique, la radiochimie et la radiobiologie et également la documentation automatique.

Jusqu'à présent plus de 200 000 articles, rapports, brevets et comptes rendus de réunions ont été publiés dans ces domaines et on estime que l'accroissement annuel de la documentation se chiffre à plus de 40 000 unités d'information.

La tâche du C. I. D. consiste à emmagasiner cette documentation (en majeure partie en langue anglaise) de telle façon que les organismes de recherche et de développement puissent obtenir rapidement les renseignements nécessaires à leurs travaux.

Les méthodes traditionnelles de la documentation, qui impliquent l'usage d'index-matières et de fichiers classiques, s'avèrent insuffisantes par suite de la masse de documentation à enregistrer. C'est donc afin d'accélérer la sélection d'informations demandées que l'on utilise aujourd'hui des ordinateurs électroniques à grande capacité. Ces machines permettent d'emmagasiner sous une forme très compacte des millions d'unités d'information et de les rechercher très rapidement, à condition qu'elles aient été codées de façon convenable.

Après qu'il eut été décidé au C. I. D. de procéder à un tel emmagasinage, il s'est avéré nécessaire - afin de pouvoir enregistrer et exploiter la documentation déjà existante et la documentation courante - de faire un choix parmi les méthodes plus ou moins rationnelles et plus ou moins éprouvées. Après une étude approfondie, on a retenu un procédé ayant déjà fait ses preuves dans certains organismes et sur le point d'être utilisé dans d'autres. C'est le procédé dit: Coordinate Indexing. Pour alimenter la machine et identifier les documents, on leur assigne, suivant le procédé, un certain nombre de mots-clés, dont la combinaison permet de représenter avec une précision suffisante la teneur du document. Ces mots-clés, appelés également Descriptors, Selectors, Subjects Headings ou Vedettes matières, permettent de retenir les notions fondamentales et les points capitaux du texte.

Tous ces mots-clés ont la même valeur pour l'analyse et la recherche documentaire et il n'est donc pas nécessaire qu'ils puissent s'intégrer dans une classification hiérarchique.

La notation et la codification des liaisons syntaxiques sont complexes et rarement nécessaires; dans la plupart des cas les mots-clés choisis font ressortir sans équivoque les liaisons désirées.

Il serait possible de prendre textuellement les mots-clés dans le titre ou le texte de l'information; dans ces cas la façon d'exprimer les notions individuelles dépendrait du choix fortuit et plus ou moins heureux de l'auteur. Cependant, pour la forme de recherche documentaire qui s'impose ici, il est indispensable qu'à chaque notion ne corresponde qu'un seul mot-clé. D'où la nécessité de créer, par élimination des synonymes et par d'autres mesures analogues, un répertoire de mots-clés (Thesaurus), à employer obligatoirement et exclusivement.

Dans le cadre des travaux préparatoires on a étudié le volume, la structure, la terminologie et le mode d'emploi d'un certain nombre de répertoires de mots-clés existant dans d'autres organisations et entreprises, afin de les comparer avec les besoins d'Euratom. Le résultat de cette analyse est représenté dans le tableau n° I.

Trois des organismes cités utilisent des mots-clés du domaine de la technique nucléaire. Parmi eux, seul l'Armed Services Technical Information Agency (ASTIA) possède l'équipement mécanique nécessaire à la recherche documentaire. La répartition des mots-clés en groupes de termes apparentés, telle qu'elle est réalisée chez ASTIA, vaut d'être imitée, parce qu'elle rend le Thesaurus plus facile à utiliser. Intéressante est aussi l'analyse périodique de la fréquence d'utilisation de mots-clés.

L'analyse terminologique est extrêmement poussée à la Western Reserve University, tandis que chez General Electric le choix des mots-clés est laissé, dans une large mesure, à l'initiative des documentalistes.

La répartition en trois groupes : notions générales, matières et noms propres, a été reprise du service Atomenergiedokumentation du Gmelin-Institut. Noms propres, noms de réacteurs, marques de fabrique, notions géographiques, etc., ont été employés avec succès en tant que mots-clés, au Gmelin-Institut comme chez ASTIA et dans les Nuclear Science Abstracts (NSA); ces termes n'ont pas été incorporés dans le Thesaurus proprement dit, afin qu'il ne devienne pas trop volumineux du fait de la quantité de termes spéciaux, et ne nécessite pas de multiples rééditions dues à l'afllux de nouvelles notions. Par contre, l'utilisation de ces termes comme open-end terms ou mots-clés externes, c'est-à-dire non incorporés dans le Thesaurus, ne présente aucune difficulté, ni au cours de l'analyse, ni au cours de l'alimentation de la machine, ni pour la recherche documentaire.

Le vocabulaire du répertoire de mots-clés (Subject Headings List) de l'United States Atomic Energy Commission (USAEC), résultat de travaux de plusieurs années, est très utile. Constitué cependant en vue d'établir l'index-matières des NSA, il est devenu trop volumineux et ne tient pas compte des conditions spéciales de l'emmagasinage et de la recherche mécaniques. Cela n'empêche qu'il a pu servir de base pour l'élaboration d'un vocabulaire tenant compte des particularités de la documentation mécanique.

Constitution du vocabulaire

Une recherche effectuée sur la base de l'index cumulatif des NSA de 1960 a montré que sur les 12 809 notions figurant dans le Subject Headings List, 7 208 seulement ont été effectivement utilisées. De ce nombre, environ 2 ooo désignent des alliages (p. ex. : Cadmium-Indium-Silver Alloys) ou des mélanges (p. ex. : Lithium Fluoride-Potassium Fluoride Systems); dans le Coordinate Indexing, ces notions peuvent être décrites par une combinaison de mots-clés plus simples. Après élimination de ces notions composées et la suppression des noms propres et autres désignations spéciales, le Thesaurus était réduit à environ 4 500 notions.

Par la suite on a essayé de grouper ces termes par sujets, afin de confronter les synonymes et les notions ayant une relation hiérarchique et de procéder ainsi à un examen comparatif de leur portée sémantique. L'ensemble de ces notions a pu être réparti en 50 groupes qui furent ensuite examinés par des documentalistes spécialisés.

Il s'agissait alors de rechercher les définitions des mots-clés individuels, de déterminer les synonymes et les notions qui se recouvrent partiellement et de juxtaposer les notions apparentées. On a rapidement trouvé qu'il était avantageux et utile de représenter graphiquement les relations existant entre les notions. Des représentations graphiques semblables ont été élaborées systématiquement pour chacun des groupes de mots-clés. Les notions apparentées ont été réunies par des traits, puis des flèches; les renvois (see-also references) contenus dans le répertoire américain et qui indiquent de telles relations, ont pu être, grâce à cette méthode, représentés de façon claire et frappante.

Afin d'établir l'importance relative des différentes notions dans le domaine de la technologie nucléaire, on a procédé à l'analyse fréquentielle d'un index cumulatif des NSA, afin de constater combien de fois chaque Subject Heading avait été utilisé au cours de l'année 1960. Ces chiffres ont également été reportés sur la représentation graphique et ont permis aux documentalistes d'estimer la fréquence d'emploi probable des mots-clés au cours de la future analyse documentaire.

Dans la phase suivante de l'établissement du Thesaurus, les documentalistes avaient à décider, après étude approfondie de chacun des 4 500 Subjects Headings, de son incorporation dans le nouveau répertoire.

Il fallait déterminer si pour un terme donné, il n'existait pas déjà des synonymes et si certaines significations ne devaient pas être caractérisées par d'autres mots-clés.

Si une notion paraissait moins intéressante au point de vue technique nucléaire, elle était remplacée par une notion générique ou par une combinaison de telles notions. Si par contre elle contenait plusieurs autres notions et que son sens était entièrement défini par ces notions, elle pouvait elle-même être éliminée. Il a parfois paru utile de ne retenir que la signification nucléaire d'une notion à caractère général.

Dans certains domaines partiels il y avait une telle confusion de notions se recoupant, se recouvrant, s'excluant ou s'intégrant, que seules des mesures radicales ont permis de clarifier la situation au point de vue de la terminologie.

La diversité des problèmes rencontrés est expliquée ci-après par quelques exemples.

I. Pour distinguer les combustibles conventionnels des combustibles pour réacteurs, il paraîtrait avantageux d'écrire Fuels et Reactor Fuels. Cependant, les combustibles conventionnels ne sont pas importants du point de vue nucléaire et ils sont suffisamment représentés par des termes spécifiques comme Coal, Oil, Petroleum, Wood; d'autre part les mots-clés comprenant le terme Reactor seraient trop nombreux; on a donc établi une règle suivant laquelle Fuels, dans le Thesaurus d'Euratom, désigne les combustibles pour réacteurs. De même les termes Fuel Elements, Fuel Alloys, Fuel Cans signifient éléments combustibles pour réacteurs, alliages combustibles pour réacteurs, gaines de combustibles pour réacteurs.

2. En ce qui concerne le terme Plasma on doit distinguer les plasmas électrique et biologique. Comme le premier est plus important au point de vue nucléaire, on a trouvé la solution suivante : on emploie le terme Plasma dans la physique des plasmas et le terme Blood Plasma en hématologie; pour caractériser les dégâts causés par les rayonnements au protoplasme cellulaire, on se sert des termes plus généraux Animal Cells ou Cytology.

3. Un grand nombre de termes sert à décrire les effets des rayonnements.

L'expression Radiology est supprimée parce que suffisamment représentée par les mots-clés Radiography et Radiotherapy ; Radiation Hazards et Radiation Damage sont remplacés par Radiation Effects ou Radiation Injuries. lrradiation n'est à utiliser que s'il s'agit d'une irradiation systématique; Radiosensitivity se rapporte toujours à des êtres vivants; l'emploi des rayonnements à des fins médicales est spécifié par Radiography ou Radiotherapy ; s'il s'agit d'effets biologiques, on met Radiobiology ; les effets chimiques sont spécifiés par Radiation Chemistry et non par Radiochemistry.

4. Le facteur temps est désigné de façon différente dans chaque secteur particulier : outre Time Measurement il y a Timing Circuits en électronique, Age en biologie, Age Estimation en géologie ou en archéologie, Half-Life et Lifetime en physique nucléaire; seul le terme Time n'est pas utilisé parce que trop général.

5. Le terme Temperature est à utiliser s'il s'agit du facteur température, c'est-à-dire de l'effet des variations de température sur un processus; d'autre part les mots-clés High Temperature et Low Temperature s'appliquent à des phénomènes se passant à un niveau thermique particulièrement haut ou particulièrement bas.

6. Pour les 48 métaux formant des alliages, on a formé, à l'aide du terme Alloys, des mots-clés composés, qui juxtaposés, servent à décrire les alliages.

Par exemple : bronze = Tin Alloys + Copper Alloys.

Les métalloïdes qu'on trouve parfois dans les alliages, sont caractérisés par le composé qu'ils forment avec le métal de base.

Par exemple : alliages cobalt-bore = Cobalt Alloys + Cobalt Borides.
alliages manganèse-nickel-silicium =
Manganese Alloys + Nickel Alloys + Silicides.

S'il s'agit de composés intermétalliques, on ajoute encore aux termes caractérisant l'alliage, le mot-clé Intermetallic Coumpounds.

Par exemple : antimoine de gallium =
Gallium Alloys + Antimony Alloys + Intermetallic Compounds.

7. L'expression, très générale, Activity est supprimée, parce que son sens se retrouve entièrement dans les termes spécifiques Reactivity, Radioactivity et Activation. On a été tenté de biffer également d'autres expressions générales, comme Halogens, Alloys ou Elementary Particles, dont tous les termes subordonnés existent. On a préféré les garder, de nombreux documents traitant d'une manière tout à fait générale des propriétés, de la préparation ou de l'utilisation de ces groupes.

8. D'une manière générale, l'emploi de termes spécifiques comme mots-clés doit être recommandé, pour autant qu'ils existent dans le Thesaurus, et des termes collectifs ou généraux ne sont à utiliser que si les expressions spécifiques font défaut, ou pour décrire des études tout à fait générales ou sommaires.

On a dû établir plusieurs douzaines de règles de ce genre pour fixer et délimiter suffisamment la terminologie.

Il résulte de ce qui précède, que les termes introduits dans le Thesaurus ne sont pas toujours utilisés avec la signification qu'ils ont dans le langage courant, mais avec un sens bien défini en vue de l'analyse documentaire.

Règles spéciales

Pour plusieurs secteurs importants on a dû établir des règles spéciales qui rentrent dans le cadre même du Thesaurus. On les trouvera exposées comme suit :

A. Types des réacteurs.

Les caractéristiques essentielles dans l'étude d'un réacteur nucléaire sont le nom et le type du réacteur, l'usage auquel il est destiné ainsi que les matières utilisées comme combustible, modérateur et réfrigérant. Cela impliquerait une classification suivant au moins six points de vue. Si, en plus, un réacteur peut servir à des fins différentes, si le même type de réacteur est désigné sous des noms différents dans plusieurs pays, si un réacteur utilise plusieurs combustibles, modérateurs ou réfrigérants, ou si quelques-uns de ces facteurs ne sont même pas connus, ce qui est bien souvent le cas, tous les systèmes de classification deviennent inopérants.

L'emploi d'un système de mots-clés élimine toutes ces difficultés. Pour chaque usage, pour chaque combustible, modérateur ou réfrigérateur, il existe un mot-clé; il n'y a aucune situation dont il ne serait pas tenu compte par une combinaison judicieuse de mots-clés.

Exemples :
a) Le développement de barres de combustible pour un réacteur à usages multiples, modéré au béryllium ou au graphite, est décrit par les mots-clés suivants :
Reactors, Research Reactors, Beryllium Moderator, Graphite Moderator, Fuels Elements, Rods.
b) Le réacteur de recherche Argonaut est caractérisé par Research Reactors, Graphite Moderator, Water Moderator, Water Coolant, Argonaut.

Dans ce cas-ci on a retenu le nom du réacteur (Argonaut) comme mot-clé externe (open-end term), parce que cette caractéristique pourrait être capitale lors d'une recherche.

B. Les composés inorganiques.

Le grand nombre de composés chimiques dont le nom est constitué par plusieurs mots, exigeait une règle spéciale, destinée à éviter aux documentalistes d'avoir à manier des milliers de mots-clés.

L'analyse de fréquence statistique d'un index annuel des NSA a permis de classer les composés chimiques d'après leur degré d'importance au point de vue nucléaire. Il aurait été possible d'établir ainsi une liste de mots-clés contenant les composés les plus importants ou de dresser un tableau montrant les combinaisons autorisées entre noms d'éléments et radicaux anioniques. Cela aurait obligé les documentalistes à recourir fréquemment à cette liste ou à ce tableau, pour connaître les termes compris dans le Thesaurus et ceux qu'il y aurait lieu de former par combinaison de mots-clés.

Il nous a paru plus indiqué de créer un mot-clé pour tous les composés dont le nom est formé d'un nom d'élément et de celui d'un radical anionique. Pour ne pas trop élargir le cadre du Thesaurus, ce qui aurait rendu son emploi plus difficile, la liste des anions a été limitée aux composés les plus courants :

Borides, Bromides, Carbides, Carbonates, Chlorides, Complexes, Compounds, Fluorides, Hydrides, Iodides, Nitrates, Nitrides, Oxides, Phosphates, Silicates, Sulfides, Sulfates.

Les autres composés sont décrits par la combinaison de plusieurs mots-clés, comme le montrent les exemples suivants :
Lithium Compounds + Uranates au lieu de Lithium Uranates
Potassium Chlorides + Platinum Chlorides au lieu de Potassium Chloroplatinates.

C. Les composés organiques.

Dans les index matières les composés organiques sont souvent cités sous le nom du composé de base duquel ils sont dérivés, et qui est suivi du nom des radicaux ajoutés ou substitués. On rencontre ainsi :
Ethyle, Difluoro-
Hydrazines, Alkyl-
Acetic Acid, Ethylenediaminetetra-

Ce système permet de retrouver ensemble les composés dérivés de la même substance de base; il ne convient pas pour la documentation mécanisée, ne serait-ce que parce qu'il augmenterait trop le nombre de mots-clés.

Si par contre on utilise comme mots-clés, les composés les plus importants et les fonctions chimiques, il est possible de caractériser la plupart des composés de manière suffisamment précise pour les besoins de la documentation d'Euratom.

Exemples :
Difluoréthylène : Ethylene + Fluorocarbons.
Dérivés aliphatiques de l'hydrazine : Hydrazines + Alkyl Radicals.

L'acide éthylène-diamine-tétracétique fait partie du Thesaurus sous l'abréviation EDTA, souvent utilisée en radiochimie.

En plus de ces mots-clés, on pourrait noter la formule globale lorsqu'elle est connue; néanmoins il reste à déterminer si cette mesure est bien utile et ne rend pas l'analyse documentaire plus difficile.

S'il s'agit de composés dont le nom usuel est plus connu que la désignation chimique, celui-ci est adopté comme mot-clé supplémentaire.

D. Les Isotopes.

Outre les désignations générales du type Cobalt Isotopes, Iodine Isotopes, Uranium Isotopes, il serait possible d'incorporer au Thesaurus certains isotopes particulièrement importants, comme par exemple Cobalt 60, Iodine 13I et Uranium 235. Cependant tout le domaine de la séparation et de l'utilisation des isotopes est si important dans le secteur nucléaire que l'on a préféré la règle suivante :

Toutes les définitions composées du nom d'élément et du mot Isotopes ainsi que celles composées d'un nom d'élément et d'un poids atomique sont adoptées comme mots-clés. Seuls Hydrogen 2 et Hydrogen 3 sont remplacés par Deuterium et Tritium. Pour vérifier l'existence de ces isotopes, on se basera sur le tableau des nuclides édité par la « Kernreaktor GmbH Karlsruhe ».

Représentation graphique

Lorsque les composés organiques (1854 mots-clés) et les isotopes (1386 mots-clés) eurent ainsi été éliminés de la liste, il resta un ensemble de 1127 mots-clés, qu'il était possible de reproduire sur une seule feuille de format DIN-A4 pour la facilité des documentalistes.

Les diverses listes de mots-clés groupés par spécialités ont paru moins pratiques pour l'analyse documentaire. On essaya alors d'utiliser les graphiques développés lors de la mise au point du Thesaurus également pour l'attribution des mots-clés. Ils furent complétés, munis d'un index alphabétique, reproduits et soumis aux documentalistes s'occupant de l'analyse documentaire. Le succès dépassa les prévisions, en ce sens que la précision du choix des mots-clés et la rapidité de l'analyse augmentèrent brusquement.

L'absence d'un classement logique ou hiérarchique n'a pas été gênante; on a apprécié le fait que tout le domaine englobant un terme donné, choisi pour exprimer un concept, peut être saisi d'un regard, avec ses relations et parentés. Le besoin d'une liste spéciale de renvois ne se faisait plus sentir, puisque tous les renvois, tant à l'intérieur des groupes que vers des mots-clés contenus dans d'autres groupes, étaient représentés par des flèches dans le graphique.

D'autre part, il devenait nécessaire d'établir une liste des termes qui ne se trouvent pas dans le Thesaurus (synonymes des mots-clés et notions moins importantes du point de vue nucléaire) avec renvois aux mots-clés qui les remplacent. Même ici les graphiques s'avérèrent utiles parce que le documentaliste pouvait insérer les notions nouvelles à côté des mots-clés correspondants; il était ainsi en mesure de retrouver les mêmes mots-clés lors de l'analyse ultérieure de résumés traitant du même sujet.

Puisqu'il n'est évidemment pas possible de faire entrer tous les renvois dans les diagrammes, un glossaire, en voie de préparation, servira en quelque sorte de mode d'emploi et contiendra entre autres les règles énumérées plus haut.

Analyse documentaire

L'analyse documentaire débuta parallèlement à la réalisation des graphiques et du glossaire. Les premières analyses permirent un contrôle de la terminologie du Thesaurus et la détermination de la fréquence d'attribution des mots-clés.

Dans un premier essai les 1266 résumés contenus dans un numéro des NSA ont été analysés avec grand soin par les documentalistes qui notaient :
I° le numéro du résumé;
2° les mots-clés définissant la teneur du document;
3° les termes supplémentaires nécessaires à une description complète du document, c'est-à-dire les noms propres et les notions importantes non encore incorporés dans le Thesaurus.

Chaque mot-clé et chaque terme supplémentaire étaient ensuite transférés sur une fiche perforée, en même temps que le numéro courant du résumé. Les fiches étaient triées alphabétiquement à l'aide de machines mécanographiques classiques, afin d'effectuer une analyse de fréquence. Les résulats de cette analyse, qui couvrait donc tout le domaine de la technique nucléaire, ont été représentés par deux diagrammes.

Le premier diagramme montre que le nombre de mots-clés attribués aux différents résumés est en moyenne de 7,6 et que la distribution est représentée par une courbe de Gauss. 1,2 termes supplémentaires ont été retenus par résumé. Cela signifie que le contenu d'un résumé correspond généralement à la valeur de 7,6 + 1,2 = 8,8 mots-clés.

Le deuxième diagramme montre la répartition de la fréquence d'emploi des mots-clés dans l'ensemble du Thesaurus. Tandis que plusieurs mots-clés étaient employés plus de cent fois, environ 3 ooo noms de composés chimiques ou d'isotopes n'ont pas été utilisés au cours de l'essai. La grande proportion de mots-clés rarement employés montre qu'avant chaque recherche documentaire il sera utile de déterminer la fréquence d'emploi - à l'analyse - des mots-clés utilisés pour définir le problème posé. On pourra ainsi se faire une idée du nombre de documents qu'on obtiendra en réponse à la question posée.

Pour l'essai décrit ci-dessus, comme dans l'analyse documentaire courante, on s'est basé exclusivement sur les résumés. On a trouvé en effet que l'analyse d'un document original, c'est-à-dire la lecture et l'attribution de mots-clés, prend en moyenne un peu plus d'une heure, alors que 8 minutes suffisent, en moyenne, pour l'analyse d'un résumé. L'analyse d'un document dans son texte original fournit en moyenne II à 12 mots-clés, tandis que l'emploi de résumés en donne 8,8. On constate donc que l'analyse ne gagne que peu en qualité par l'addition de 2 ou 3 mots-clés, le plus souvent secondaires, alors qu'elle requiert huit fois plus de main-d'oeuvre.

C'est pourquoi on essaie de se procurer les résumés analytiques de toutes les publications dans le domaine nucléaire.

Pour autant qu'ils ne puissent être prélevés dans les périodiques spécialisés comme Nuclear Science Abstracts, Chemical Abstracts, etc., ils seront confectionnés sous contrat pour Euratom.

Évolution prévue

Alors que le travail journalier des documentalistes spécialisés consiste à attribuer des mots-clés aux résumés de différentes sources, plusieurs problèmes restent à résoudre :

Le Thesaurus doit être précisé et complété afin de permettre une recherche documentaire perfectionnée. L'analyse de fréquence de l'attribution des mots-clés, effectuée périodiquement, fournit de précieuses indications à cet effet. Le Thesaurus est ainsi complété par des notions nouvelles dès qu'on constate que ces notions sont utilisées par les spécialistes.

On essaie d'autre part de découvrir les centres d'intérêt de la demande d'information en analysant les questions posées au cours des dernières années au groupe « Recherches documentaires » du C. I. D. et qui ont été traitées par des méthodes traditionnelles (fichiers classiques et index-matières).

Enfin, il est d'un intérêt majeur de déterminer les méthodes selon lesquelles se fera la sélection de la documentation emmagasinée, et de les accorder avec les possibilités de l'équipement disponible. Ces problèmes seront résolus en collaboration avec le groupe CETIS-DOCA qui, au Centre commun de recherches d'Ispra, s'occupe de l'étude des méthodes de traitement de l'information.

Illustration
Tableau 1

Illustration
Analyse de fréquence (1)

Illustration
Analyse de fréquence (2)

Illustration
Tableau 2

Illustration
Extrait du glossaire

Illustration
Extrait du thésaurus