De Quelques thesauri
Yvonne Guéniot
Marie-Thérèse Laureilhe
Conservateurs à la Bibliothèque nationale.
L'informatique pour les besoins de la documentation a donné jour cette dernière décennie à des répertoires d'un type nouveau qui se sont révélés les outils indispensables de la recherche : les thesauri. Cet article décrit quelques-uns des répertoires parus au 1er mars 1969
Quand Robert Estienne publia en 1531 son Thesaurus linguae latinae, il donnait un nouveau sens à un mot déjà existant. Si l'Antiquité l'avait employé au sens de collection, et même de répertoire, Robert Estienne tendait à lui donner un sens universel de recueil de connaissances et le Thesaurus linguae latinae est un dictionnaire complet et universel de la langue latine où les mots sont remplacés dans leur contexte sémantique.
Les documentalistes et les bibliothécaires ont repris le mot « thesaurus » dans un sens dérivé de celui donné par Estienne. Le thesaurus est le recueil des mots d'une science ou d'une technique, servant à classer un document et établi de façon à regrouper ensemble ceux qui apportent une même information. Cette liste permet également à l'usager de savoir sous quelle rubrique de matières il trouvera l'information qu'il désire, rubrique désignée par les auteurs de thesauri sous les noms de termes, uni-termes, mots-sujets, mots-thèmes, mots-souches, mots-clés, descripteurs, etc... Ces deux derniers sont les plus fréquents. Toutes ces expressions représentent des réalités quelque peu différentes.
Ce sont donc les mots usuels d'une science ou d'une technique et souvent, pas toujours d'ailleurs, ces mots sont pris dans leur contexte : au mot on adjoint les adjectifs usuels qui l'accompagnent, ou les expressions utilisées couramment par les spécialistes. Pour ne pas disperser les recherches et pour conserver une certaine homogénéité au classement, on élimine les synonymes, et pour limiter l'importance du vocabulaire employé on supprime même des quasi-synonymes, passant ainsi du langage naturel au langage documentaire. L'ordre préférentiel est établi. Les synonymes donnent lieu à des renvois. Si nous décidons d'employer le mot « acide sulfurique » nous n'utiliserons pas « vitriol ». Mais il y a des usagers qui chercheront à ce mot. Nous introduirons dans le répertoire le renvoi : Vitriol, voir : Acide sulfurique.
Mais il faut aller plus loin et établir une hiérarchie : une information contenue dans un mot peut l'être dans un autre plus vaste, ou plus restreint. Celui qui cherche une documentation sur la viticulture dans l'Aude cherchera à « viticulture », mais aussi à « Aude », il devra chercher des ouvrages plus généraux sur la viticulture en Languedoc qu'il trouvera à « Languedoc », et devra penser aux « Corbières », pays viticole par excellence. A la suite de l'Aude il convient d'indiquer : Voir aussi : Languedoc, Corbières, Narbonne, etc... Cette recherche de tous les mots où l'information peut résider est délicate et demande l'intervention d'un spécialiste.
Cette introduction de la hiérarchie dans les thesauri facilite l'indexation en fournissant à l'indexeur la liste des termes les plus spécifiques à partir d'un terme de sens assez large, favorise la modification de la stratégie de recherche vers un degré de précision plus poussé si la réponse automatique de l'information est trop abondante, et permet de formuler automatiquement une question moins fine si la réponse à la question précédemment posée est quasi inexistante.
En quoi le thesaurus se distingue-t-il de la liste des vedettes par matières? A l'origine le thesaurus seul tenait compte de l'environnement et était riche en renvois de toutes sortes. Aujourd'hui, de plus en plus, les répertoires de vedettes par matières introduisent des renvois divers, plus ou moins hiérarchisés, se structurent et replacent le mot dans son environnement sémantique. Il arrive un point où on ne peut guère les différencier et tel thesaurus recensé ci-dessous est appelé de ce nom car l'auteur a libellé ainsi la page de titre, il ne se distingue guère de la liste de vedettes matières telle que la conçoivent la Library of Congress ou Biblio.
Peu de thesauri sont universels, il en existe, mais en très faible proportion. Cela se conçoit : trop vaste, l'instrument risque de n'être pas maniable, sa confection est longue, exige du personnel spécialisé, et un thesaurus encyclopédique demanderait l'intervention de multiples spécialistes. C'est pourquoi, à l'échelle universelle, on trouve surtout des répertoires de vedettes par matières, tels ceux établis par les deux organismes cités plus haut.
1. - Thesauri de sciences humaines et économiques
Dans le domaine des sciences humaines les thesauri sont beaucoup moins nombreux que dans celui des sciences exactes et des techniques, et le chercheur en ces matières se trouve un peu démuni. Les raisons en sont sans doute que le langage des sciences humaines est moins précis que celui des sciences exactes, l'analyse des textes plus délicate, les recherches plus individualisées. Cependant si l'on n'en connaît guère, pour ne pas dire aucun, dans le domaine de l'érudition, les nécessités de la vie moderne ont amené les responsables de centres de documentation à en réaliser quelques-uns pour les sciences juridiques, la sociologie, l'urbanisme, l'éducation, etc...
Bien qu'il s'agisse d'un « document interne »... réservé à l'usage des chercheurs et laboratoires de sciences sociales, nous citerons le Thesaurus documentaire en sociologie 2 du Centre d'études sociologiques du C.N.R.S., par Mmes de Reals et Jakob, réalisé de 1964 à 1966 et en cours de refonte. La méthode suivie est intéressante à connaître : le premier travail a consisté à relever les rubriques du catalogue alphabétique de matières du Centre dont seules les entrées étaient fixées, la liste des sous-vedettes restant ouverte. On a ensuite éliminé en partie les doubles emplois et les défauts de structuration. On a alors publié la liste actuelle. La seconde phase du travail sera de soumettre à l'examen de différents spécialistes les concepts et notions retenus.
Examinons ce thesaurus provisoire. Les entrées sont classées en mots-souches (expression employée par les auteurs) ayant un caractère autonome et en mots-souches de renvois qui sont subordonnés. Les rubriques analytiques peuvent comprendre un second mot. Pour éviter que ceux-ci ne soient trop nombreux, et qu'il y ait des doubles emplois, le thesaurus propose une liste de seconds mots, mais à titre de suggestion. L'ensemble a été divisé en 17 classes sémantiques en tenant compte des affinités des concepts et notions et des fréquences de voisinage. Des orientations systématiques d'une classe sur l'autre essayent de remédier à l'arbitraire forcé de tout classement. Une liste alphabétique des mots-souches et mots de renvoi facilite les recherches.
Ce thesaurus constitue un instrument qui peut être donné en exemple, en particulier aux bibliothèques qui envisagent de codifier un catalogue par matières déjà existant. L'emploi de signes typographiques très clairs avant chaque mot facilite le maniement de ce répertoire.
Le thesaurus du Centre pour la recherche expérimentale en art 3 de l'université de l'Ohio ne se distingue guère d'un index de vedettes de matières. Les termes (mots ou expressions composées) sont classés alphabétiquement. Les synonymes sont éliminés au moyen de renvois ainsi que les quasi-synonymes. Enfin nous y trouvons des renvois d'orientation, introduits par la formule : See also, qui replacent le terme dans son contexte sémantique. En face de chaque terme retenu est un numéro qui correspond à celui de la fiche documentaire portant l'analyse du livre ou de l'article. Ce thesaurus sert pour l'instant à rechercher l'information dans un fichier, il permet d'indexer un document au moyen du ou des termes convenant : de plus, le chercheur sait à quelle vedette s'adresser. Le principe est très simple. On ne nous dit pas que la recherche est mécanisée. Il est probable qu'à l'avenir elle le sera.
Ce thesaurus s'annonce comme servant à la bibliographie sur la recherche expérimentale en art. C'est une conception très large. Nous trouvons des termes sur la peinture, la sculpture, l'architecture, la musique, la danse, le théâtre et même la littérature, dit la préface; précisons qu'il s'agit plutôt d'esthétique littéraire. Nous trouvons en réalité bien plus. A la lecture nous y découvrons des termes scientifiques ou techniques, géographiques, philosophiques, psychologiques, etc... plus ceux relevant simplement du vocabulaire de la documentation. Le domaine de ce thesaurus est très vaste, si vaste qu'il ne faut guère compter l'utiliser pour la documentation en histoire de l'art. Ce n'est d'ailleurs pas son but.
Il se présente sous une forme assez rustique : simple photocopie de quelque 1800 termes rangés alphabétiquement; les auteurs ont joint des feuilles d'enquête demandant l'avis des usagers et leur collaboration, les recherches qui les intéressent et les termes utiles absents du thesaurus. Il serait bon que les bibliothèques du domaine du thesaurus répondent car les auteurs ont l'intention de publier de fréquentes rééditions et de donner plus d'ampleur à un instrument certainement utile mais qui peut être perfectionné.
La Bibliothek des Deutschen Bundestages (Bibliothèque du Parlement allemand) à Bonn publie, sous le titre de Register zum Sachkatalog 4, un thesaurus du domaine des sciences politiques. Le volume 1 comprend les lettres A à K. La fin ne sera pas publiée, mais une refonte comprenant l'ensemble de l'aphabet est en préparation.
L'ouvrage se présente sous forme de liste alphabétique unique formée de photocopies de fiches. Chaque descripteur est suivi de ses différents emplois, de son environnement et de renvois d'orientation. Le seul tome 1 comprend 1785 descripteurs. Il est complété par une liste alphabétique unique, A à Z, des descripteurs et des renvois qui comprend plus de II 000 termes et par une liste des vedettes géographiques (environ 300), avec renvois précisant l'utilisation (le plus souvent fonction de la chronologie) et avec renvois d'orientation.
Le Code documentaire, préparé par Jean Viet et Monique Brigaud pour la Délégation à l'aménagement du territoire et à l'action régionale 5, est destiné à indexer les ouvrages, rapports, documents et articles de périodiques paraissant en France et traitant des problèmes de l'aménagement du territoire. Il sert également pour les principales études du même type publiées à l'étranger. Actuellement le Centre d'étude et de recherche sur l'administration économique et l'aménagement du territoire retient 500 titres par mois, soit environ 6 ooo par an; il les examine, les indexe et établit des fiches tantôt signalétiques, tantôt analytiques, environ 8 ooo par an. Le code permet à la fois d'indexer et de classer les fichiers des utilisateurs de ces fiches et de les organiser.
L'ouvrage se compose de trois parties :
I° Un cadre géographique assez sommaire : les départements français sont regroupés par grandes régions géographiques classées du Nord au Sud, l'étranger par groupes de pays. Ce code n'est pas très détaillé.
2° La liste des descripteurs, classés alphabétiquement, donne tous les mots et expressions utilisés pour une entrée dans le fichier par matières avec les renvois d'orientation, ce qui représente quelque 500 mots clés, plus les renvois.
3° Le thesaurus proprement dit est disposé comme un Kwic-index, c'est-à-dire « permuté ». Sa colonne centrale donne les noms et adjectifs figurant soit comme descripteurs, soit comme partie d'une expression composée, les renvois des synonymes aux descripteurs et enfin les renvois de descripteurs à descripteurs introduits par « Voir aussi : ». La disposition « permutée » doit permettre de déceler toutes les formes possibles que peut prendre l'information contenue dans le fichier. De plus les auteurs ont introduit les sigles des collectivités parmi les renvois, ce qui est très précieux. Pour l'instant le code ne s'applique pas aux statistiques ni aux cartes, mais on envisage de l'y étendre. Ce bon instrument de travail n'est utilisé pour l'instant que pour la recherche manuelle.
Le Thesaurus Urbandoc 6 publié par l'université de la ville de New York, dont le domaine d'utilisation est à peu près le même, se présente différemment. Il a été établi pour faciliter l'automatisation de la recherche bibliographique dans les disciplines concernées par le renouveau urbain. Le projet de mécanisation exigeait l'emploi d'un vocabulaire contrôlé, liste de descripteurs seuls autorisés. Cette liste, augmentée de renvois et de notations d'usage, constitue le thesaurus, édition provisoire, en attendant une édition plus achevée. C'est le résultat de la transcription de données enregistrées sur bande, termes nécessaires pour analyser et rechercher les documents sur l'implantation, le renouveau et la construction urbaine. Il donne 1 500 termes autorisés, mais il est probable que les éditions ultérieures en comprendront plusieurs milliers.
L'ouvrage se présente en deux listes séparées, classées alphabétiquement. La première recense tous les descripteurs avec les renvois et notes d'usage destinées à guider les indexeurs. En outre elle porte les symboles requis pour perforer la bande.
La seconde liste est le thesaurus « permuté ». Il permet à l'utilisateur de chercher un terme sans connaître l'actuelle terminologie d'un descripteur multiple. Dans la première liste il faut obligatoirement connaître la forme du descripteur pour le trouver, ou tout au moins connaître le premier mot de l'expression. La deuxième liste, où le mot typique est mis en évidence, sert à retrouver toutes les expressions composées à partir de ce mot, qu'il soit ou non précédé d'un autre. De plus une 3e liste existe seulement dans l'ordinateur : en face de chaque descripteur sont indiqués le nombre d'utilisations, la date de la dernière et le nombre de documents pour lequel il a servi. Il est possible que cette liste soit un jour imprimée. Ce thesaurus est nettement donné comme provisoire, d'ailleurs quel thesaurus peut jamais être définitif? Il est très utile pour indexer les documents d'une discipline qui prend de plus en plus d'importance dans la vie actuelle.
Le thesaurus du vocabulaire de l'éducation de MM. Barhydt, Schmidt et Chang 7 a été réalisé à Case Western reserve university de Cleveland. Les descripteurs proviennent d'une indexation à la main, mais ils peuvent servir à la recherche mécanisée.
Il est divisé en trois sections. Une liste alphabétique de descripteurs, une liste avec « facettes » et enfin le thesaurus « permuté » proprement dit qui permet la recherche des descripteurs. Le travail fut commencé en 196I avec les termes servant à indexer les documents, puis on essaya de déterminer les relations avec des expressions plus larges, ou plus étroites, d'éliminer les synonymes et les mots à sens ambigu; peu à peu le travail prit forme, les renvois furent particulièrement étudiés à l'usage de la liste provisoire. Celle que nous avons donne la liste alphabétique des descripteurs avec renvois. La liste avec facettes est la mise en place du mot dans son contexte sémantique en étudiant son emploi selon 17 points de vue répertoriés : personnes, activités, temps, relations, effets, sensations, etc... Chaque facette est divisée en sous-facettes. Enfin la liste des descripteurs « permutés » permet de retrouver les expressions composées groupées par ordre alphabétique du terme principal. Cela représente au total 2 100 descripteurs groupés par facettes et sous-facettes. C'est un instrument complet, d'une méthode très évoluée, outil essentiel pour les éducateurs, les psychologues, les sociologues autant que pour les bibliothécaires et documentalistes.
Le thesaurus de La Documentation économique dans l'administration des affaires de M. Van Dijk, ses collaborateurs et de G. Szanto 8 a été établi selon d'autres méthodes plus récentes. Son principe est de synthétiser de façon sûre les liaisons entre les différents mots au moyen de diagrammes fléchés. Cette méthode semble avoir été employée en premier par le Centre de documentation de l'armée néerlandaise en 1964 sous forme de schémas circulaires, puis par l'Euratom thesaurus et par le Tezaur pentru indexarea coordonată in domeniul documentarii şi biblioteconomiei 9 paru en 1965 et qui, à sa liste de mots-clés intéressant la documentation et la bibliothéconomie, ajoute des schémas indiquant les relations de ceux-ci entre eux.
Le thesaurus de MM. Van Dijk et Szanto comprend trois fascicules. Le premier expose la méthode et donne la liste alphabétique de tous les termes du thesaurus. Les auteurs l'ont divisé en deux niveaux : 230 termes soulignés constituent le « macro-thesaurus »; ce sont des termes relativement généraux suffisants pour des services ne nécessitant pas une analyse très différenciée. A chacun se rattachent des notions plus détaillées permettant une analyse et une indexation plus poussées. L'ensemble constitue ce que les auteurs appellent le « micro-thesaurus ». Cette liste comprend également les mots apparentés (synonymes et quasi-synonymes), précédés d'un astérisque et renvoyant au mot-clé correspondant. Un exemple concret choisi parmi les cas les plus simples illustrera ces notions. Cadre est le terme du macro-thesaurus, beaucoup de centres se contenteront de ce seul mot, mais d'autres auront besoin de précisions et employeront cadre inférieur, cadre moyen, cadre supérieur, cadres commerciaux, cadres techniques qui figurent au micro-thesaurus. Enfin le terme cadre social est rejeté et l'on renvoie à environnement social.
Le 2e fascicule est constitué par 90 tableaux représentant les divers champs sémantiques couverts par le thesaurus. Des flèches relient les termes ayant des liens entre eux. Prenons par exemple le tableau « Documentation ». Ce mot est lié à bibliothèque, index, recherche documentaire, etc... et à document lui-même relié à Articles, atlas, bibliographies, congrès, livre, résumé, thèse, etc... et à traduction, liée elle-même à Sélection documentaire. Nous avons choisi un tableau simple, mais la plupart essayent de synthétiser des notions plus interpénétrées et les liaisons de 3 ou 4 notions ne sont pas rares. Les termes associés sont en marge, enfin en regard de chaque schéma est dressée une liste alphabétique des mots-clés qui y figurent, chacun suivi de ses mots apparentés.
La 3e partie est un grand tableau des seuls termes du macro-thesaurus. Un système de codification est inscrit en marge des mots-clés afin de permettre le traitement automatisé. Sur chaque tableau est reporté un quadrillage semblable à celui des cartes d'État-major. L'abcisse porte un chiffre, l'ordonnée un autre, chaque mot-clé de la liste alphabétique porte un code formé du numéro du tableau et de ces deux chiffres.
Ce thesaurus représente la forme la plus évoluée atteinte actuellement par ces instruments. Elle sera probablement perfectionnée. Cette méthode a été utilisée par plusieurs récents thesauri de sciences exactes.
Le thesaurus de Mme A. Quincieux, du Centre de recherches et d'applications linguistiques de Nancy, nous parvient en dernière minute. Il est disposé en un vaste tableau dépliant 10, peu solide à l'usage, comprenant 4 colonnes presque constamment hiérarchisées sur le plan horizontal de gauche à droite. Cette structuration repose en grande partie sur une théorie linguistique et pour l'utiliser efficacement il faut avoir dans l'esprit 7 notions de base et voir dans quelle catégorie peut se placer le document à analyser ou à rechercher : Grammaire, lexique, stylistique, procédés d'expression, méthode, recherches interdisciplinaires et étude générale, car l'auteur n'a pas répété le même mot-clé dans des subdivisions différentes. Elle explique que, par exemple, le mot « technique » peut être inclus dans « Stylistique » (sous l'aspect langue technique relevant du niveau disphasique) ou considéré comme une « Recherche interdisciplinaire » (mécanolinguistique). Or le mot ne figure qu'une fois. L'usage seul dira si le procédé répond aux voeux des analystes et des chercheurs. La plupart des thesauri comprennent une liste alphabétique des mots-clés, or celui-ci en est dépourvu. Précisons que les descripteurs ont été établis pour répondre au sens du document analysé et non spécialement à son titre et qu'il s'agit de technique linguistique et qu'aucun nom de langue n'y figure. Établi à l'usage du C.R.A.L. de Nancy, ce thesaurus ne sera pas toujours utilisable dans d'autres bibliothèques. Il a coûté un an de travail à son unique auteur et il comprend 458 descripteurs. C'est le premier que nous recevons dans une discipline en plein développement dont les recherches occupent une place de plus en plus importante dans le domaine des sciences humaines. Il sera certainement suivi d'autres plus développés, mais Mme Quincieux gardera le mérite du difficile travail de défrichement.
II. - Thesauri scientifiques et techniques
Le thesaurus des termes utilisés dans la documentation sur la détérioration biologique 11 concerne la détérioration des matériaux d'importance économique causée par des organismes vivants : cette branche de la science couvre un champ représenté par la microbiologie, l'entomologie, l'enzymologie et la science des matériaux à l'exclusion des produits strictement alimentaires si leur détérioration ne présente qu'un aspect médical. Ce thesaurus est une liste alphabétique de descripteurs et de leurs synonymes ou quasi-synonymes. Il ne couvre pas tout le champ de la détérioration biologique, puisque la liste des descripteurs est établie au fur et à mesure des entrées des documents au Centre d'information sur la biodétérioration de l'Université d'Aston à Birmingham et ne comprend donc pas les sujets qui ne figurent pas encore dans les collections du Centre. C'est pourquoi des révisions annuelles du thesaurus sont prévues. Le choix des descripteurs pour l'indexation est facilité par des indications fournies sur leur limitation d'emploi, des renvois génériques et spécifiques (sauf pour la taxonomie afin d'économiser de la place) et des renvois d'environnement. Le niveau d'indexation taxonomique est varié; les matériaux dérivés d'organismes vivants sont représentés par leur nom courant et un renvoi est établi de la forme savante à la forme usuelle : par exemple PISUM SATIVUM See PEA; de même pour les substances inhibitrices. Pour ces dernières, si une dénomination courante n'existe pas, le nom chimique ou la forme commerciale sont utilisés. Pour les enzymes, la classification de l'Enzyme Commission a été adoptée et les noms courants utilisés.
Le thesaurus des termes métallurgiques préparé par le Service de documentation de l'American Society for Metals 12 couvre le champ de la métallurgie et ses domaines marginaux scientifiques et techniques. Commencée en 1964, sa confection demanda six semaines de travail de la part de 52 experts se répartissant II branches de la métallurgie. La première édition du Thesaurus of engeneering terms publié par l'Engineers Joint Council parut alors que l'ébauche du thesaurus métallurgique comprenant 30 000 termes venait d'être établie.
Du thesaurus de l'E.J.C. 5 000 termes métallurgiques furent extraits par ordinateur. Une confrontation des deux vocabulaires fournit une somme de 8 ooo termes métallurgiques dont la publication fut différée car le thesaurus obtenu devait être mis à l'épreuve. Utilisé pendant deux ans pour une indexation fine, il continue à servir à la publication de l'index de l'A.S.M. monthly abstracting journal et à la recherche automatique de l'information, dont il est d'ailleurs un outil essentiel. Il se présente dans l'ordre alphabétique des mots utilisés et rejetés et ne fournit pas la définition des mots mais précise les relations existant entre les différents termes comprenant 9 ooo descripteurs et 70 000 termes apparentés. Chaque descripteur est suivi de l'indication du champ qu'il recouvre, de renvois hiérarchisés génériques et spécifiques, de renvois d'environnement et de synonymies ou quasi-synonymies. Des indications entre parenthèses permettent de différencier les homonymes soit grâce à un seul mot : ABSORPTION (ENERGY) et ABSORPTION (MATERIAL), soit en employant une courte définition : CRYSTAL STRUCTURE (SPATIAL ARRANGEMENT OF ATOMS OR MOLECULES).
Le thesaurus de l'Office of Water Resources Research 13 fut réalisé avec l'aide du Science Information Exchange de la Smithsonian Institution. L'O.W.R.R. souhaitait, en effet, établir une liste mondiale de descripteurs pouvant être utilisée, non seulement par l'Office, mais aussi par des centres étrangers ayant des spécialités analogues. Le domaine couvert par les recherches en ressources hydriques est très étendu : nature de l'eau; cycle de l'eau; accroissement de l'approvisionnement en eau et problèmes de conservation; distribution de l'eau; pollution; traitement des eaux usées; planification et évaluation des besoins en eau; aspects législatifs, économiques et écologiques; travaux hydrauliques et travaux publics; formation professionnelle et recherche; faune; flore. La première partie de ce thesaurus le rattache au type E.J.C. : ordre alphabétique de 4039 descripteurs et de 114I synonymes ou quasi-synonymes; pour chaque descripteur les relations hiérarchiques ou non sont précisées. Les descripteurs retenus furent ceux qui servirent au Science Information Exchange pour la préparation du volume I, parties 1 et 2, du Catalog of water ressources research qui fut diffusé par l'O.W.R.R., auxquels on adjoignit des mots-clés fournis par des scientifiques, des ingénieurs et des spécialistes. Un premier tirage fut soumis à la critique de 100 scientifiques et administrateurs s'occupant de la recherche et du développement des ressources en eau et son amélioration permit d'aboutir à la version finale.
Un descripteur est formé d'un mot ou d'un groupe de mots ne totalisant pas plus de 35 caractères, blancs compris. Les ambiguïtés de sens sont levées grâce à des précisions entre parenthèses : FAULTS (ELECTRICAL) et FAULTS (GEOLOGY). Pour chaque descripteur, le thesaurus fournit à l'utilisateur les limites du champ sémantique, les hiérarchies génériques et spécifiques, l'environnement. Pour économiser le nombre de renvois d'environnement, chaque descripteur qui n'est pas le plus spécifique de sa classe, est précédé d'un tiret. La deuxième partie du thesaurus est une liste des descripteurs répartis alphabétiquement à l'intérieur de 29 groupes. La troisième partie est une simple liste alphabétique des descripteurs.
Le thesaurus de l'A.S.T.I.A. (Armed services technical information agency) 14 couvre un champ assez vaste : aéronautique, astronautique, recherches spatiales; sciences biologiques et médicales; guerre chimique, biologique et radiologique; chimie; communications; détection et mesures de protection; sciences de la terre et astronomie; électrotechnique et électronique; pétrole et combustibles liquides; missiles guidés; matériaux et métallurgie; mathématiques et exploitation intégrée des données; mécanique; art militaire; navigation et aide à la navigation; sciences et techniques nucléaires; matériel militaire; photographie; physique; propulsion; intendance; recherche et matériel de recherche; navires et équipement; sciences sociales; moyens de transports.
Ce thesaurus comprend trois parties :
- une liste des descripteurs répartis alphabétiquement entre 170 groupes de descripteurs;
- une liste alphabétique des descripteurs et des synonymes ou quasi-synonymes, avec pour chaque descripteur l'indication de son groupe d'appartenance, la définition du domaine qu'il couvre, les relations hiérarchiques génériques et spécifiques, les renvois à des descripteurs voisins; les descripteurs sont en majuscules et se distinguent ainsi des synonymes qui sont en minuscules;
- 78 tableaux des descripteurs utilisés et classés systématiquement.
Le thesaurus de la Federal Aviation Agency 15 est du type ASTIA mais ne comporte pas de tableaux systématiques des descripteurs. Le domaine couvert est celui de l'aviation civile. Ce thesaurus contient 3093 descripteurs dont 120 proviennent de l'indexation de rapports pour le Federal Aviation Information Retrieval System (FAIRS) concernant le contrôle du trafic aérien, les autres descripteurs ayant servi à l'indexation fine d'environ 16 450 rapports techniques. Le thesaurus destiné à permettre le développement d'un système semi-automatisé de recherche de l'information fait l'objet de mises à jour.
Le thesaurus du Defense Documentation Center 16 est lui aussi du type ASTIA. Le domaine qu'il recouvre est assez large : aéronautique; agriculture; astronomie et astrophysique; sciences de l'atmosphère; sciences sociales et du comportement; sciences biologiques et médicales; chimie; sciences de la terre et océanographie; électronique et électricité; conversion d'énergie (non propulsive); matières; sciences mathématiques; génie (mécanique, industriel, civil, marine); méthodes et équipement; sciences militaires; technologie des missiles; navigation, communications, détection et contremesures; science et technologie nucléaire; armement; physique; propulsion et combustibles; technologie spatiale.
Le D.D.C. coopère au développement d'un thesaurus technique DoD (projet LEX) et une partie de cette contribution est ce vocabulaire qui n'est pas largement diffusé puisqu'il est destiné à être remplacé par le DoD thesaurus.
Le thesaurus de l'armement 17 regroupe environ 8 ooo descripteurs à l'intérieur de 22 disciplines (qui sont les mêmes que celle du D.D.C. Thesaurus) elles-mêmes subdivisées en groupes. La présentation est alphabétique. Chaque descripteur, accompagné d'une définition chaque fois que cela a été jugé nécessaire, est suivi de l'indication du groupe auquel il appartient et d'un descripteur correspondant en langue anglaise. Sont indiquées aussi les relations de voisinage et les relations hiérarchiques génériques et spécifiques. Les synonymes et quasi-synonymes qui se distinguent des descripteurs par le fait qu'ils sont en minuscules sont compris dans la liste alphabétique.
Exemple :
Circuits guidage inertie.
Emp. GUIDAGE INERTIE
INSTRUMENTS MESURE ET CONTROLE
CIRCUITS MISE FEU
- Sous-ensembles.
(Circuits électriques utilisés pour la mise à feu d'armes, fusées, missiles, etc...).
Rat. CIRCUITS
Voir ORGANES SYSTÈMES COMMANDE TIR
« FIRING CIRCUITS »
L'utilisation du thesaurus par les analystes indexeurs est facilitée par les 3 fascicules qui l'accompagnent :
I. Perlex 18. Dans ce fascicule, chaque descripteur apparaît dans l'ordre alphabétique autant de fois qu'il comporte de mots. Par exemple, SYSTÈMES COMMUNICATIONS RADIO apparaît trois fois et peut être retrouvé à partir du mot SYSTÈMES, du mot COMMUNICATIONS et du mot RADIO. Cette liste permet donc de retrouver facilement les descripteurs composés de plusieurs mots dont le premier n'est pas forcément le plus significatif. Elle indique aussi à quel groupe appartient un descripteur.
2. Lexique « groupes de descripteurs » ou Lexique « machine 19 ». Il permet de localiser plus facilement tous les descripteurs concernant l'objet principal d'un document que la simple consultation du thesaurus.
3. Lexique « ordre alphabétique anglais ». Il permet l'indexation directe des documents en anglais.
Le thesaurus de la National Aeronautics and Space Administration 20 relatif aux recherches spatiales, à l'aéronautique et à l'astronautique comprend 3 volumes. Les deux premiers contiennent la liste alphabétique des descripteurs et de leurs synonymes et quasi-synonymes. Cette liste est constituée en grande partie des termes d'indexation utilisés par la N.A.S.A. pendant la période 1962-1966 et par des termes tirés d'autres thesauri, en particulier du thesaurus en constitution selon le projet LEX du Department of Defense. La méthode suivie est très proche de celle qui est préconisée dans le « Manual for building a technical thesaurus » du projet LEX afin d'atteindre un degré de compatibilité élevé avec le DoD Thesaurus, permettant ainsi une liaison étroite entre les deux thesauri mais aussi entre les vocabulaires utilisant des méthodes similaires.
Il est peut-être intéressant d'analyser un peu la méthodologie de ce thesaurus. Le choix des descripteurs a été opéré en fonction de leur signification, de leur emploi dans la littérature relative aux recherches aérospatiales et de leur efficacité lors de la recherche. La fréquence d'utilisation a été observée et les liaisons entre les différents termes du vocabulaire ont été précisées ainsi que les définitions tirées de l'usage scientifique et technique des descripteurs. Le substantif a toujours été préféré à l'adjectif ou au verbe. Le pluriel a été utilisé de préférence au singulier à quelques exceptions près : procédés spécifiques, propriétés, conditions et précisions matérielles. L'usage de la ponctuation a été évité au maximum. Les descripteurs ont une longueur maximum de 42 caractères, blancs compris. Les ambiguïtés de sens sont levées de deux façons : soit par identification entre parenthèses, SIZING (SHAPING) et SIZING (SURFACE TREATMENT), soit par une définition du domaine d'utilisation, fournie elle aussi entre parenthèses, SPECTROSCOPE ANALYSIC (USE OF SPECTROSCOPIC TOOLS IN CHEMICAL ANALYSIS). La forme inversée est rejetée au profit de la forme normale : ANALYTICAL CHEMISTRY et non CHEMISTRY, ANALYTICAL. Les abréviations, très nombreuses dans les disciplines aérospatiales, servent de descripteurs mais des renvois sont établis de la forme complète à la forme abrégée. Les synonymes ou quasi-synonymes font l'objet de renvois à la forme adoptée. Les descripteurs de signification trop large sont suivis d'une recommandation d'emploi de termes plus spécifiques et de la liste de ceux-ci. Les descripteurs qui sont précédés du signe # figurent comme vedettes dans la liste hiérarchique dont nous parlerons plus loin. Les sujets qui nécessitent une désignation numérique ou alphabétique font l'objet de descripteurs précis, F-III AIRCRAFT par exemple. La classification systématique de la N.A.S.A. comprenant 34 classes et 217 sous-classes numérotées, chaque descripteur de la liste alphabétique est suivi des numéros des sous-classes auxquelles il appartient. Les renvois sont, soit des renvois hiérarchiques génériques et spécifiques, soit des renvois de voisinage. Le champ sémantique des descripteurs est précisé. Le classement alphabétique adopté est celui des mots. Ce thesaurus sera révisé périodiquement, peut-être annuellement.
Son troisième volume comprend 4 parties :
I° une liste hiérarchique classée dans l'ordre alphabétique des descripteurs les plus généraux, chacun d'eux étant suivi de la liste « en cascade » des termes plus spécifiques.
Exemple :
IONS
CATIONS
METAL IONS
MANGANESE IONS
VANADYL IONS
2° la liste codée numériquement des classes et des sous-classes de la classification de la N.A.S.A., avec pour chaque sous-classe, la liste alphabétique des descripteurs la concernant; un descripteur peut apparaître dans plusieurs sous-classes.
3° un index permuté des descripteurs dans lequel les descripteurs composés apparaissent autant de fois qu'ils comprennent de mots significatifs.
4° une liste alphabétique des descripteurs.
Le thesaurus de l'American Petroleum Institute 21 est une liste alphabétique de descripteurs et de synonymes ou quasi-synonymes avec définition du champ sémantique, renvois hiérarchiques génériques et spécifiques, renvois de voisinage. Mais l'originalité de ce thesaurus repose sur le fait que ses descripteurs peuvent être reliés par des links de façon à pouvoir analyser un sujet sous plusieurs facettes : attributs communs, matériaux, structure. De plus l'indexeur peut utiliser des indicateurs de rôles afin de préciser les produits de départ d'une réaction chimique, les produits de la réaction, les produits qui figurent dans les deux parties d'une réaction chimique, les traitements antérieurs, les substances analysées. A la fin du thesaurus est fournie une classification hiérarchique des descripteurs.
L'Exploration and Production Thesaurus de l'université de Tulsa 22 concerne la géologie, la géochimie, la géophysique, le forage, la pétrochimie, l'exploration et l'exploitation de pétrole, la production de gaz et d'huiles essentielles, les méthodes de transport et de conservation du pétrole. La première édition était du type E.J.C. La deuxième édition a une présentation analogue mais sa conception est différente car les relations hiérarchiques ont été développées et le système des facettes a été adopté 23; 10 facettes principales :
- attribut commun;
- concepts du terrain;
- facteur économique;
- équipement;
- minéralogie;
- condition de travail;
- organisme (biologie);
- phénomène;
- procédé;
- propriétés,
chaque facette comprenant un certain nombre de sous-facettes. La partie principale du thesaurus est la liste des descripteurs (26 caractères maximum, blancs compris) et des synonymes et quasi-synonymes, avec, pour chaque descripteur, la limitation du champ sémantique, les renvois hiérarchiques génériques et spécifiques, les renvois de voisinage. Une mise à jour paraît tous les 4 mois comme supplément à Dual Dictionnary Coordinate Index. La liste alphabétique est complétée par la liste hiérarchique des facettes et des sous-facettes destinées à préciser un descripteur, et par leur index alphabétique. Du fait que les descripteurs ont une longueur maximale, un système d'abréviations a dû être adopté pour les noms propres, les noms géographiques, les titres de publication et les concepts trop longs.
Les règles de choix et de formulation des nouveaux descripteurs dont la liste constitue les mises à jour périodiques, dénotent une recherche évidente de compatibilité avec le thesaurus de l'American Petroleum Institute. Avant de créer un nouveau descripteur, il faut d'abord rechercher si le thesaurus de l'A.P.I. ne possède pas déjà un descripteur représentant le sujet à indexer. Si ce n'est pas le cas il faut alors suivre une méthode de rédaction commune. Le singulier est utilisé de préférence au pluriel; l'inversion est évitée chaque fois que cela est possible; les synonymes qui n'ont pas encore été repérés doivent faire l'objet de renvois; le substantif est employé de préférence à l'adjectif; les descripteurs choisis sont des mots simples, les combinaisons entre descripteurs simples au moyen du signe + permettant la rédaction de descripteurs complexes (ainsi PIPELINE VIBRATION est ainsi indexée : PIPELINE + VIBRATION); mais les combinaisons de mots habituellement utilisées pour les procédés, les méthodes, etc... sont conservées (ex. : GAS CHROMATOGRAPHY, SEISMIC RECORDING).
Le thesaurus de l'Institut français de recherches fruitières Outre-mer 24 se distingue des autres par le fait qu'il n'est pas une liste de descripteurs mais un lexique structuré en 6 ooo groupes à 3 niveaux sans hiérarchie logique entre les niveaux (voir : ARIES, Philippe. - Préparation d'index par ordinateur à l'Institut français de recherches fruitières Outre-mer, I.F.A.C. In : B. Bibl. France, 12e année, n° 8, août 1967, pp. 207-312).
La liste alphabétique de mots-clés et présentation sous forme de schémas fléchés du B.R.G.M. 25 constitue un fascicule réservé et fourni à titre gracieux aux abonnés des cahiers de Bibliographie des sciences de la terre. Des schémas sont organisés d'après un plan qui suit la disposition en rubriques des cahiers bibliographiques. Néanmoins les huit premiers schémas couvrent le champ commun, c'est-à-dire l'ensemble des notions qui n'occupent pas une place privilégiée dans un des domaines de la géologie. A chaque mot-clé correspond une case définie par le numéro du schéma et ses coordonnées. Si un mot-clé intéresse plusieurs domaines, le mot est placé dans le schéma le plus approprié et répété en marge des autres schémas. On peut distinguer 2 catégories de mots-clés : les mots précis couvrant un champ très spécifique et dont l'attribution ne pose pas de problèmes ; ils sont écrits en majuscules. En revanche les mots-clés en minuscules sont à utiliser avec modération et après réflexion soit parce qu'ils sont trop généraux, soit parce que leur interprétation peut prêter à confusion. Cette catégorie de mots-clés fait l'objet de notes concernant leur utilisation.
Les mots-clés appartenant aux domaines systématiques (paléontologie, stratigraphie, minéralogie) ne sont pas présentés suivant le système fléché mais suivant le système classique respectant la structure hiérarchisée des classifications. Ces mots-clés représentent presque le tiers du thesaurus.
L'ensemble des schémas fléchés est complété par une liste alphabétique des descripteurs et de quelques mots très généraux qui n'ont pas de position fixe sur les schémas.
Avant tout choix de mot-clé, l'indexeur doit placer le document à analyser dans un ou plusieurs thèmes utilisés dans Bibliographie des sciences de la terre. Ensuite il opère son indexation sans se préoccuper des thèmes retenus. S'il y a théoriquement indépendance entre thème et mots-clés, il s'avère que pratiquement l'indexeur utilise plus de mots-clés appartenant aux thèmes choisis que de mots-clés venant de champs étrangers. Il est donc inutile de répéter un mot-clé générique rappelant le thème affecté au document, l'indexation doit être particulièrement fine dans le champ sémantique du thème. Par contre il est possible d'employer un mot-clé plus générique pour signaler un aspect secondaire du document.
Si un mot-clé est insuffisamment informatif, il est bon de compléter par un mot informatif libre entre parenthèses. C'est le cas pour les mots-clés géographiques si les régions des pays vastes ne sont pas suffisamment découpées dans le lexique actuel, ou si l'on doit faire figurer le nom des gisements importants derrière le mot géographique désignant la région du gisement. Pour les mots-clés matières les identifications entre parenthèses sont obligatoires pour le nom des minéraux codés et le nom des espèces de silicates; de même en paléontologie il faut préciser l'espèce ou la famille du fossile.
Le thesaurus de l'Euratom 26 concerne non seulement la physique nucléaire et la technologie des réacteurs mais aussi les sujets connexes tels que la protection contre les radiations, la technologie des isotopes, la fabrication et l'emploi des matériaux et des instruments nucléaires, la radiochimie et la radiobiologie.
La première édition publiée en janvier 1964 était fondée sur les vocabulaires existants et sur l'indexation de 40 000 documents environ. Elle comprenait une liste alphabétique de 4 470 mots-clés, une liste de 2 213 termes apparentés, et 42 schémas fléchés exprimant de façon claire les relations hiérarchiques et sémantiques existant entre les mots-clés.
La deuxième édition fondée sur l'indexation de 400 ooo documents par 70 spécialistes appartenant à des pays et des organismes divers bénéficie de l'expérience acquise par le Centre de documentation et d'information de l'Euratom dans les travaux de recherche automatique de l'information. Cette deuxième édition comprend 2 parties : la première est une liste alphabétique de 4 665 mots-clés et 14 518 termes additionnels et interdits. Les descripteurs qui représentent des concepts simples peuvent être des unitermes ou des mots composés. Les termes additionnels sont répartis en catégories (emploi obligatoire ou éventuel, conjointement avec tous les mots-clés auxquels ils sont renvoyés ou conjointement avec les mots-clés appropriés). La deuxième partie du thesaurus est un ensemble de schémas fléchés qui permettent au documentaliste d'avoir une vue d'ensemble des liaisons hiérarchiques et sémantiques entre mots-clés appartenant à un même groupe.
Le thesaurus de la « Documentation internationale de recherche routière 27 » est le fruit de la coopération active des membres de la D.I.R.R. et principalement de son Comité de Coordination, assisté par M. Van Dijk, ingénieur-conseil en méthodes de direction à Bruxelles, consultant de l'O.C.D.E., et par M. D. Moskowitz (France), ingénieur expert en langues. Ce thesaurus couvre tout le domaine routier proprement dit c'est-à-dire la construction et l'entretien des routes, ponts et tunnels ainsi que le domaine scientifique connexe.
Il est trilingue français-anglais-allemand et comprend une codification simple permettant le passage automatique d'une langue à l'autre. En effet il est établi dans le but de permettre la coopération internationale en matière de documentation entre pays membres de l'O.C.D.E.; le dépouillement des informations et leur indexation sont répartis entre les membres de la D.I.R.R., chaque pays prenant en charge la production nationale, plus une partie de la production des pays non-membres. Le système est économiquement valable, chaque information n'étant dépouillée et signalée qu'une fois et les fiches n'étant rédigées en principe que dans une seule des 3 langues officielles : français-anglais-allemand. La distribution des fiches se fait chaque semaine par l'intermédiaire de 3 centres coordonnateurs, un par groupe linguistique.
L'indexation se fait par mots-clés dont les relations sont illustrées par des schémas fléchés. Pour chaque langue, il existe une liste alphabétique générale des mots-clés et des mots apparentés renvoyant aux coordonnées des schémas fléchés et aux mots-clés dans les deux autres langues; mais les mots apparentés sont définis dans chaque langue, indépendamment de ceux existant dans les autres langues, de sorte qu'il n'y a pas de correspondance, d'une langue à l'autre, entre les mots apparentés. Pour chaque langue il existe une édition des schémas fléchés, avec pour chacun d'eux la liste des mots-clés correspondants et leurs coordonnées dans le schéma. Enfin, un répertoire par code fournit, lui aussi, une correspondance entre les mots-clés des 3 langues.
La D.I.R.R. estime que 8 à 10 mots-clés sont nécessaires et suffisants pour caractériser un document. Au cours de l'indexation il peut être indispensable d'utiliser un terme additionnel pour exprimer une idée nouvelle. La liste de ces termes additionnels doit être examinée à intervalles réguliers par le Comité de coordination pour décider de leur inclusion en 3 langues dans le thesaurus.
L'Entreprise de recherches et d'activités pétrolières a publié un manuel d'indexation documentaire concernant le fichier de littérature pétrolière dont les 3 derniers volumes constituent le thesaurus 28.
I. Le dictionnaire alphabétique des mots-clés techniques qui sera enrichi au fur et à mesure des besoins et en fonction des analyses. Chaque mot-clé est suivi d'une lettre indiquant le thème et d'un chiffre renvoyant au diagramme fléché correspondant. Éventuellement sont fournies des explications concernant son utilisation : employez, employé pour, voir aussi. Certains mots-clés nécessitent des explications plus détaillées qui ne sont pas entrées en machine, le nombre de caractères affecté à chaque mot étant 24, et sont signalées par un renvoi à la liste des additifs placées en fin de volume.
2. Le dictionnaire alphabétique des mots-clés de géographie, le dictionnaire des sociétés et le dictionnaire stratigraphique. Le monde a été découpé en II zones pour éviter certains inconvénients dus au découpage en 5 continents : Antarctique, Europe sauf U.R.S.S., U.R.S.S., Afrique, Asie, Moyen-Orient, Amérique-nord, Amérique-centrale, Amérique-sud, Océanie, Mers et Océans. Des symboles permettent de différencier les termes hiérarchisés des termes non hiérarchisés. Pour l'indexation, ou le mot-clé existe dans la liste hiérarchisée et il suffit de l'employer, ou il n'existe pas dans la liste hiérarchisée et il faut l'employer en l'accompagnant du terme hiérarchisé le plus bas. Certains cas particuliers qui n'ont pas pu être hiérarchisés devront faire l'objet d'une indexation spéciale : les divisions purement géographiques (bassins, chaînes de montagne etc...) n'ont été rattachés hiérarchiquement qu'à la division administrative, le pays ou le continent qui les englobe totalement; si le domaine géographique couvert par le document est plus restreint, il y a lieu de le préciser. Certains termes appartenant à deux États différents ou correspondant à la fois à une subdivision géographique et à une subdivision administrative dont les limites ne coïncident pas, ont été artificiellement différenciés. Le terme Gulf Coast est remplacé par Golfe-du-Mexique pour l'offshore et le nom des états pour l'onshore. Enfin l'impossibilité d'utiliser l'apostrophe pour traitement CDC 3600 a conduit à opérer des contractions dans la dénomination des noms géographiques.
Le dictionnaire des sociétés regroupe les sigles des sociétés déjà entrés en machine. Le sigle des sociétés est entré en mot-clé lorsque le document apporte des renseignements valables sur les activités mêmes de ces sociétés.
Dans le dictionnaire stratigraphique il y a, comme dans le dictionnaire géographique, des termes hiérarchisés et des termes non hiérarchisés. Si le mot-clé choisi existe dans la liste hiérarchisée, il suffit de l'employer tel quel. Sinon il faut l'accompagner du terme hiérarchisé le plus bas. Un certain nombre de cas particuliers n'ont pu être hiérarchisés et devront faire l'objet d'une indexation spéciale : les zones de passage dont la limite stratigraphique n'est pas bien définie et qui chevauchent deux étages différents, les faciès et les ères. Certains étages que l'on associe généralement devront être indexés séparément.
3. Les diagrammes fléchés au nombre de 62.
L'indexation peut être améliorée par l'utilisation de 3 catégories de symboles : les pondérateurs, les links, les symboles discriminatoires. Les pondérateurs 1, 2, 3 permettent d'attribuer à chaque mot-clé un poids représentant sa pertinence par rapport au document analysé. Les links permettent de mettre en évidence l'existence d'une relation simple entre deux termes dont l'un ne possède aucun sens précis utilisé seul. Les symboles discriminatoires permettent de différencier les mots clés « littérature », les termes géographiques, les termes stratigraphiques et les noms de sociétés.
Le thesaurus VNL 29 concernant la végétation, la protection de la nature et l'administration des sites comprend 2 parties : un volume de classification hiérarchisée des descripteurs et de leurs synonymes ou quasi-synonymes, et une liste alphabétique renvoyant aux tableaux du Ier volume. Ces tableaux ont été établis en utilisant comme ouvrages de référence :
WURMBACH (H.). - Lehrbuch der Zoologie. Bd II. - Stuttgart, G. Fischer, 1962. - 838 p.
ENGLER (A.). - Syllabus der Pflanzenfamilien, 12. Aufl. - Berlin-Nikolassee, Gebr. Borntraeger, 1954-1964. - 2 vol.
OBERDORFER (E.) et collab. - Systematische Übersicht der westdeuschen Plaanerogamen-und Gefässkryptogamen-Gesellschaften : Ein Diskussionsentwurf in : Schr.-R. Vegetationskunde, Heft 2, Bad Godesberg, 1967.
A la dernière minute, nous recevons 2 thesauri : le premier émane des Mines de potasse d'Alsace 30. C'est un document d'imprimante, liste de mots-clés mise à jour au Ier février 1969. Le domaine traité est essentiellement celui de l'exploitation minière. L'enregistrement se fait en clair à l'aide de ces mots-clés, chaque mot-clé nouveau venant s'ajouter automatiquement à la liste dont il est fait un relevé périodique. Chaque mot-clé a une longueur maximale fixée à 12 lettres.
Le deuxième thesaurus est celui du Centre d'études du groupe Vallourec 31. Le domaine concerné est celui des études, recherche et développement mécaniques, électriques, scientifiques, technologiques. Il s'agit d'une liste alphabétique de descripteurs et de leurs synonymes ou quasi-synonymes, les descripteurs étant en majuscules et les autres termes en minuscules. Certains descripteurs sont suivis de la définition de leur champ sémantique, et de renvois essentiellement de voisinage.
A la fin de cette longue recension nous pouvons dire que les bibliothécaires ont maintenant en mains des instruments d'indexation d'une technique éprouvée. Les méthodes de confection sont diverses mais bien au point, qu'il s'agisse de thesauri relativement simples issus d'un catalogue alphabétique de matières pourvu de renvois, et hiérarchisé ou d'instruments plus structurés du type I.F.A.C., E.J.C. ou A.S.T.I.A., ou symbolisant les relations des mots entre eux par des schémas fléchés tels ceux de l'Euratom ou de MM. Van Dijk et Szanto. Le bibliothécaire qui entreprendra la rédaction du thesaurus d'une spécialité pourra donc choisir sa méthode.
Tous ont un caractère commun, ils ne peuvent être que provisoires, pour la plupart les rééditions sont fréquentes. Il ne saurait en être autrement. Le langage d'une science ou d'une technique évolue très vite et les demandes des usagers ne sont pas sans suivre une certaine mode, il faut donc sans cesse réadapter le thesaurus pour qu'il reste efficace. Cela exige la collaboration de nombreux spécialistes, outres les bibliothécaires et documentalistes.
De toute façon ces thesauri exigent beaucoup d'efforts et un personnel nombreux. Dans la préface de la plupart des thesauri recensés il est dit qu'ils ont coûté 1, 2, 3 ans de travail à plusieurs dizaines et quelquefois 2 à 300 collaborateurs. Mais nous avons des instruments efficaces. La technique bibliothéconomique évolue, au catalogue méthodique a succédé le catalogue systématique puis le catalogue analytique, puis l'indexation par vedettes de matières pour lequel un thesaurus fixant et réglant vedettes et renvois est indispensable. C'est cette forme de catalogue qui est appelée à se développer lors de l'automatisation des bibliothèques avec toutes les perspectives d'échanges d'informations qu'elle permet.