De quelques thesauri

Yvonne Guéniot

Marie-Thérèse Laureilhe

On trouvera ici un complément à l'article paru dans le Bulletin des bibliothèques de France, I4e année, n° 5, mai 1969, pp. 181 à 202, décrivant 25 thesauri ou listes de vedettes par matières en usage à ce jour.

I. - Thesauri de sciences humaines ou économiques

Les ouvrages que nous présentons sous cette rubrique ne sont pas tous des thesauri, mais il est parfois difficile de distinguer ces derniers des listes de vedettes par matières. Celles-ci de plus en plus structurées lors de leur rédaction constituent souvent un premier travail que l'on réutilise éventuellement lors de l'établissement d'un thesaurus destiné à la recherche automatique.

La liste de vedettes par matières de l'Association canadienne des bibliothèques 2 n'est pas un thesaurus, elle a été établie à l'intention des catalogueurs traitant les documents canadiens et doit être utilisée en liaison avec celle de la Bibliothèque du Congrès. Les auteurs ont choisi des vedettes dans la liste de la Bibliothèque de Washington, et, en général, n'ont apporté aucun changement; ils ont cependant ajouté des rubriques sur des sujets canadiens spécialisés et modifié quelques vedettes pour les adapter aux problèmes particuliers de leur pays.

Matériellement la liste est structurée comme celle de la Bibliothèque du Congrès, avec les mêmes symboles désignant les renvois simples, ceux d'orientation et les rappels de renvois. Comme beaucoup de bibliothèques ont adopté ce système, il est connu de tous les bibliothécaires.

La liste ne comprend pas de noms de personnes, ni de collectivités, ni de tribus, ni de langues indigènes, ni de vedettes très générales comme « peinture » ou « poésie » pour lesquelles on se contente de renvoyer à la liste de Washington, ni de noms de géographie physique. Il reste encore une liste de quelque 700 vedettes proprement canadiennes, noms de lieux et faits historiques en majorité. Les sous-vedettes sont intéressantes à considérer. Si l'on prend une grande tranche comme « Canada », on a la liste de toutes les sous-vedettes qui peuvent se trouver derrière un nom de pays, avec des « notes d'usage » dans bien des cas. C'est extrêmement utile pour les bibliothèques qui établissent leur liste de vedettes par matières. De même à la rubrique « Toronto » on trouve la liste type des sous-vedettes utilisées à la suite d'un nom de ville qu'on ne répète pas ailleurs. Enfin à « Quebec (province) », on trouve celles utilisées pour une quelconque province, etc...

Les renvois sont très nombreux, cela aussi est utile. Les auteurs nous préviennent que cette Ire édition a été établie en partant d'une édition provisoire soumise à l'attention des bibliothécaires canadiens, ce procédé a certainement permis d'ajouter de nombreux renvois qui structurent la liste et placent le mot dans son environnement naturel. C'est en cela que cette liste se rapproche des thesauri et pourra éventuellement être transformée si cela devient nécessaire.

Il n'y a pas lieu de classer au nombre des thesauri la liste des vedettes de matières à l'usage des livres pour enfants éditée par la Library of Congress 3, ni de la décrire en détail puisqu'il ne s'agit que d'une adaptation à l'usage d'une catégorie particulière de la liste bien connue des vedettes de matières de cette bibliothèque. Le système de vedettes et de renvois est donc le même, toutefois certaines vedettes ont été modifiées, un signe spécial le souligne et d'autres signes indiquent que la vedette semblable doit être utilisée selon des principes différents ou non, l'absence de signe indiquant une vedette nouvellement créée. Il n'y a rien de bien nouveau mais il fallait signaler cette intéressante tentative pour adapter un catalogue à une catégorie bien particulière d'ouvrages.

Le Plan systématique de classement confectionné et établi par le Commissariat général au tourisme 4 répond à un besoin de notre civilisation où les loisirs prennent de plus en plus d'importance. Ce commissariat est une administration complexe qui comprend des représentations à l'étranger, des délégations régionales et au bas de l'échelle la multitude des syndicats d'initiative et des organismes à vocation touristique. Parler un langage commun était une nécessité pour ne pas disperser une masse de documents déjà eux-mêmes répartis entre de nombreux centres.

Les organisateurs décidèrent de choisir un classement décimal; ils répartirent leurs éléments de documentation en 10 grandes rubriques, elles-mêmes divisées en 10, et pouvant à leur tour chacune être sous-divisée en 10, etc... La division sera plus ou moins poussée selon les besoins du centre. Le système est donc très souple et susceptible de s'adapter. Division et sous-division par 10 est un procédé commode. Il est dommage que l'on n'ait pas employé des classifications déjà existantes, C.D.U. ou Dewey, car on n'a pas avantage à multiplier les systèmes. Toutefois il nous a paru qu'il n'était pas facile d'adapter le Dewey trop sommaire, ni même la C.D.U. au plan proposé.

Le dictionnaire de mots-clés, en 2e partie, renvoie au plan de classement. Les bibliothécaires l'apprécieront particulièrement car derrière chaque mot on a regroupé les concepts apparentés; par association d'idées on peut retrouver la rubrique sous laquelle figure le renseignement demandé. Ceci sera très utile à ceux d'entre nous qui doivent établir des thesauri ou des listes structurées de vedettes de matières.

Enfin le volume se termine par un plan de classement géographique également établi selon un principe décimal; il est assez sommaire.

Le plan, établi en partant de 100 ooo documents et au prix d'un travail de dix-huit mois, a été imprimé de façon très judicieuse en utilisant des caractères de corps décroissant et de moins en moins gras pour exprimer plus de détail. C'est une initiative excellente. On ne peut employer cette méthode quand on utilise des sorties d'imprimante, mais quand c'est possible, c'est une grande aide.

Les bibliothécaires apporteront toutefois une critique matérielle : l'ouvrage n'est pas facile à consulter. Il a été établi sur des feuillets mobiles pour pouvoir changer des feuillets ou en intercaler de nouveaux, c'est une bonne initiative, mais le système de serrage le rend inconsultable; il y a des procédés plus pratiques, mais ceci n'est qu'un détail. Le plan de classement du Commissariat au tourisme, et sa liste de mots-clés, au domaine étendu touchant à la fois le droit, l'administration, les loisirs, les transports, l'archéologie, la muséographie, les manifestations artistiques, les sports, la publicité, le folklore et bien d'autres domaines, peut rendre les plus grands services dans de nombreuses bibliothèques.

Au moment où bien des valeurs sont remises en cause, croyants et incroyants s'interrogent souvent sur le fait religieux. Il en résulte une production accrue de livres dans ces domaines (La Bibliographie de la France en témoigne pour notre pays) et d'articles non seulement dans les revues théologiques de toutes les églises, mais dans tous les journaux et périodiques. Deux professeurs à la Faculté de théologie catholique de Strasbourg, MM. Metz et Schlick, ont voulu guider avec efficacité les chercheurs et ont entrepris un Répertoire bibliographique des institutions chvétiennes 5. La bibliographie de 1968 a paru en septembre 1969 6, c'est un record de célérité; elle porte le n° 2 car, rétrospectivement, les auteurs feront paraître un volume 1966-1967 de façon à englober toute la période postérieure au Concile Vatican II. Le volume 1969 est annoncé pour mai 1970. De plus les auteurs pensent à un répertoire historique.

Comment a-t-on pu publier aussi rapidement un instrument aussi complet? Pour l'expliquer, il convient de le décrire. L'ouvrage est divisé en deux parties. La première contient les « relevés bibliographiques par pays » qui recensent la production de 17 nations chrétiennes, chacune par ordre alphabétique d'auteurs. Nous trouvons toute l'Europe occidentale, l'Allemagne, la Tchécoslovaquie, la Grèce, la Roumanie, les États-Unis et les Philippines et le Répertoire, conçu sous une forme oecuménique, dépouille les publications de toutes les Églises se réclamant du Christ : catholiques, protestantes et orthodoxes. Il apparaît évident que la bibliographie catholique sera incomplète puisque Pologne, Hongrie et Amérique latine manquent, et que la bibliographie orthodoxe le sera également en l'absence de la Russie et de la Yougoslavie. Le manque de liaison avec les chrétientés de l'Est explique cette lacune pour l'Europe orientale. Celle de l'Amérique du Sud est sans doute due aussi à des circonstances politiques. Le supplément prévu dans la prochaine édition y apportera peut-être un remède.

Chaque notice est précédée d'un groupe de chiffres et de lettres. Le premier chiffre est un « indice de pondération » (2, très important; I, important; o, intéressant) qui, sans porter de jugement de valeur, permet d'éliminer ce qui est de moindre intérêt. Un chiffre indique l'existence d'une bibliographie importante ou non; la confession (sujet du livre et non celle de l'auteur) est également codée, elle est suivie d'une lettre semblable à celle des numéros minéralogiques des voitures indiquant le pays d'origine, enfin vient le numéro d'ordre de la notice. Nous insistons sur ce code, car nous allons le retrouver.

La deuxième partie de l'ouvrage est pour nous la plus importante car c'est un thesaurus, mais on ne pouvait guère le présenter sans indiquer son utilité. C'est l'index général en 5 langues qui seul permet les recherches rapides. Les tables allemandes, anglaises, italiennes et espagnoles sont une simple traduction de la liste des mots-clés avec renvoi à la liste française. Celle-ci est le véritable thesaurus, établi par ordinateur I.B.M. 360 au Centre de calcul de l'Université de Strasbourg. C'est cette intervention de l'ordinateur qui permet une confection accélérée de la bibliographie et surtout une consultation rapide et efficace.

Il n'existait guère jusqu'ici de listes de mots-clés dans le domaine religieux, si ce n'est deux listes américaines aussi anciennes que partielles. Celle-ci se compose de 1109 mots-clés, chacun suivi de la liste des numéros de notices intéressées, tels que nous les avons décrits. Le lecteur a donc rapidement la liste des livres et articles sur les sujets qui l'intéressent. Les descripteurs sont rangés par ordre alphabétique : Abbé, Absolution, Actes personnels, Action catholique, Admonition, etc... et chacun est suivi de sous-vedettes qui circonscrivent le sujet. Par exemple : Action catholique, Engagement temporel. A. C., Hiérarchie. A. C., Structures, etc... Une lettre R, ajoutée à certains mots-clés, renvoie à ceux de sens voisins, par exemple Action catholique renvoie à : Allemagne, Apostolat laïc. Apostolat. Espagne, Action catholique. Espagne, Action catholique, État. Espagne, A. C., Hiérarchie. Espagne, A. C., Statuts. Évangélisation. Vatican 2, A. C. Nous avons choisi un exemple simple, mais certaines vedettes comportent de nombreux renvois.

On discute en ce moment de nombreux problèmes religieux, cela se reflète sur la liste et certains sujets d'actualité sont suivis de nombreux numéros de notices et de nombreuses sous-vedettes. Le « Mariage » nécessite 56 descripteurs examinant tous les aspects canoniques : disparité de culte, empêchement, forme canonique, indissolubilité, mixte, etc.... Le « Prêtre » occupe 33 mots-clés et renvoie à plusieurs centaines de notices, le statut du prêtre renvoie à 43 articles, etc... La liturgie paraît moins en faveur, preuve d'une possible défaveur du « ritualisme ». En présence de nombreux renvois l'usager éliminera grâce au code les études de moindre intérêt, les langues qu'il ne connaît pas, les confessions qui ne l'intéressent pas.

Grâce à ce thesaurus, le C.E.R.D.I.C. entend profiter pleinement des possibilités de l'automatisation. Mis sur cartes perforées l'index peut servir à tout moment à extraire la documentation sur tel ou tel sujet, ce sera particulièrement, intéressant quand plusieurs années auront paru. On voit l'intérêt de cette entreprise qu'il était nécessaire de décrire un peu longuement car elle est unique en son genre. Il n'y a rien de semblable en France où tous les efforts se portent vers les sciences exactes ou juridiques, ni même à l'étranger. En examinant la bibliographie, on trouvera toujours une revue oubliée, quelques mots-clés discutables (Prêtre qui quitte), quelques distractions orthographiques de l'ordinateur. Qu'importe : Toute œuvre est perfectible. Il importait de signaler la méthode et l'existence d'un thesaurus sans précédent qui sera utile à toute bibliothèque ayant des fonds de caractère religieux en France et dans les pays des 4 langues intéressées où rien de semblable n'a été entrepris jusqu'à ce jour.

Mrs Schultz 7 vient de faire paraître une nouvelle édition de son thesaurus de la science de l'information publié en 1964 par les soins du Drexel institute of technology de Philadelphie et utilisé par cet organisme et par les universités de Chicago, de Lehig et du Minnesota. La Ire édition avait été faite d'après l'indexation de 1 ooo documents. Celle-ci est le résultat du traitement de 3 ooo et elle comprend 340 descripteurs et de nombreux renvois simples, renvois d'orientation et notes d'usage. Les renvois de tels et tels termes complètent l'environnement sémantique. Tout cela est clairement indiqué. La typographie d'imprimante est très bonne, on a choisi un système permettant l'emploi judicieux de majuscules, de minuscules.

Le domaine du thesaurus, science de l'information, est vaste. Mrs Schultz a conçu son travail très largement, ne se limitant pas à la stricte langue de la documentation, de sorte que si le langage de cette science est assez détaillé, il y a de nombreuses autres notions, mais prises dans un sens très large, par exemple : Chemistry, Economics, Education, Mathematics, etc... La terminologie de l'informatique est abondamment représentée. Mrs Schultz a exclu les noms de personnes, objet de fichiers spéciaux dans son centre de documentation, par contre elle a inclus certaines collectivités et 14 noms de lieu.

La liste alphabétique des descripteurs et renvois occupe les pages 1 à 23I, les dernières sont occupées par la liste structurée des 340 descripteurs regroupés systématiquement derrière 16 grandes divisions : documents, éducation, domaine géographique, linguistique, musique, philosophie (ces deux-ci d'un terme chacun!) C'est cette partie qui montre le mieux les domaines couverts.

Mrs Schultz a composé un thesaurus très classique, de format commode, très maniable et très pratique. Utilisé déjà par plusieurs universités américaines, il servira sans doute à l'avenir à de nombreux centres de documentation.

Le thesaurus E.R.I.C. 8 recueille les descripteurs employés à l'indexation du bulletin bibliographique mensuel Research in education, importante revue groupant près de 1 000 notices bibliographiques sur ce vaste sujet, avec résumés substantiels. Ces notices sont indexées au moyen de 4 à 10 descripteurs chacune. Ceux-ci sont publiés dans le thesaurus qui, comme toutes les publications similaires, sera l'objet de fréquentes rééditions. Il sert à la fois aux indexeurs pour éviter, dans la mesure du possible, la création de descripteurs inutiles générateurs de « bruit » et aux usagers pour savoir sous quelle rubrique chercher. En effet les notices bibliographiques sont classées par numéros d'entrée, le lecteur, pour les retrouver, doit se servir de l'index des descripteurs de la revue qui lui indique que le sujet recherché a été traité par tels ou tels articles dont les notices figurent sous tels ou tels numéros. Le thesaurus de l'ensemble des descripteurs lui est donc très utile.

Il comprend les descripteurs, les synonymes et les quasi-synonymes. Les premiers sont en grandes capitales, ils sont obligatoires pour l'indexation, ceux qui posent des problèmes sont suivis d'une courte note d'usage. Les synonymes et quasi-synonymes sont éliminés par des renvois, enfin les termes en relation hiérarchique avec le descripteur, plus étroits, ou plus larges, sont indiqués ainsi que ceux de sens voisin. L'usager a donc l'environnement sous les yeux. Ces descripteurs sont classés par ordre alphabétique. Comme la plupart d'entre eux sont des expressions composées, une seconde liste « permutée » suit la première. Enfin une bibliographie de plus de 100 notices nous donne les principaux lexiques et thesauri de domaines voisins ayant aidé à la confection du thesaurus. Cela peut être précieux pour des travaux du même ordre.

Nous constatons que le mot éducation a été pris dans un sens très large et que ce thesaurus couvre un vaste domaine, il pourra donc être utile à toutes sortes de centres de documentation. Sa méthode nous a paru précise et rigoureuse, l'usager voit tout de suite quels sont les descripteurs qui ont été éliminés et quels sont ceux en relation avec le terme cherché et auxquels il doit également se référer. Sa recherche sera précise et complète.

Le Centre britannique de reprographie en vue de la documentation vient de publier un thesaurus 9 des termes de microreproduction à l'usage des auteurs et utilisateurs de résumés du Centre, des lecteurs de la « micro-bibliothèque » et spécialement des utilisateurs de cartes à superposition visuelle. C'est un thesaurus de forme classique, enregistrant alphabétiquement quelque 300 mots ou expressions composées utilisés dans le domaine de la microreproduction et donnant les renvois permettant la recherche précise : à la suite de la plupart des mots-clés sont les termes en relation, plus larges ou plus étroits, synonymes ou quasi-synonymes. Des sigles indiquent que le terme comprend tel ou tel concept, qu'il faut, le cas échéant, se reporter à des mots de sens plus large ou plus étroit, certains sont donnés à titre indicatif, nous sommes prévenus qu'ils n'ont pas encore servi, mais peuvent être utilisés. Enfin un sigle renvoie aux indicatifs des cartes à superposition visuelle du Centre quand il n'y a que très peu d'analyses sur le sujet cherché. Jusqu'ici nous avions eu surtout des instruments de ce genre établis aux États-Unis, celui-ci d'origine anglaise utilise une terminologie légèrement différente pour les renvois, mais le principe est le même.

La liste des descripteurs de l'Organisation de coopération et de développement économique (O.C.D.E.) 10 est dite « Liste commune » car elle est le résultat de la mise en commun des efforts de 5 organisations françaises et étrangères : Bureau international du travail, Comité international pour la documentation des sciences sociales, Deutsche Stiftung für Entwicklungsländer, Organisation des Nations unies pour l'alimentation et l'agriculture, Organisation de coopération et de développement économique, centre de développement. Il a pour origine une suggestion faite en 1964 par le Secrétariat des Nations unies. En 1966 une première Liste commune de descripteurs fut éditée, elle était une sorte de compromis entre plusieurs lexiques et index et consistait en une liste de concepts simples ou unitermes. En 1967 le Centre de développement de l'O.C.D.E., associé à 14 organisations nationales ou internationales, analysa 1 500 documents, les indexa avec la Liste commune, les mit en mémoire dans un ordinateur et put ainsi apprécier la fréquence d'utilisation des descripteurs, la proportion des nouveaux par rapport aux anciens, les associations entre termes. Le résultat apporta la preuve que l'on pouvait traiter les documents en diverses bibliothèques en utilisant un même lexique et des règles communes d'analyse et d'indexation. Il en résulta la liste que nous recevons trilingue : anglais, français, allemand. Des extensions en russe et en espagnol sont prévues.

Quelle que soit leur origine (un des organismes collaborateurs) les descripteurs consistent en mots simples et en expressions composées entrées directement dans l'ordre naturel (Exemple : Nuclear energy et non Energy (nuclear), de nombreux synonymes sont introduits et renvoient aux descripteurs au moyen d'un signe spécial, un autre signe indique la possibilité d'un descripteur plus spécifique. Enfin des notes d'usage précisent l'emploi de certains termes pour des cas particuliers.

Le premier volume de la liste donne l'ensemble des descripteurs dans les 3 langues avec entrée seulement en anglais. Ils sont répartis par champs sémantiques en 10 grandes divisions à l'intérieur desquelles sont de multiples sous-divisions. Le champ couvert est fort vaste, la liste des 10 divisions nous permet de nous en rendre compte : Documentation; Chimie, physique et sciences de la terre; Biologie, nourriture et pathologie; Agriculture; Industrie; Travail; Science économique; Culture et société; Administration et politique; Histoire. L'origine des descripteurs est indiquée.

Le volume d'annexes donne la liste des pays et des régions et celle des titres et abréviations d'institutions. Cette dernière, très précieuse, pourra servir aux bibliothécaires à identifier les collectivités.

Le tome intitulé Classement alphabétique est une liste » permutée » des descripteurs. Ceux-ci peuvent se trouver en plusieurs endroits dans le cas d'expressions composées. Des renvois figurent sur cette liste dans le but d'éliminer les synonymes. Les listes anglaises et allemandes ont exactement les mêmes caractéristiques.

Le fait que cette liste, qui se défend d'être un véritable thesaurus, est commune à plusieurs organismes, a empêché une structuration très poussée car on a voulu ménager l'avenir et permettre l'entrée de nouvelles collaborations. Plusieurs organismes ont déjà fait des propositions en particulier l'Organisation mondiale de de la santé et l'Agence internationale pour l'énergie atomique. Une utilisation un peu poussée permettra d'étudier un moyen d'admettre de nouveaux descripteurs et en même temps d'alléger la liste afin que son maniement reste toujours. commode.

C'est donc un travail très intéressant, parce que susceptible de développement que nous n'hésitons pas à présenter avec les thesauri car, bien que se défendant d'en être un, il est beaucoup plus proche d'un véritable thesaurus que bien des publications qui portent ce titre. Dans son état actuel il rendra service à tous les organismes s'occupant de développement économique et social.

II. - Thesauri scientifiques et techniques

La section médecine et pharmacie de la Bibliothèque universitaire de Clermont-Ferrand met au point une liste de vedettes-matières 11 comportant de très nombreux renvois et un codage signalant que la vedette adoptée est celle du Medical subject headings de la « National library of medicine » dans sa traduction française ou que la vedette désigne un corps figurant au Codex français (Pharmacopée française 1968).

Le thesaurus de la Compagnie générale de télégraphie sans fil 12 comporte une liste alphabétique des descripteurs et des synonymes ainsi qu'un dictionnaire des synonymes classés numériquement. Les domaines d'activité du Groupe C.S.F. sont rassemblés autour de l'électronique (physique du solide, recherche spatiale, composants).

La Société anonyme Heurtey a mis au point un thesaurus de mots-clefs 13 comprenant des renvois des synonymes et des quasi-synonymes aux descripteurs retenus et des renvois d'orientation. Les descripteurs ont une certaine analogie avec les vedettes des catalogues-matières traditionnels : vedette principale et sous-vedettes. Les domaines représentés sont la métallurgie, la pétrochimie, le conditionnement d'air, la lyophilisation, les échangeurs spéciaux, les fours.

Le vocabulaire général de la Société Fives Lille-Cail 14 est une liste alphabétique de descripteurs, de synonymes ou quasi-synonymes et de renvois d'orientation avec définition du champ sémantique lorsque c'est nécessaire. Il concerne la sidérurgie, les forges, l'estampage, la fonderie de fonte, l'emboutissage, les ponts et charpentes, la chaudronnerie, les machines-outils, la construction électrique et la cimenterie.

Le Centre de fiabilité du C.N.E.T. a mis au point un recueil de mots-clés 15 destiné à faciliter les recherches dans la bibliographie qu'il publie; 2 listes alphabétiques en vis-à-vis : d'une par celle des mots-clés, d'autre part celle des synonymes ou quasi-synonymes.

Le Centre de documentation des industries utilisatrices de produits agricoles publie mensuellement un bulletin bibliographique 16 composé sur ordinateur. Chaque bulletin comporte, entre autres, un index par mots-clés dont la liste permet de repérer les sujets susceptibles d'intéresser le lecteur; la recherche est de plus facilitée par de nombreux renvois d'orientation. Les mots-clés sont analogues à des vedettes-matières comprenant vedette principale et sous-vedettes.

Ex. : Réfrigération. Matériel. Rendement.

Produits nouveaux. Recherche technique. États- Unis.

La Bibliothèque de l'Observatoire de Paris a publié la liste alphabétique des vedettes du catalogue alphabétique de matières 17 qui recouvre les domaines de l'astronomie et de l'astrophysique. Vedettes principales et renvois d'orientation en capitales se distinguent des renvois de synonyme en italiques. Toutes les entrées de cette liste alphabétique sont complétées par l'indication codée des subdivisions du plan de regroupement qui comporte 8 classes : astronomie et sciences connexes, généralités et histoire; astronomie sphérique; astronomie théorique, mécanique céleste; astrophysique théorique; instruments et techniques; soleil; planètes, système solaire, satellite artificiel; étoile.

La deuxième édition du thesaurus des « National Institutes of Health 18 » concerne la médecine, la stomatologie, l'hygiène mentale et les domaines connexes, et recense environ 9 200 descripteurs qui constituent les vedettes-sujets de la publication annuelle Research grant index émanant du Public health service. Descripteurs, synonymes et quasi-synonymes sont classés dans l'ordre alphabétique. De nombreux renvois hiérarchiques, génériques ou spécifiques, de voisinage et d'usage sont établis, les renvois inverses étant toujours mentionnés. La liste alphabétique comprend aussi environ 1 800 descripteurs qui ne sont pas utilisés dans le Research grant index mais qui sont employés pour la recherche automatique de l'information.

Chaque mot-clé est codé au moyen de deux nombres à quatre chiffres pour faciliter le traitement en ordinateur.

Le Service d'exploitation industrielle des tabacs et allumettes 19 nous a fait parvenir un document d'imprimante qui est une liste alphabétique de 1 650 descripteurs et renvois de synonymes et quasi-synonymes. Le domaine couvert comporte non seulement la composition et la fabrication des tabacs et allumettes mais aussi les méfaits de la nicotine.

Deux bulletins de la F.A.O. contiennent des listes de descripteurs. Le premier 20 qui comprend 327 termes concerne l'aide au développement de l'agriculture et le second 21 , formé de 620 termes, est consacré à la nutrition et à l'économie familiale. Leur présentation est analogue : liste alphabétique de termes anglais précédés d'un numéro et suivis de leurs équivalents en français, en espagnol ainsi qu'en allemand pour le second. Des index alphabétiques de termes français, espagnols et allemands renvoient aux numéros d'ordre de la liste anglaise.

L'industrie textile possède un remarquable outil de travail 22 pour la recherche automatique de l'information : thesaurus alphabétique de 8 ooo mots-clés avec précision du champ sémantique si cela est nécessaire et de 72 ooo renvois de synonymes, de quasi-synonymes, de voisinage et de relations génériques ou spécifiques. Traduit en français et en langues scandinaves il est destiné à répondre aux besoins des producteurs de fibres, des fabricants de textiles, des utilisateurs industriels de tissus, des distributeurs de vêtements, des professions auxiliaires telles que teinturiers et fabricants de machines-outils, de laboratoires gouvernementaux d'essais et des groupes de consommateurs.

Le Thesaurus of engineering and scientific terms 23 a été établi en collaboration par 1' « Engineers joint council » et 1' « Office of naval research ». En 1965, en effet, l'E. J. C. et le « Department of Défense » envisageaient, chacun de leur côté, de développer la première édition de leurs thesauri respectifs de termes scientifiques et techniques 24. Les domaines représentés par ces répertoires de descripteurs se recouvraient largement et l'E. J. C. et le « Department of Défense » jugèrent judicieux d'unir leurs efforts afin de produire sous forme de volume imprimé et de bandes magnétiques un thesaurus unique facilitant les échanges d'information. Pour ce faire, les responsables du travail commencèrent par constituer une banque de données en rassemblant environ 350 listes de vedettes-matières, vocabulaires, thesauri, glossaires etc... concernant essentiellement les sciences et les techniques et recouvrant les besoins en indexation des instituts techniques, des sociétés industrielles, des associations commerciales, des universités et des administrations gouvernementales. Le résultat de la mise en ordinateur des données trouvées dans ces ouvrages de références fut un répertoire de plus de 150 000 termes séparés avec des compléments d'information sur leur mode d'emploi. La banque des données magnétiques ainsi obtenues fut transférée aussitôt sur microfilm puis imprimée pour permettre le travail d'épuration. Des règles de choix et de rédaction des descripteurs et des renvois, des conventions de codage furent mises au point. Puis d'avril à novembre 1966, 21 sessions de travail de une à deux semaines furent consacrées à l'examen d'un des 22 domaines retenus : aéronautique; agriculture ; astronomie et astrophysique; sciences de l'atmosphère; sciences sociales et du comportement; sciences biologiques et médicales; chimie; sciences de la terre et océanographie; électronique et électrotechnique; conversion de l'énergie (non propulsive); matériaux; mathématiques; génie (mécanique, industriel, civil, marin); méthodes et équipement; sciences militaires; technologie des missiles; navigation, communication, détection et contremesures; science et technologie nucléraire; armement; physique; propulsion et combustibles; technologie spatiale. 329 chercheurs, savants, scientifiques, ingénieurs, documentalistes et bibliothécaires spécialisés consacrèrent en moyenne 5 jours chacun à ces sessions préparées par les équipes de l'E. J. C. et de l'« Office of naval research » chargés de la rédaction du thesaurus et de l'établissement d'une liste provisoire imprimée servant de base à la discussion. A la fin des sessions les lexicographes entreprirent à l'aide de l'ordinateur une révision exhaustive des termes retenus comme descripteurs, des notes d'usage, des renvois d'orientation et des renvois hiérarchiques; à l'impression, le thesaurus comprenait 23 364 entrées distinctes : 17810 descripteurs et 5 554 synonymes ou quasi-synonymes.

Ce thesaurus comporte quatre parties d'importance inégale :

I° la liste alphabétique des descripteurs et de leurs synonymes ou quasi-synonymes. Chaque descripteur, accompagné d'une définition chaque fois que cela a été jugé nécessaire, est suivi de l'indication du groupe auquel il appartient dans la classification systématique à 22 divisions. Sont indiquées aussi les relations de voisinage et les relations hiérarchiques, génériques et spécifiques.

2° l'index permuté des descripteurs dans lequel chacun d'eux apparaît dans l'ordre alphabétique autant de fois qu'il comporte de mots.

3° la liste codée numériquement des 22 classes et des différentes sous-classes du regroupement systématique des termes retenus, avec pour chaque sous-classe, la liste des descripteurs la concernant; un descripteur peut apparaître dans plusieurs sous-classes.

4° une liste hiérarchique classée dans l'ordre alphabétique des descripteurs les plus généraux, chacun d'eux étant suivi de la liste en cascade des termes plus spécifiques.

Exemple : Electron tubes
Cold cathod tubes
Neon tubes
Phototubes
Cesium electron tubes
Photomultiplier tubes

L'un des appendices de l'ouvrage est consacré aux règles d'établissement du thesaurus approuvées le 9 novembre 1966 et aux conventions adoptées.

Le thesaurus de minéralogie mis au point par le « Gmelin-Institut 25 » est composé de descripteurs auxquels sont affectés des symboles numériques à 10 chiffres permettant leur regroupement systématique. La base du système est un plan de classement comprenant 12 sections : généralités, morphologie, structure, propriétés physiques, propriétés physico-chimiques, âge, genèse, type de formation, géologie, géographie, technologie, économie. Chaque section fait l'objet de subdivisions d'où le codage des descripteurs au moyen de nombres formés de 10 chiffres. Chaque descripteur peut, de plus, être limité sémantiquement par l'emploi d'un codage supplémentaire à 4 chiffres correspondant aux caractéristiques communes à leur ensemble et dont la liste est donnée en supplément au plan de classement dans l'ordre numérique croissant. Pour permettre l'utilisation du système le thesaurus comporte une liste alphabétique des descripteurs, de leurs synonymes ou quasi-synonymes, des renvois d'orientation et des termes des caractéristiques communes qui, ne s'employant pas seules, se distinguent des mots-clés par un N majuscule très apparent.

Le thesaurus de la corrosion du « Zentralstelle für Korrosionsschutz 26 » concerne les processus de la corrosion et la lutte préventive contre la corrosion. Il se présente sous forme de fiches de format 10,5 × 15 cm qui paraissent dans l'ordre alphabétique par livraisons de 100 et comprendra, lorsque son impression sera achevée, environ 1 500 descripteurs et 1500 quasi-synonymes et synonymes. Les relations d'ordre hiérarchique et les relations d'association entre descripteurs sont mentionnées chaque fois que cela est nécessaire. Les descripteurs sont différenciés selon qu'ils sont généraux, spécifiques ou composants d'un alliage, au moyen d'une signalisation alphabétique : ← A →, ←A u. B →, O... ←A u. B →.

Ex : - descripteur général : Edelmetalle ← A →;

- descripteur spécifique : Elektromotoren ← A u. B →

- composant d'un alliage : O Antimon als Zusatz in Legierungen ←; A u. B →

Un plan de regroupement des descripteurs, codé à 3 chiffres, a été établi et les mentions de code sont reportées sur chaque fiche de descripteur.

Ce thesaurus sera utilisé, dans un premier temps, à la recherche des informations au moyen de fiches perforées de type « peek-a-boo » et ensuite mis en mémoire pour permettre la recherche par ordinateur.

Le Bureau de recherches géologiques et minières (B.R.G.M.) étant chargé de l'inventaire des collections nationales de minéralogie a utilisé son ordinateur Bull gamma 30 pour réaliser un index alphabétique 27 qui permettra la gestion automatique des fichiers d'échantillons minéralogiques. Une commission internationale étudiant la normalisation de la nomenclature minéralogique qui a beaucoup varié aux cours des temps, les tables établies par le B.R.G.M. tiennent compte des travaux de cette commission et ont été réalisées en utilisant diverses sources dont la liste est indiquée en tête d'ouvrage. Ces tables comportent cinq colonnes : dans la première colonne figurent, par ordre alphabétique, tous les noms encore utilisés ou non pour désigner une substance minérale, espèce ou variété. Si le nom s'applique à une espèce agréée à la date de mise à jour des tables, il figure en majuscules; tous les autres noms (variété agréée, synonyme d'un nom d'espèce, synonyme d'un nom de variété, synonyme d'un nom de sous-variété, autre nom) sont en minuscules. Dans le cas d'homonymie entre deux ou plusieurs minéraux, on a ajouté les noms des minéralogistes qui les ont décrits. Dans la deuxième colonne figurent la formule chimique pour les espèces agréées et les variétés chimiques, le nom agréé si le nom figurant dans la première colonne est rejeté (renvois de synonymie). Dans la 3e colonne est indiqué le rattachement à l'espèce dans le cas d'une variété, parfois à un groupe, voire à un mélange, distingués aisément de l'espèce puisqu'écrits en minuscules et entre eux par une indication en quatrième colonne. Dans celle-ci figurent soit des remarques qui complètent ou nuancent ce qui est inscrit dans les deux premières colonnes, soit l'abréviation M (mélange) qui s'applique aux mélanges de la troisième colonne, soit l'espèce dans le cas de familles riches en sous-variétés, la variété de rattachement figurant en troisième colonne. La cinquième colonne est consacrée au code des minéraux en 6 caractères, abrégé numérique des noms, afin de permettre la gestion par l'ordinateur des inventaires minéralogiques.

Pour terminer, signalons que la Société des Usines chimiques Rhône-Poulenc 28 possède un thesaurus alphabétique de 6 307 termes au 19 février 1969, date à laquelle elle a fait sortir un document d'imprimante : deux volumes constituent la partie numérique, deux autres la liste alphabétique concernant la chimie industrielle et comportant, de ce fait, le nom de nombreux corps chimiques en majorité organiques.

  1. (retour)↑  Complément à l'article paru dans le Bulletin des bibliothèques de France, 14e année, n° 5, mai 1969, pp. 181-202.
  2. (retour)↑  Complément à l'article paru dans le Bulletin des bibliothèques de France, 14e année, n° 5, mai 1969, pp. 181-202.
  3. (retour)↑  ASSOCIATION CANADIENNE DES BIBLIOTHÈQUES. Services techniques (section). Ottawa. - A List of Canadian subject headings, ed. by a Committee on Canadian subject headings : Jean Mitchell, Hazel 1 Mac Taggart, Nicholas Krenta... - Ottawa, Canadian library association, 1968. - 23 cm, VIII p., 90 ff.
  4. (retour)↑  LIBRARY OF CONGRESS. Subject cataloging division. Washington. - Subject headings for children's literature. A statement of principles of application and a list of headings that vary from those used for adult literature. [Introd. by Robert R. Holmes and William J. Welsh.]... - Washington, 1969. - 23,5 cm, 30 p. (Processing department.)
  5. (retour)↑  FRANCE. Tourisme (Commissariat général). - Plan systématique de classement. [Suivi d'un] Dictionnaire de mots [clés]. -Paris [1969] - 2 parties en 1 vol. 28,5 X 12 cm, n. paginé, couv. ill.
  6. (retour)↑  UNIVERSITÉ DE STRASBOURG. Centre de recherche et de documentation des institutions chrétiennes, C.E.R.D.I.C. - Répertoire bibliographique des institutions chrétiennes 1968...
  7. (retour)↑  Index en 5 langues établi par ordinateur, publ. sous la dir. de René Metz,... Jean Schlick,... - Strasbourg, 1969. - 24 cm, 422 p., V tabl. dépl.
  8. (retour)↑  SCHULTZ (Claire K.). - Thesaurus of information science terminology. Revised ed... - Washington, Communication service corporation, 1968. - 21 cm, x-246 p., couv. ill.
  9. (retour)↑  ÉTATS-UNIS. Educational resources information center. - Thesaurus of E.R.I.C. descriptors... 1967. - Washington, U.S. government printing office, 1968. - 20 X 26 cm, XVIII-309 p. (U. S. Department of health, education and welfare. Office of education.)
  10. (retour)↑  NATIONAL REPROGRAPHIC CENTRE FOR DOCUMENTATION. Desk top library services. Hartfield (Royaume-Uni). - Thesaurus of microform terms, by B.J.S. Williams. - Hartfield (Herts.), 1969. - 30 cm, 1-38 ff.
  11. (retour)↑  ORGANISATION DE COOPÉRATION ET DE DÉVELOPPEMENT ÉCONOMIQUE. Centre de développement. Paris. - Liste commune de descripteurs. Aligned list of descriptors. Gemeinsames Schlagwort-Verzeichnis : Bureau international du travail... Comité international pour la documentation des sciences sociales... Deutsche Stiftung für Entwicklungsländer... Organisation des Nations Unies pour l'alimentation et l'agriculture... Organisation de coopération et de développement économique... [Préf. de Jean Viet.] - Paris, 1969. -5 vol. 27 cm., couv. ill.
    [I] Liste commune de descripteurs... - LIV-308 p.
    [2] Annexes... - 78 p.
    [3] Classement alphabétique. - II-89 p.
    [4] Alphabetische Ordnung. - II-83 p.
    [5] Alphabetical order. - II-98 p.
  12. (retour)↑  BIBLIOTHÈQUE UNIVERSITAIRE. Section médecine et pharmacie. Clermont-Ferrand. -Liste de vedettes-matières - Clermont-Ferrand, 1968. - 27 cm, multigr. A-And.
  13. (retour)↑  COMPAGNIE GÉNÉRALE DE TÉLÉGRAPHIE SANS FIL. Rocquencourt. - Lexique alphabétique. [Dictionnaire des synonymes.] - [Rocquencourt. 78], 1969. - 2 vol. 26 X 40 cm, 89 + 89 p., multigr. (Document d'imprimante.)
  14. (retour)↑  HEURTEY (Société). - [Thesaurus de mots clefs. -] Paris, 1969. - 33 cm, [19I] ff. (Reprographie d'un document d'imprimante n'existant qu'en 2 exemplaires.)
  15. (retour)↑  FIVES LILLE-CAIL (Société). - Vocabulaire général. - Fives (59), 1969. - 27 cm, 183 ff., multigr.
  16. (retour)↑  CENTRE NATIONAL D'ÉTUDES DES TÉLÉCOMMUNICATIONS. Centre de fiabilité. Paris. -Recueil des mots-clés utilisés dans la bibliographie. Octobre 1969. - Bagneux (92), 1969. -30 cm, [I-] 18 ff.
  17. (retour)↑  CENTRE DE DOCUMENTATION DES INDUSTRIES UTILISATRICES DE PRODUITS AGRICOLES. 91. Massy. - Bulletin bibliographique. Vol. 2, N. 9, septembre 1968. - Paris, Association française de chimiurgie, 1968. - 2 parties en 1 vol. 27 cm, 26 + 29 p. (La première partie est la liste des mots-clés.)
  18. (retour)↑  BIBLIOTHÈQUE DE L'OBSERVATOIRE DE PARIS. - Catalogue alphabétique de matières. Fiches de regroupement. Astronomie, astrophysique. - Paris, 1967. - 2 vol. 27 cm, 27 + 18 ff., multigr. (On a joint les addenda de mai 1969.)
  19. (retour)↑  ÉTATS-UNIS. Public health service. - Medical and health related sciences thesaurus. - Washington, U. S. government printing office, 1969. - 29,5 cm, VI-460 p., errata. (U. S. Department of health, education and welfare. Public health service.)
  20. (retour)↑  SERVICE D'EXPLOITATION INDUSTRIELLE DES TABACS ET ALLUMETTES. Études et équipement (Direction). Paris. - Liste alphabétique des mots-clés. - Paris, 1967. - 27,5 cm, n. pag. (Document d'imprimante.)
  21. (retour)↑  ORGANISATION DES NATIONS UNIES POUR L'ALIMENTATION ET L'AGRICULTURE. Publications (Division). [Rome.] - Selected terms in the field of agricultural development aid. Choix de termes relatifs à l'aide au développement de l'agriculture. Terminos seleccionados en el dominio de la ayuda para el desarrollo agricola. - Rome, Food and agriculture organization of the United Nations, 1969. - 28 cm, VI-33 p. (Terminology bulletin n° 18.)
  22. (retour)↑  ORGANISATION DES NATIONS UNIES POUR L'ALIMENTATION ET L'AGRICULTURE. Publications (Division). [Rome.] - Selected terms in nutrition and home economics. Termes choisis en nutrition et économie familiale. Terminos seleccionados de nutrición y economia domestica. - Rome, Food and agriculture organization of the United Nations, 1968. - 28 cm, VIII-87 p. (Terminology bulletin n° 16.)
  23. (retour)↑  MASSACHUSETTS INSTITUTE OF TECHNOLOGY. Fibers and polymers division. Cambridge (Mass.). - Thesaurus of textile terms covering fibrous materials and processes. 2nd ed. -Cambridge (Mass.), 1969. - 448 p.
  24. (retour)↑  ÉTATS-UNIS. Defense (Department), ÉTATS-UNIS Naval research (Office) et ENGINEERS JOINT COUNCIL. New York. - Thesaurus of engineering and scientific terms... -Washington, 1967. - 27,6 cm, VI-690 p., couv. ill.
  25. (retour)↑  ÉTATS-UNIS. Defense (Department), Washington. Naval research (Office). - The Making of test thesaurus of engineering and scientific terms, final report of project Lex... - Washington, 1967. - 27,5 cm, II-174-2 p.
  26. (retour)↑  GMELIN-INSTITUT. Dokumentationsstelle für Mineralogie. Frankfort. - Thesaurus Mineralogie... - Frankfurt-am-Main, 1969. - 21 cm, 141 p., multigr.
  27. (retour)↑  ZENTRALSTELLE FÜR KORROSIONSSCHUTZ. Rossendorf bei Dresden. - Thesaurus Korrosion-Korrosionsschutz. Bearbeit von Werner Dux... Geleiwort von... Kurt Schwabe. - Rossendorf bei Dresden, 1968 →. - 2I cm, et fiches 10,5 × 15 cm.
    I. Alphabetische Kartei der Grund- und Hilfsworter. Abblättern-Aufzüge.
  28. (retour)↑  BUREAU DE RECHERCHES GÉOLOGIQUES ET MINIÈRES. Paris. - Index alphabétique de nomenclature minéralogique. -Paris, B.R.G.M., 1968. - 30 cm, 386 p., multigr. (Inventaire des collections nationales de minéralogie sous les auspices de la Délégation générale à la recherche scientifique et technique).
  29. (retour)↑  RHÔNE-POULENC (Société des Usines chimiques). Paris. - Thesaurus en langage usuel... - [Paris] 1969. - 4 vol. 27,5 cm, (Document d'imprimante.)