Construire un thésaurus

manuel pratique

par Anne Curt

Jean Aitchison

Alan Gilchrist

Paris : ADBS, 1992. - 2e éd. - 217 p. ; 24 cm. - (Collection Sciences de l'information : série études et techniques)
ISBN 2-901046-43-6 : 430 F.

Publié pour la première fois en 1992 par l'ASLIB, Association pour la gestion de l'information en Grande-Bretagne, Construire un thésaurus vient d'être traduit, vingt ans après, par l'Association française de documentalistes et bibliothécaires spécialisés, à partir de la deuxième édition de 1987. Il existait, jusque là, en effet, des ouvrages généraux sur l'indexation, les langages documentaires et dassificatoires, ainsi que sur le traitement linguistique de l'information... De nombreux articles relataient les difficultés d'élaboration de thésaurus spécialisés, mais nul ouvrage ne faisait le tour du problème encore. C'est donc un manuel pratique que publient l'ADBS et l'Institut universitaire de technologie de Tours à des fins pédagogiques.

Ouvrage classique, il définit les notions indispensables, langage naturel, langage contrôlé, énumère les normes de construction des thésaurus, illustre à l'aide d'exemples précis le vocabulaire de l'indexation universellement employé, la forme de cette indexation et ses spécificités (équivalence et synonymie ou quasi-synonymie, mots composés, singuliers/pluriels...). Renvois d'équivalence (EM, EP), relations hiérarchiques avec son cortège de termes génériques et de termes spécifiques. (TG et TS), les renvois d'orientation dit « relations associatives », les inclusions, les relations à facettes ne présentent plus aucune ambiguïté pour le futur documentaliste ou bibliothécaire non averti. Plus aucun contresens ne sera, dorénavant, admis sur la précoordination ou la post-coordination. Les outils de la recherche post-coordonnée dévoilent les opérateurs booléens, les troncatures appelées portions de mots, l'adjacence ou la proximité de termes entre eux rebaptisées « distance entre les mots »...

Une partie importante s'attache à la description précise des différentes formes que peuvent présenter les thésaurus. Index permutés de types KWIC ou KWOC, classements alphabétiques, hiérarchiques, à facettes, systématiques, représentations graphiques, arborescentes, fléchées, de type root... sont illustrés précisément à l'aide de 23 tableaux d'exemples. Bien sûr, les thésaurus multilingues sont aussi à l'honneur.

Le livre lève ainsi, page après page, toutes les obscurités dont étudiants et professionnels auraient pu être victimes pour arriver à l'essentiel, la construction d'un thésaurus. Les différentes étapes en sont bien fixées, depuis la déclaration d'intention à la terminologie choisie, en passant par le contrôle des spécialistes du domaine, puis la présentation avec, là encore, de nombreuses pages d'exemples bien choisis et, qui mieux est, en français. Test, préparation de la publication nous laissent un peu sur notre faim quant aux moyens informatiques que l'on pourrait utiliser, ou encore, les fichiers d'autorités que l'on pourrait créer, tandis que le « dépôt auprès d'un bureau central » nous déçoit tout à fait. Rien n'existe-t-il en France ?

La conclusion sur les apports de l'informatique est trop brève, car les moyens actuels pourraient au moins permettre de « contrôler » l'indexation sinon d'indexer automatiquement les documents eux-mêmes et permettre des recherches à la fois statistiques et linguistiques sur les termes de la recherche. Il était vraiment temps que ce document de travail paraisse, à l'heure de l'hypertexte et de l'indexation automatique, à l'ère de la quête du texte intégral et des logiciels de recherche documentaire de plus en plus performants combinés à des outils linguistiques de haut niveau.