Terminologie et documentation
pour une meilleure circulation des savoirs
Maryvonne Holzem
Maryvonne Holzem, bibliothécaire en section sciences, puis maître de conférences à l'université de Rouen, propose ici un ouvrage original. Tout d'abord parce que le poids social des choix terminologiques est rarement analysé. Et aussi parce qu'il joue sur le double registre de la réflexion épistémologique et de l'analyse de situations concrètes d'indexation. Il alterne la réflexion sur les conditions de la naissance des classifications, sur les approches scientométriques et sociologiques du langage, et la description d'expérimentations (comparaison des performances d'indexation de populations précises de bibliothécaires, suivi de l'histoire de l'implantation de termes dans les autorités matière, etc.).
Double approche
Cette double approche est à la fois sa force et sa difficulté. Sa force, parce que la réflexion s'ancre ainsi clairement dans une pratique professionnelle, et que la pratique professionnelle apparaît bien comme une intelligence. Force aussi parce que le lien entre réflexion théorique et exigence d'action n'est pas si aisé à faire. C'est aussi une difficulté, parce qu'il faut pouvoir comprendre à la fois les descriptions parfois fouillées des subtilités de l'indexation tout comme les parties épistémologiques. Et que l'on se sent parfois frustré, avec l'impression que beaucoup de choses sont dites trop rapidement.
Au début de ce siècle, les missions assignées à la documentation ressemblent fortement à celles que les sciences doivent remplir pour la philosophie positive. La classification décimale universelle (CDU), portée par l'idéal encyclopédique, se veut une représentation objective des domaines et des concepts. L'indexation ne doit employer que des mots non ambigus, représentant un juste milieu entre générique et spécifique. Dès ses débuts, s'appuyant sur les analyses terminologiques de Wüster, « la documentation partage avec la terminologie wüstérienne une même difficulté à prendre en compte la circulation interdisciplinaire des savoirs et des mots, une même croyance en l'universalité des notions, et un même désintérêt pour la fonction sociale qu'elle remplit. » (p. 5). Or, aucune science n'est hors la société, contrairement aux représentations positivistes.
Aujourd'hui, de plus, la recherche appliquée tend à prendre le pas sur la recherche fondamentale. Le discours scientifique et technique devient l'un des axes du fonctionnement des sociétés : il l'explique, justifie des décisions, donne du sens à l'avenir. En conséquence, il devient inacceptable que ces discours restent incompréhensibles. Le traitement linguistique de la production scientifique devient une responsabilité particulièrement lourde pour les professionnels. L'approche terminologique antérieure peut-elle alors répondre à ces nouveaux enjeux ?
L'indexation
Prenons l'indexation. Peut-on accepter la représentation selon laquelle les termes choisis (par l'opérateur ou la machine) sont objectivement ceux qui s'imposent ? Indexer, c'est traduire. Un mot prend sens dans un contexte, et le contexte est souvent oublié. Les recherches en indexation automatique se fondent plus souvent sur l'analyse transformationnelle et les méthodes statistiques, le traitement des documents est souvent quantitatif (un logiciel repérera par exemple les co-occurrences de termes). On nie l'influence de la société sur la science.
Or, il suffit d'examiner un tant soit peu la normalisation des termes scientifiques pour voir cette influence à l'œuvre. « L'apparition et la domination de certaines formes sur d'autres relèvent d'une problématique sociale qui fait défaut aux approches terminologiques et documentaires qui s'efforcent avant tout de neutraliser l'unité linguistique sélectionnée » (p. 135). Quand on observe le travail des indexeurs, on ne peut que constater des différences en fonction de leur fréquentation du langage d'indexation. Plus on le connaît, plus on cherche à le retrouver dans les textes indexés. Le travail d'indexation s'avère ainsi être un travail d'homogénéisation et de normalisation. Certains mots s'imposent, d'autres pas (processus, loi ou distribution). Ainsi, la socio-terminologie permet de rompre « avec l'approche wüstérienne qui appréhende le signe comme l'élément stabilisé d'un système conceptuel préexistant » (p. 177). Il n'existe pas des concepts scientifiques tout construits et indiscutables, pour lesquels il suffirait de choisir le bon terme. Ces concepts scientifiques eux-mêmes sont issus de confrontations à l'intérieur d'un milieu. Toute production langagière a une dimension humaine, sociale, interactionnelle.
Les milieux scientifiques participent à la normalisation. C'est vrai notamment pour les jeunes chercheurs. Si l'on examine les indexations fournies par les thésards de mathématiques, on s'aperçoit des nombreuses hésitations qui les guettent : quand faire dominer l'anglicisme ? Quels termes d'indexation choisir ? Quand créer un néologisme ? À quels types d'interlocuteurs s'adressent les résumés ? Quel doit être le niveau de spécialisation du langage ? Or, les thèses sont importantes, puisqu'elles abordent préférentiellement des thèmes neufs. La création de néologismes, l'importation de termes (notamment anglo-saxons) y sont importants. Les professionnels assistent rarement les thésards dans ces choix, alors qu'il y a là « un enjeu important sur le plan de l'appropriation des connaissances » (p. 227). Aider à la normalisation des termes francophones de la recherche est l'un des devoirs de la profession.
La science est construite dans des communautés et des cultures données : les approches des mathématiques américaines ne ressemblent pas aux approches mathématiques françaises. Les traditions scientifiques sont tout autres. La science est ainsi non pas une donnée brute extérieure à une société, mais la production d'une communauté humaine donnée, un ensemble de textes édités. C'est à partir de là que va se poser la question de sa diffusion, qui s'effectue elle aussi dans une culture donnée. C'est à ce niveau qu'il faut poser les questions linguistiques, notamment de la langue d'expression de la science : des langues et des cultures risquent de se marginaliser, et avec elles, des traditions scientifiques complètes.
La mise au point d'un thésaurus
Concrètement, il serait intéressant de mettre au point un thésaurus terminologique incluant une liste thématique hiérarchisée, une liste alphabétique structurée, un index des termes français et un index anglais/français. « Notre étude de la circulation de l'information scientifique nous a amenée à plaider en faveur d'un outil multifonctionnel : le thésaurus terminologique, capable à la fois de fournir par le recours à des périphrases définitionnelles, les contextes d'utilisation d'un terme et de le situer par rapport à un environnement sémantique fait de termes génériques, spécifiques, équivalents, rejetés, etc. » (p. 232).
D'autre part, il faudrait aider les jeunes thésards lors de l'indexation et la rédaction de résumés. « Il faudrait que le bibliothécaire prenne la mesure de sa tâche sur le plan de l'aménagement de la langue et qu'il y ait, entre les diverses instances de validation, les interactions nécessaires à l'accomplissement d'un travail que nous qualifierions de socioterminologique au plein sens du terme » (p. 240).
La bibliothèque peut être un lieu de veille terminologique, dans un dialogue avec les experts du domaine. Les bibliothécaires sont ainsi « les intermédiaires obligés du changement linguistique » (p. 252). La bibliothèque a une responsabilité non négligeable dans l'appropriation des connaissances.