Salam LAMECH !

Liste d'autorité de matières encyclopédique, collective et hiérarchisée

Étienne Hustache

Annie Meyer

Christine Stotzenbach

Présentation de LAMECH (Liste d'autorité de matières encyclopédique, collective et hiérarchisée). Cette liste a pour point de départ les travaux de la BPI et de la Bibliothèque nationale qui ont utilisé la liste de la bibliothèque de l'Université Laval. Conçue en fonction du développement des catalogues collectifs, LAMECH est d'abord un outil d'aide à l'indexation proposant 70 000 termes retenus. LAMECH est une banque de données chargée sur le SUNIST et gérée par la Cellule nationale de coordination de l'indexation matières. L'utilisation du logiciel ALEXIS facilitera les modalités de gestion et de mise à jour.

LAMECH originates in the work done in France by the BPI and the Bibliothèque nationale after the French translation of LCSH by the University of Laval in Québec. Established to fit the development of union catalogs, LAMECH is primarily, with its 70,000 preferred terms, a reference tool for indexation. Main access to the list should be through an online databank hosted by the SUNIST, as well as its managements by the National cell for coordination and subject indexing. Access and updating shall benefit from the various facilities provided by the software ALEXIS

Pourquoi une liste d'autorité de matières ? Une de plus, soupireront certains, ceux-là mêmes qui avaient été les premiers à déplorer, pendant plus d'un quart de siècle, l'absence de toute liste encyclopédique d'autorité de matières au niveau national 1... L'argument, dans le cas de LAMECH, mérite pourtant considération puisque LAMECH (Liste d'autorité de matières encyclopédique, collective et hiérarchisée) est issue - et revendique sa filiation - de deux listes d'autorité jumelles (listes de la Bibliothèque publique d'information et de la Bibliothèque nationale), elles-mêmes issues de la liste d'autorité de la Bibliothèque de l'Université Laval, cette dernière étant à son tour l'héritière des LCSH (Library of Congress subject headings ). Clonage en chaîne, redondance au carré pourrait-on dire, gaspillage de crédits et de matière grise dû au désir de chacun de « faire sa propre liste »... Même si on se bornait à cette seule explication, il y aurait lieu néanmoins de s'interroger sur les raisons de cette soudaine floraison sur une tige commune.

Langage de raison

Certaines explications viendront aisément à l'esprit : parmi elles la difficulté d'élaborer, à partir de zéro, un corpus encyclopédique de mots matières, mais ce rappel ne saurait constituer une véritable réponse, car cette difficulté n'était pas moins grande à la fin des années cinquante, qui ont vu les bibliothèques s'accommoder de la norme NF Z 44-070 publiée en 1957 en l'accommodant à toutes les sauces... Pourquoi donc vouloir rompre avec une situation qui, pour être peu satisfaisante, avait fait la preuve de sa capacité à durer ? C'est l'introduction de l'informatique dans les catalogues de bibliothèques qui joue un rôle de catalyseur en apportant simultanément des possibilités et des contraintes nouvelles en matière d'indexation. Contraintes nouvelles, parce que l'informatisation débouche presque inévitablement sur une mise en commun et une diffusion des données bibliographiques, et c'est s'arrêter au milieu du gué que de partager le seul travail de signalement, en excluant l'indexation du champ de la coopération. Mais ceci suppose que les partenaires d'un réseau pratiquent le même langage d'indexation et non des patois plus ou moins proches les uns des autres...

Un langage commun n'était pas nécessaire, tant que chaque catalogue de bibliothèque constituait un tout fermé sur lui-même, sans possibilité de communication extérieure. Au contraire, tant que le catalogue sur fiches (ou ses analogues) représentait l'unique mode d'accès au contenu des documents, toute tentative d'uniformisation trop poussée aurait été à l'encontre de l'adaptation nécessaire aux besoins et aux usages de publics extrêmement variés. Le catalogue matières manuel est, par force, un compromis entre la nécessité d'une indexation cohérente, les limites physiques au nombre d'entrées par ouvrage, d'une part, et d'autre part le « langage naturel », ce dernier caractérisé soit par son imprécision, soit par la variété des approches et des points de vue dès lors que les utilisateurs ne forment pas un groupe homogène. Cette contradiction majeure forçait à la « babélisation » des langages d'indexation; c'est elle que le recours aux moyens informatiques permet (ou permettra prochainement) de résoudre.

Direction LAMECH

Il n'est, disons-le tout de suite, nullement question de mettre en avant la mystérieuse vertu magique que conférerait l'informatique pour récuser l'instrument traditionnel, mais d'analyser les incidences de l'informatisation sur les modes d'accès au document. Or, jusqu'à présent, les systèmes d'informatisation de bibliothèques se sont coulés dans le moule classique : on s'est beaucoup préoccupé de développer l'accès par l'intermédiaire de catalogues auteurs (ou titres), mais l'amélioration de l'accès par sujets, peut-être jugée d'un traitement plus compliqué, commence seulement à être abordée. Dans une situation parallèle au contexte traditionnel, l'informatisation permet, contrairement au catalogage manuel, de dissocier les deux démarches vis-à-vis du document, description-indexation, vis-à-vis du lecteur, analyse-traduction. C'est dans cette perspective qu'il convient de situer LAMECH; fondamentalement LAMECH se veut un outil d'aide à l'indexation destiné à des professionnels, un outil destiné à améliorer la cohérence et la pertinence de l'indexation documentaire, mais il n'est pas sa propre fin. On peut dire que LAMECH constitue une condition nécessaire, mais non suffisante, pour améliorer les possibilités d'accès du lecteur : les logiciels d'aide à l'interrogation adaptés aux différents publics devant constituer l'autre versant du service.

Outil de professionnels donc, LAMECH s'inscrit dans une perspective encyclopédique. Le niveau de précision recherché ne dépasse pas, en général, celui d'un ouvrage, ce qui n'interdit pas d'indexer des documents multimédias comme le prouve l'exemple de la Bibliothèque publique d'information. Le terme d'encyclopédisme mérite d'être explicité et redéfini dans le cadre de la problématique nouvelle induite par l'informatisation; ce ne sont plus seulement les bibliothèques de lecture publique qui sont concernées mais, aussi, un ensemble beaucoup plus large d'établissements travaillant ou appellés à travailler en réseau au sein de catalogues collectifs (locaux, régionaux ou nationaux), catalogues à vocation encyclopédique même si des établissements spécialisés en font partie. LAMECH s'adresse par définition à des réseaux d'information et d'accès aux documents plus qu'à des établissements isolés. De manière analogue, la participation à un catalogue collectif amène à reconsidérer la problématique de l'adaptation du langage documentaire à la taille du fonds géré et entraîne un nivellement par le haut : dès lors que l'on réunit des fonds différents, même de taille restreinte, dans un seul catalogue, le besoin de discrimination augmente et, à la limite, le tout est supérieur à la somme des parties.

Norme à lister

Cet ensemble de facteurs a conduit la DBMIST à s'associer, à partir de 1983, à l'établissement de la norme NF 47-200 définissant la structure et les règles d'emploi d'une liste d'autorité de matières collective et à créer auprès de l'Ecole nationale supérieure des bibliothécaires une Cellule nationale de coordination de l'indexation matières (CNCIM). La nouveauté introduite par cette norme tient à la référence explicite à une liste d'autorité ; la norme ne se conçoit pas sans la liste. En outre, cette liste est posée dès le départ comme contrôlée (pour les noms communs) et évolutive; évolution et contrôle sont du ressort de la CNCIM.

Il est nécessaire de donner des précisions sur les raisons qui ont prévalu au moment du choix qui a été fait en faveur des listes Bibliothèque publique d'information-Bibliothèque nationale. Il importait à la fois d'aller vite et de réussir : d'où la nécessité de partir d'un langage documentaire existant et qui disposait de bases de départ solides. L'ensemble documentaire lié à la Bibliothèque du Congrès présentait des garanties sérieuses sous ces deux points de vue, puisque la première édition des LCSH est de 1914 et les versions françaises de la Bibliothèque de l'Université Laval remontent à la fin des années quarante. La clientèle concernée - bibliothèques publiques et bibliothèques d'université - était sensiblement la même que celle désignée en France sous le terme de « bibliothèques encyclopédiques », dans l'acception qu'on vient de lui donner. Par ailleurs, la participation de deux établissements d'importance nationale (BN et BPI) conférait à ce choix une garantie pour l'avenir, dans la mesure où on pouvait escompter des mises à jour régulières.

N'aurait-t-il pas été plus simple de prendre comme norme l'une des deux listes existant en France, celle de la BPI ou celle de la BN ? Ces deux établissements ont joué un rôle moteur dans l'élaboration de la norme Z 47-200 et c'est avec leur plein accord que les arbitrages nécessaires ont été faits, après confrontation de leurs pratiques respectives. Après quelques hésitations, il a été décidé que la liste de la Bibliothèque nationale servirait de noyau de départ à LAMECH (avec les modifications nécessaires pour être conforme à la norme), afin d'offrir d'emblée une cohérence avec les vedettes matières de la Bibliothèque nationale. A peine née, LAMECH commence à évoluer et le travail de pilotage de la CNCIM consiste justement à intégrer les demandes des utilisateurs, en coordination étroite, non seulement avec la Bibliothèque nationale, mais aussi avec la BPI et la Bibliothèque de l'Université Laval.

D'autres objections ont été soulevées, tenant notamment à la publication par le Cercle de la librairie du Choix de vedettes matiéres à l'intention des bibliothèques. De fait, ces deux listes apparaissent complémentaires et non substitutives, le choix entre l'une ou l'autre devant se faire au moins autant en fonction de « l'engagement informatique et coopératif » des établissements, qu'en fonction de leur taille. Il va de soi qu'un établissement de petites dimensions travaillant de manière isolée se doit d'avoir un langage documentaire « collant » à la fois au lecteur et au fonds. C'est à ce type de besoin que répondent la liste du Cercle et la norme NF Z 44-070, dont la nouvelle version a été publiée en parallèle à la norme décrivant le fonctionnement des listes LAMECH. Par ailleurs, les listes se situent à une échelle différente (12 500 noms communs et renvois pour la liste du Cercle, 35 000 noms communs sans compter les renvois pour LAMECH) encore qu'en vertu du vieil adage « qui peut le plus peut le moins », il soit imaginable de pouvoir utiliser LAMECH (ou une version abrégée) pour indexer de petits fonds, la richesse du thésaurus n'imposant pas l'utilisation de l'ensemble des vedettes et, surtout, des subdivisions. C'est aux établissements qu'il appartient (appartiendra) de tailler le patron LAMECH à leurs mesures.

Comme son nom ne l'indique pas, LAMECH est aussi une banque de données gérée et consultée en ligne : ce choix correspond aux objectifs de LAMECH, un outil d'indexation et de coopération qui devait être en permanence à la disposition de ses utilisateurs. En adoptant cette structure - une option qui n'est plus réellement une innovation - LAMECH se donnait les moyens de ses ambitions, mettant la CNCIM en mesure de satisfaire le réseau des utilisateurs, assurés d'avoir rapidement à leur disposition les données nouvelles et les mises à jour. Animer le réseau et administrer la base, tel est, résumé de façon lapidaire, le descriptif du rôle assigné à la Cellule nationale de coordination de l'indexation matières. Elle valide et entre les corrections et ajouts proposés par les membres du réseau, en liaison constante avec la Bibliothèque de l'Université Laval, la Bibliothèque publique d'information et la Bibliothèque nationale. A la différence de son voisin de palier, le CCN 2, la base LAMECH ne prévoit pas la mise en place de relais régionaux, ce qui n'empêchera pas l'expression des participants qui pourront transmettre et afficher en ligne leurs propositions de modifications, la CNCIM devant faire l'interface entre les « généralistes » (BN et BPI) et les experts spécialisés. On entend ici par experts,. des établissements qui, par leur volume d'acquisitions dans un domaine donné, ont déjà une pratique d'indexation reconnue. Leur avis porte sur deux points : opportunité de créer une nouvelle vedette et terminologie à employer d'une part, liens hiérarchiques et associatifs avec d'autres vedettes d'autre part. Ces deux points seront séparés, priorité dans le temps étant donnée au premier, afin de ne pas retarder les établissements participants dans leur travail. En attendant le démarrage informatique prévu sur le SUNIST (Serveur universitaire national pour l'information scientifique et technique) pour la fin de l'année, la CNCIM a mis en place un dispositif d'aide aux utilisateurs. Première étape : un manuel d'indexation, régulièrement mis à jour, et qui explicite la norme et, surtout, qui répertorie des listes de subdivisions applicables aux vedettes, domaine par domaine.

Un retirage des microfiches matières de la Bibliothèque nationale a été effectué (avec son accord) et est fourni gratuitement aux premiers utilisateurs en attendant la première édition de LAMECH.

LAMECH toutes directions

LAMECH, comme, en revanche, son nom l'indique, est une liste d'autorité de matières hiérarchisée dont le noyau est constitué par la liste de la Bibliothèque nationale 3. Au moment du chargement, la base contenait 100 064 entrées dont 35 339 noms communs, 13 013 géographiques, 20 335 noms de personnes et 31287 termes exclus. Il se rapproche des thésaurus en donnant pour chacun des termes retenus ses liens avec les autres termes : synonymie, association et hiérarchie (cf. l'encadré Relations tous azimuts). Il en va de même avec la présence de notes d'application qui accompagnent un certain nombre de vedettes et les subdivisions de forme et de sujet et qui en précisent le mode d'utilisation. Par rapport au système traditionnel de vedettes matières en France, l'hérésie la plus évidente consiste en l'utilisation fréquente du pluriel, mais cette hérésie de forme ne fait que substituer une convention à une autre... Il s'en rapproche par contre en conservant une structure à caractère précoordonné, créant des vedettes dont les différents éléments doivent suivre un ordre précis (en général tête de vedette/subdivision géographique/subdivision de sujet/subdivision chronologique) 4.

Le souci de cohérence se traduit par un contrôle assez strict des constructions. Par exemple, il n'est possible d'employer deux subdivisions de sujet dans la même vedette que dans certains cas, recensés par la liste; ainsi Biographie utilisée après le nom d'un personnage, se voit subdivisée à son tour: Biographie--Ancêtres, est suivi dans LAMECH par Biographie--Carrière professionnelle, Biographie--Demières années et mort, Biographie--Famille, Biographie--Mariage, etc. (Rappelons qu'il est toujours possible de s'en tenir à la seule Biographie pour indexer son fonds...). De même la mise en relation de deux concepts n'est-elle pas libre, mais fait l'objet d'entrées spécifiques : Eglise et Etat, Enseignement professionnel pour les femmes, etc.

Dilection Alexis

A partir de ces quelques indications, on pourrait craindre que le maniement de LAMECH ne s'avère quelque peu malaisé pour l'utilisateur non expérimenté. C'est à ce stade qu'intervient ALEXIS, le logiciel de gestion et de consultation qui a été retenu. Précisons tout de suite qu'ALEXIS, mis au point par la société ERLI (Société d'étude et de recherche en linguistique et informatique), est un logiciel de gestion de dictionnaires terminologiques développé dans une perspective d'analyse de questions en langage naturel. Sa grande souplesse lui permet de s'adapter à des applications très diverses; des développements logiciels sont en cours pour en simplifier l'utilisation dans le cadre de LAMECH, mais la base est d'ores et déjà opérationnelle. Sans entrer dans le détail des principes d'organisation d'ALEXIS (cf. l'encadré Graphies-types), il est bon de pouvoir préciser ses traits les plus caractéristiques.

D'une part ALEXIS gère des lexies dont le type est défini dans LAMECH par le vocabulaire (noms propres, noms communs, noms géographiques, etc.), mais aussi par la syntaxe de la liste subdivisions (géographique, chronologique, de sujet, etc.); d'autre part ALEXIS gère les relations que ces lexies ont entre elles (dans le cas de LAMECH synonymie, termes associés, termes spécifiques ou génériques, notes...), tout en distinguant les différents unitermes composant une lexie composée. Concrètement, ce schéma signifie qu'il est possible de dériver d'une expression quelconque vers les autres lexies comportant l'un de ses composants : de la lexie Abominable homme des neiges il serait possible de naviguer au choix, sans avoir à refaire une équation de recherche, dans l'une ou l'autre des directions suivantes, chacune des étapes intermédiaires correspondant bien entendu à plusieurs nouvelles possibilités de bifurcation, grâce aux différentes. relations hiérarchiques associées à chacun des termes :

Homme - Chute de l'homme - Bien et mal - Tentation, etc. Neiges - Précipitations (météorologie) - Physique des nuages, etc.

Parallèlement, ALEXIS prévoit la possibilité de mener une recherche booléenne, utilisant les opérateurs logiques classiques et, ou, sauf auxquels s'ajoutent des opérateurs d'adjacence, qui permettent d'entrer les termes d'une recherche dans un ordre donné; ce biais permet de résoudre le dilemme classique posé par l'équation de recherche Histoire et Philosophie qui, dans une démarche strictement booléenne, donne des références sur l'histoire de la philosophie et la philosophie de l'histoire. Dans le même esprit il est également possible d'introduire la notion de proximité entre les différents termes d'une interrogation, de manière à pouvoir tomber sur le terme adéquat à partir d'une interrogation mal formulée ; c'est ainsi qu'une interrogation sur Privilèges diplomatiques qui est erronée débouchera malgré tout sur Privilèges et immunités diplomatiques qui est la vedette retenue dans la liste. Enfin, le dispositif de correction orthographique d'ALEXIS permet de passer du singulier au pluriel pour un terme donné et d'afficher tous les mots ayant une orthographe voisine.

Les développements en cours mettront ces possibilités en oeuvre automatiquement, sans qu'il soit besoin d'apprendre une syntaxe particulière, et afficheront en réponse une liste de termes triés par ordre de pertinence décroissante par rapport à la formulation de la question. Des recherches plus circonscrites resteront néanmoins possibles pour les utilisateurs avertis.

LAMECH plus ultra

On aura compris, à l'exposé rapide de ces différentes fonctionnalités, qu'ALEXIS, avec ses compléments « lamechiens », est un logiciel d'aide à l'interrogation extrêmement performant - des prestations qui sont à mettre en regard de ses orientations générales, puisque ALEXIS sert de base à une nouvelle version (dont la mise en service est prévue pour 1987) de l'interrogation de l'annuaire électronique (partie « professions »); son caractère spectaculaire se mesure au fait que, par exemple, elle est capable de proposer, en réponse à la question « j'ai mal aux dents », la rubrique « chirurgiens-dentistes et docteurs en chirurgie dentaire »..., ce qui ne veut pas dire pour autant que ce genre de choses sera immédiatement possible dans LAMECH, dont le nombre d'entrées est beaucoup plus important. Pour en revenir à l'application LAMECH, le couple « liste + logiciel » apparaît devoir constituer à la fois un instrument d'indexation et de recherche à vocation grand public. Par son mode de fonctionnement (feuilletage, navigation, réinterprétation automatique de la demande), LAMECH permet (permettra) de dépasser le dilemme classique entre la précoordination (pertinence et précision de l'indexation, mais nécessité pour l'utilisateur d'en avoir compris les principes élémentaires, sous peine d'échouer dans sa recherche) et la postcoordination (indexation plus souple, mais nécessité pour l'utilisateur de formuler des équations de recherche pertinentes, équations qui se compliquent au fur et à mesure qu'on raffine les opérateurs d'interrogation). La possibilité d'accéder aux différents mots qui composent une vedette, de les retrouver quelles que soient leur place et leur « distance » au sein de la vedette, permet de combiner les avantages respectifs de la précoordination et de la postcoordination. Il va de soi que ce principe de fonctionnement impose un mode de recherche en deux étapes: d'abord accès à la base LAMECH de manière à affiner la question et à mettre au point la formulation la plus adéquate, ensuite accès au catalogue avec affichage des références existantes sous le terme le plus pertinent. Mais c'est vers ce schéma que s'orientent actuellement les recherches pour les OPAC 5, ce qui ouvre des perspectives prometteuses pour l'avenir.

L'avenir de LAMECH, pour l'instant, consiste en une première phase d'ouverture (formation et tests), phase qui devrait démarrer au début de l'année 1987. D'ores et déjà l'application concerne les bibliothèques dotées de systèmes SIBIL et MOBICAT; s'y ajoutent tout le réseau des centres régionaux de documentation pédagogique et quelques établissements (Bibliothèque du Musée de l'homme, bibliothèques municipales de Lyon, Grenoble et Rennes). Le chargement de LAMECH sur la base LIBRA devrait susciter d'autres adhérents. Dans l'immédiat, l'action de la CNCIM se concentre sur la formation, et, en premier lieu, sur la formation de formateurs qui devrait être systématiquement entreprise dès que seront redéfinies les modalités de la formation professionnelle.

Ces perspectives signifient, à plus ou moins long terme, une redéfinition très complète des procédures de catalogage et, partant, des fonctions professionnelles. Lorsqu'il suffira de consulter une base bibliographique pour pouvoir charger, non seulement la notice bibliographique, mais aussi les vedettes matières qui lui sont associées, on pourrait supposer que la fonction de catalogage deviendra marginale. L'épure pourrait cependant être moins simple - car ce schéma suppose l'utilisation d'un vocabulaire d'indexation uniforme; une opération anti-Babel en quelque sorte, les indexeurs de toutes les bibliothèques de France et de Navarre parlant le même langage. Pourquoi pas, si le public, comme nous l'avons dit tout à l'heure, se voit doter de logiciels d'aide à l'interrogation adaptés ? Mais il ne faut pas oublier que la CDU (Classification décimale universelle), il y a presque un siècle, affichait des ambitions similaires à l'échelle mondiale... Un programme qui nous incite à être prudents même si nous nous bornons à la France.

Illustration
Graphies-types

Illustration
Relations tous azimuts (1/2)

Illustration
Relations tous azimuts (2/2)

  1. (retour)↑  A l'exception de la liste Biblio, mais il s'agissait plus d'un outil de référence parmi d'autres que d'une liste d'autorité. Cela n'ôte rien au rôle de précurseur qu'elle a joué en France.
  2. (retour)↑  Cf. pour la présentation de la liste de la Bibliothèque nationale, l'article de Suzanne JOUGUELET, « Un Réseau de vedettes matières : le répertoire de l'Université Laval à la Bibliothèque nationale », Bull. Bibl. France, t. 28, n° 4, 1983, p. 383-389.
  3. (retour)↑  Rappelons que la CNCIM est hébergée dans les locaux du CCN (5 rue Auguste Vacquerie 75016 PARIS Tél. (1) 47 20 82 33)
  4. (retour)↑  Pour les exceptions à cette règle, nous renvoyons au manuel d'indexation LAMECH
  5. (retour)↑  Cf. L'article de Nathalie MITEV, « L'automatisation des catalogues : interaction utilisateur-système », dans ce même numéro.