entête
entête

Indexation

mode d'emploi international

Suzanne Jouguelet

La section de classification et d'indexation a organisé à Lisbonne les 17 et 18 août, dans le cadre du congrès de l'IFLA à Barcelone, une « réunion-satellite » sur « l'indexation matière : principes et pratiques dans les années 90 * ». Ce séminaire, qui a rassemblé une soixantaine de participants, était hébergé dans des conditions très agréables, (la qualité de l'accueil des collègues portugais n'est plus à démontrer), par la Bibliothèque nationale du Portugal, dont la nouvelle dénomination est : Instituto da Biblioteca nacional e do Livro, par suite de sa fusion avec l'Institut qui gère le réseau de lecture publique.

L'auditoire était majoritairement composé de bibliothécaires portugais, mais divers pays étaient représentés (Arabie saoudite, Brésil, Espagne, France, Suisse, Suède), sans compter les nationalités diverses des intervenants.

Les objectifs du séminaire étaient de dresser un panorama international des systèmes d'accès par sujets et d'exposer les questions que soulève actuellement le développement de ces systèmes. Aux deux journées ont correspondu deux sessions : la première a présenté le panorama des systèmes et des pratiques dans onze pays (cf. tableau). La seconde a évoqué certains des problèmes posés par l'indexation-matière.

Panorama des systèmes

Plusieurs remarques à propos de cette première session : une évolution historique semble courante dans plusieurs pays : le premier type d'accès par sujets a souvent été systématique et lié à une classification ; puis le besoin d'un accès plus analytique, par mots, a entraîné le développement des vedettes matières et ultérieurement de la recherche par mots.

Une constatation aisée et quasi unanime a été faite : la normalisation est beaucoup plus lente et difficile dans le domaine de l'indexation que dans celui du catalogage descriptif ; néanmoins la tendance générale - provoquée surtout par l'automatisation et le travail en réseau - est à une harmonisation des accès par sujets, souvent liée à l'adoption d'un répertoire commun.

Le poids des contraintes économiques est lourd en matière d'indexation, car elle est coûteuse (temps lié à l'analyse du contenu + moyens techniques).

L'exemple le plus frappant dans ce sens est celui de la Grande-Bretagne, qui, dans le cadre d'une réduction des coûts de catalogage a renoncé, pour son « National Bibliographic Service », à l'utilisation du système PRECIS début 1991. Ce système, avec une indexation en chaîne préservant le contexte et un jeu automatique de permutations, alimentait entre autres l'index de la bibliographie nationale. Il a été remplacé par un système d'indexation beaucoup plus sommaire (COMPASS) qui repose sur le principe que les clés d'accès qu'on trouve ailleurs dans la notice n'ont pas à être reprises dans l'accès par sujets, d'où un appauvrissement de l'accès, surtout sous forme papier.

La British Library n'a pas encore pris d'engagement ferme quant à sa future politique d'indexation matière ; l'une des raisons en est le système de catalogage partagé entre six bibliothèques qui reçoivent le dépôt légal. Cinq de ces bibliothèques pratiquent les Library of Congress Subject Headings (LCSH) et pressent la British Library d'adopter à nouveau le répertoire américain.

La famille des LCSH

Le sigle qui est revenu le plus souvent est sans conteste celui de LCSH, puisque ce répertoire américain, créé il y a presque un siècle, a engendré une grande famille de répertoires adaptés et traduits (cf. tableau).

Le point le plus délicat dans son utilisation réside dans l'inadaptation à des particularités culturelles et linguistiques autres qu'américaines : deux communications (présentant l'indexation au Canada et en Iran) ont insisté sur cet aspect.

Les spécificités canadiennes (système parlementaire, bilinguisme, populations aborigènes...) ont entraîné l'élaboration d'une liste complémentaire de LCSH : Canadian Subject Headings, tenue à jour par la Bibliothèque nationale. Pour la langue française, le Répertoire de vedettes matières, créé par l'université Laval, traduit à la fois LCSH et CSH. Le titre de la communication canadienne était révélateur : « Un équilibre délicat entre conformité et divergence ». Les domaines de divergence sont sans surprise : périodes historiques et littéraires, politique, éducation, groupes culturels...

Pour l'Iran, la List of Persian Subject Headings n'est pas une traduction mot à mot, mais une adaptation aux réalités historiques et culturelles du pays. Les questions de langue et d'écriture jouent évidemment beaucoup.

Loïs Mai Chan, auteur d'un manuel connu sur LCSH, a montré l'évolution de la liste vers plus de souplesse et vers des possiblités de combinaisons pas forcément exprimées telles quelles dans la liste. Elle a évoqué les cas où ce système, pilier de la précoordination, a recours à la post-coordination.

Autres systèmes

Les systèmes présentés n'appartenant pas à la famille des LCSH sont:
- allemands (RSWK, Regeln für den Schlagwortkatalog : règles de catalogage matière) et SWD, Schlagwortnormdatei : fichier d'autorité de descripteurs),
- anglais (PRECIS, mais on a évoqué les évolutions récentes et le retour probable à LCSH),
- espagnols, avec une liste de vedettes matières dont le noyau a été élaboré par le ministère de la Culture, - français, pour l'indexation qui ne relève pas de RAMEAU, par exemple celle qui suit MOTBIS, un thésaurus créé pour le réseau des centres de documentation de l'enseignement secondaire, ou les réflexions sur le processus d'indexation menées par l'Institut national de l'information scientifique et technique (INIST) à partir du lexique PASCAL.

D'autres systèmes s'inspirent de la logique précoordonnée des LCSH, mais n'en reprennent pas le vocabulaire (SIPORbase au Portugal, par exemple) ; - les difficultés générales évoquées à propos des différents systèmes ont été la formation des personnels, l'évolution du vocabulaire et les problèmes de mise à jour, l'adaptation parfois difficile à des types de documents divers.

Les atouts résident dans les progrès de l'automatisation et du travail en réseau : exemple de la coopération en Allemagne entre la Deutsche Bibliothek à Francfort et des réseaux régionaux ; exemple du projet portugais CLIP : travail commun entre la Bibliothèque nationale et 70 institutions portugaises pour la normalisation des langages documentaires utilisés par différents organismes dans les mêmes domaines thématiques.

Questions théoriques

La deuxième session a abordé des questions plus « théoriques » liées à l'indexation matière.

- Les rapports - malheureusement assez inexistants - entre monde de l'indexation et monde de la terminologie : un panorama international très détaillé des méthodes, des organismes et des réseaux de la terminologie a été présenté ; mais les banques de données terminologiques, qui recueillent le plus souvent des termes spécialisés dans un domaine particulier, ont très peu de liens avec le monde de l'indexation.

- L'importance et la difficulté de la normalisation dans le domaine de l'accès par sujets ont aussi été évoquées. L'importance est accrue par plusieurs facteurs : l'internationalisation croissante de la recherche et de l'édition ; la facilité des communications électroniques ; le besoin pour les bibliothèques de réduire les coûts et de partager les ressources. Différents niveaux de normalisation, plus ou moins contraignants, ont été évoqués (guides, recommandations, normes...). L'analyse par sujets, processus très coûteux en temps, est difficile à normaliser, surtout internationalement, pour des problèmes de langues, de procédures, de réalités culturelles.

La publication prochaine des Guidelines for Subject Authority and Reference Entries, à la suite des réflexions d'un groupe de travail de la section « Classification et indexation », témoigne de cet effort de normalisation internationale sur l'établissement de la terminologie et des relations entre termes. L'important pour l'avenir est probablement la compatibilité et le passage d'un langage à l'autre dans une perspective multilingue.

- La complémentarité entre langage naturel et langage contrôlé a été soulignée. Elle s'inscrit dans la question plus large de l'adéquation entre indexation et recherche par l'utilisateur. La pertinence d'une réponse est étroitement liée à la possibilité de prévoir les modes d'expression des concepts et aux relations entre concepts dans la base de données.

- Le thème le plus approfondi - évoqué également par plusieurs intervenants de la première session - a été sans conteste celui des avantages respectifs de la pré et de la post-coordination. Ces deux familles d'indexation (grossièrement : par vedettes matières construites ou par mots) se distinguent par la personne qui opère la combinaison entre les termes (l'indexeur ou l'utilisateur final), par le stade auquel elle est faite (à l'indexation ou à la recherche) et enfin par la façon dont les termes sont combinés (syntaxe grammaticale ou syntaxe logique avec logique booléenne).

Un panorama historique des deux familles a été brossé, puis elles ont été évaluées en fonction de critères multiples. Un langage précoordonné augmente la précision et la spécificité ; il guide mieux l'utilisateur par des associations d'idées et le respect du contexte ; il permet la structuration et la consultation de gros fichiers. Un langage post-coordonné est moins lourd et donc moins cher à gérer ; il admet plus facilement des termes nouveaux. Les inconvénients des vedettes construites sont surmontés par les facilités d'accès par mots dans les systèmes en ligne.

Les réflexions - très riches - de cette deuxième session n'ont toutefois pas à mon sens couvert de façon assez systématique les axes de recherche en indexation. J'avais modestement essayé, dans la première session, de les évoquer pour la France et j'avais cité l'assistance linguistique à la fois pour l'indexation et pour la recherche, la modélisation du processus d'indexation et l'élaboration de bases de connaissance opérées à l'INIST, l'enrichissement des notices du catalogue par les tables des matières, résumés, etc. tous ces moyens contribuant au même objectif : améliorer l'accès au contenu des documents.

Illustration
Liste par pays

  1.  (retour)↑  La publication des communications est prévue dans ICBC (International Cataloguing and Bibliographic Control).