L’indexation matière en transition

De la réforme de Rameau à l’indexation automatique

Cécile Kattnig

Étienne Cavalié (dir.)
L’indexation matière en transition : de la réforme de Rameau à l’indexation automatique
Éditions du Cercle de la librairie, 2019
Collection « Bibliothèques »
ISBN 978-2-7654-1623-4

Le ton est donné dès l’introduction : « La structuration de cet ouvrage s’est définie, […] des conditions d’indexation aux conditions d’utilisation, de manipulation de cette indexation [et] suscité notamment par l’actualité autour de la réforme de Rameau et de l’implémentation du modèle LRM – Library Reference Model – dans le cadre de la transition bibliographique en France. »

Cet ouvrage arrive à point nommé et rassemble les trois parties suivantes : « Contexte normatif et transition », « Indexation comme contexte à l’intérieur d’une collection », « Indexation comme appui à une offre de services » à partir de retours d’expériences et d’exposés de treize collaborateurs. Étienne Cavalié, qui a dirigé l’ouvrage, participe, comme beaucoup des contributeurs, au programme de la Transition bibliographique 1

X

https://www.transition-bibliographique.fr/ pour suivre les travaux des deux agences bibliographiques nationales.

. Il est également coauteur de l’ouvrage Expérimenter les humanités numériques : des outils individuels aux projets collectifs, consultable en ligne, et auteur d’un blog depuis 2008 consacré à l’informatique documentaire Bibliothèques (reloaded)» 2.

La première partie fait le point sur les travaux actuels en France, en matière de normalisation et d’implémentation du modèle IFLA LRM par les deux agences nationales, l’ABES et la BnF, avec un développement sur les langages Rameau et Dewey. La deuxième partie déroule ses exposés depuis une méthode d’analyse des données d’indexation jusqu’à des exemples de chantiers semi-automatiques et à la production de nouvelles métadonnées par l’indexation automatique à travers des corpus de Gallica. La troisième partie s’attache à la présentation d’applications pour développer des services, de l’analyse de pratiques d’indexation collaborative à la réalisation de médiations numériques.

Indexation et grammatisation

Le premier chapitre de Bruno Bachimont est une ouverture au sujet même de l’ouvrage : l’indexation. Bruno Bachimont revient sur « l’indexation et la recherche d’information qui lui est associée » en l’inscrivant dans un contexte renouvelé et dynamique de ce que l’auteur appelle la « grammatisation des contenus ». La grammatisation est « un processus qui rend plus manipulables les supports matériels des contenus ». Ceux-ci, décomposés en fragments annotés, peuvent ainsi être recomposés pour « dégager des structures inédites ». Cette structure s’appuie sur la distinction que l’auteur fait entre les UTM (unités techniques de manipulation) tels le pixel pour la photographie ou la feuille pour le livre, UTM définies a priori du fait du formatage de l’inscription sur un support, et les USI (unités sémiotiques d’interprétation) dégagées par l’interprétation et qui s’opère ici a posteriori. Ces démarches et analyse conduisent à distinguer trois catégories ou paradigmes de recherche associés : le paradigme des bases de données, le paradigme de l’indexation et le paradigme de l’exploration des données. Pour Bruno Bachimont, ces paradigmes sont distincts mais résolument complémentaires selon le lien établi (structuré ou non structuré) entre contenus et structure, « chacun permettant de traiter des situations particulières ». « Leur apparition successive permet cependant de mieux comprendre l’apport réel de chacun, de les spécialiser et de les adapter selon leur mérite propre et efficacité. »

Contexte normatif et transition bibliographique

Dans le chapitre intitulé « Le sujet dans le modèle IFLA LRM » 3

, Françoise Leresche 4
X

Responsable du groupe « Normalisation, de la Transition bibliographique, Chargée de normalisation documentaire, BnF.

replace la dimension « sujet » dans les objectifs du catalogage, objectifs qui sont placés au cœur de la démarche de modélisation. Elle rappelle que le modèle identifie 5 tâches utilisateurs – Trouver, Identifier, Sélectionner, Obtenir, Explorer – qui font écho à la recherche d’information. Parmi les 11 entités définis par le modèle (Œuvre, Modélisation, Expression, Item, Res, Nomen, etc.), l’indexation se situera au niveau de l’entité Œuvre, la création intellectuelle étant porteuse du sujet (exprimé par les entités concepts, lieux, laps de temps, etc., gérées dans des langages documentaires comme Rameau ou par des indices de classification comme Dewey). Le sous-groupe « Concept-Lieu-Temps » travaille sur les sous-entités Concept, Genre/forme, Événement ainsi que Lieu et Laps de Temps au sein du programme Transition bibliograhique.

Florence Ménard, dans son chapitre sur la réforme Rameau 5

X

Réformer Rameau : suivre les étapes : https://rameau.bnf.fr/syntaxe/reformer

mentionne la première étape de suppression des exceptions dans les règles syntaxiques du langage Rameau, de nettoyage des listes terminologiques en vue d’une liste unique ainsi que de la rédaction de la partie de RDA-FR sur les « lieux ». Le propos très vivant et illustré d’Ewa Nieszkowska-Serlan sur l’évolution de Rameau est une analyse critique et historique de ce langage, prenant en compte tout ce qui a concouru à sa situation actuelle, tant en visibilité qu’en structuration de langage, qui complète celle de Sonia Combe en 2013 6
X

Sonia Combe, D’Est en Ouest, retour à l’archive, suivi de La langue de Rameau, Éditions de La Sorbonne, 2013.

.

Le chapitre portant sur la classification Dewey, rédigé par Jean Maury, confirme l’utilisation de cette classification pour sa valeur thématique et indiciaire. Les expérimentations norvégiennes 7

et allemandes 8 d’outils d’aide aux alignements présentées à l’IFLA 2018 en sont des illustrations. La communauté francophone a beaucoup investi dans la traduction de la Dewey, indispensable dans les projets d’alignement. L’ombre à ce paysage reste le modèle économique, modèle propriétaire qui est une contrainte pour l’utilisation des données et des produits issus des tables.

Vous aurez compris qu’il vous faudra suivre les formations proposées et les travaux de la transition bibliographique pour prendre la mesure des réalisations en cours et des questions en suspens, notamment sur le projet du Fichier national des Entités qui devrait intégrer les entités utilisables en indexation 9

L’indexation comme contexte au sein d’une collection

La méthode et l’analyse faites par François Pichenot 10

X

Responsable du pôle Société, sciences et numérique, Médiathèque de Roubaix.

(chapitre 6) à partir des données d’indexation issues de langages existants et de référentiels ajustés au niveau local sont un exemple dont peuvent s’inspirer d’autres bibliothèques pour leur politique de catalogage, d’indexation et également d’étude d’offres de services (p. 79-98).

Trois réalisations d’indexation matière présentées dans le chapitre sur des chantiers d’indexation rétrospective (chapitre 7) mettent l’accent sur des alignements partiels réalisés à partir de corpus définis : correspondance LCSH/Rameau pour les e-books, conversion semi-automatique en indexation Rameau et parfois indice Dewey de corpus imprimés identifiés à partir de lettrages issus de la cotation Clément, lettrages qui désignaient de grands domaines disciplinaires.

Jean-Philippe Moreux (chapitre 8) dresse une « cartographie pragmatique des méthodes d’indexation automatique de collections de documents numériques grâce à l’application de traitements informatiques à partir d’une typologie de pratiques » (fouille de contenus, production de métadonnées) sur une diversité d’objets. La description est très pédagogique et illustrée sur différents types d’indexation portant notamment sur les contenus textuels et multimédias 11

X

Atelier du programme Corpus « Explorer des corpus d'images. L’IA au service du patrimoine, avril 2018 : https://bnf.hypotheses.org/2809

. L’auteur nous alerte sur la nécessité d’anticiper les effets de l’automatisation sur les métiers actuels  12
X

« Le patrimoine numérique national à l’heure de l’intelligence artificielle. Le programme de recherche Corpus comme espace d’expérimentation pour les humanités numériques » par Emmanuelle Bermès et Eleonora Moiraghi, in : Revue d'intelligence artificielle, 2019 (à paraître). En ligne : https://hal-bnf.archives-ouvertes.fr/hal-02122073/document

.

Il ressort de l’exposé de David Guillemin (chapitre 9) sur la formation à l’indexation dans l’enseignement supérieur en France pour une insertion en bibliothèque de lecture que l’offre est importante ; il semble toutefois que l’articulation avec la dimension « médiation » soit peu perceptible, ce qui rend souhaitable des rencontres professionnelles nationales.

L’indexation comme appui à une offre de services

Hélène Cavalié présente un état de l’art de l’indexation collaborative « ordonné par univers de besoins », de ses avantages et limites pour les institutions, avec des exemples de différentes pratiques : notations ou commentaires proposés, intégration de critiques issues d’un service en ligne annoté, indexation ouverte aux enseignants, projets spécifiques comme Bentham Projet, PhotoNormandie, lesherbonautes ou encore le développement de plateformes de transcription collaborative. Pierre Bournerie (chapitre 11) décrit l’expérimentation réalisée à la bibliothèque de Fresnes d’une navigation par facettes proposée sur le portail par l’exploitation des relations entre concepts du langage Rameau et leur affichage sous forme de graphe. Pour permettre aux acquéreurs du SCD de l’université de Nice d’accéder aux données utiles pour ajuster leur politique documentaire, Géraldine Geoffroy (chapitre 13) a conçu une interface qui exploite notamment les indices Dewey. Bernard Strainchamps, auteur du site Bibliosurf 13

X

Bernard Strainchamps est webmestre, bibliothécaire, libraire, auteur du site Bibliosurf : https://www.bibliosurf.com/

, témoigne [chapitre 12] de ses expériences d’enrichissement des données et de la médiation sur les ressources. Dans le dernier chapitre, « Visualiser l’indexation », Raphaëlle Lapôtre fait le choix d’une réflexion théorique. Elle met en évidence, à la lecture de travaux 14
X

Ancestral Connections : Art and an Aboriginal System of Knowledge, par Howard Morphy, 1991 ; Knowledge and Power in Prehistoric Societes : Orality, Memory, and the Transmission of Culture, par Lynne Kelly, 2015 ; Epistemology of Wandering, Tree and Taxonomy, par Sigrid Weigel, in : Images Re-vues, hors-série n° 4, 2013 (en ligne : https://journals.openedition.org/imagesrevues/2934).

, « les techniques de gestion des connaissances de l’oralité » des sociétés préhistoriques intégrant topographie et lieux de savoir ainsi que « le désordre organisé » de la bibliothèque de Warburg basé sur les relations entre les ouvrages selon sa perception – les lieux de sens. Raphaëlle Lapôtre insiste dans sa conclusion sur le rôle des professionnels des sciences de l’information dans la participation aux travaux de modélisation en termes de « lieux indéfinis et communs de significations », dans le mouvement des humanités numériques.

Matière à penser

L’intérêt de cet ouvrage est de rassembler réflexions et expérimentations en contexte de transition bibliographique avec des questions ouvertes pour les années à venir : la mise en place progressive du Fichier national des Entités, l’évolution méthodologique du langage Rameau, les conditions d’appariement avec d’autres référentiels, les nouvelles expérimentations d’indexation automatique.