Journée professionnelle « Données à voir : les fonds photographiques au défi de la description »

Bibliothèque municipale de Lyon, département de la Documentation régionale et du Dépôt légal – Auvergne-Rhône-Alpes Livre et Lecture, 28 novembre 2023

Béatrice Michel

Le 28 novembre 2023, la Bibliothèque municipale de Lyon (BmL) proposait à la bibliothèque de la Part-Dieu la rencontre « Données à voir : les fonds photographiques au défi de la description », organisée par le département de la Documentation régionale et du Dépôt légal et Auvergne-Rhône-Alpes Livre et Lecture (ARALL). Près de 80 personnes ont assisté à cette journée durant laquelle les intervenants se sont succédé pour des exposés condensés, laissant la part belle aux questions de l’auditoire.

Fonds photographiques, objets triviaux

La précédente journée organisée en 2022 « Les photothèques numériques : collecte, diffusion et partage des mémoires locales », axée sur la participation des publics dans la collecte et l’enrichissement des collections, avait mis en lumière l’épineuse question des aspects juridiques de la mise en ligne. La journée du 23 novembre 2023 invitait cette fois les professionnels à réfléchir à la difficulté de trouver un langage normé adapté à leurs fonds permettant d’offrir une description des images suffisamment pertinente pour répondre aux attentes d’un public diversifié en quête d’outils de recherche facilement accessibles.

Marie Després-Lonnet, professeure des universités en sciences de l’information et de la communication à Lyon-2, autrice d’une thèse intitulée Contribution à la conception d’interfaces de consultation de bases de données iconographiques soutenue à l’université de Lille en 2000, s’est intéressée à la photographie documentaire dans différents contextes. Selon elle, la question de ce que recouvre le terme d’accessibilité est toujours ouverte : s’agit-il simplement de rendre l’image visible par tous ou de faire parvenir au public potentiel un discours sur cette image ?

Les projets de mise en ligne de fonds patrimoniaux à la fin des années 1990, à travers certaines bases très spécialisées comme la base Joconde par exemple, reposaient sur un postulat répandu alors, selon lequel mettre en ligne suffisait à rendre accessible au grand public. Or, confrontés à des outils de recherche qui requéraient la connaissance d’un vocabulaire scientifique, les néophytes ne parvenaient pas à trouver ce qu’ils cherchaient. De plus, certaines bases photographiques, notamment celles destinées à la recherche archéologique, présentent des images qui, dès leur création, répondent à un besoin spécifique des chercheurs. La question de la destination originelle des images est à prendre en compte car elles ne font pas naturellement sens pour le grand public qui les découvre. Par ailleurs, l’institution qui détient et donne à voir une image imprime également sa marque sur les objets qu’elle expose, notamment par le discours expert dont elle les encadre et les met en lien. Les photographies sont des êtres culturels « triviaux » 1

Voir Yves JEANNERET, Penser la trivialité, volume 1 : la vie triviale des êtres culturels, Paris, Éd. Hermès-Lavoisier, 2008 (coll. Communication, médiation et construits sociaux).

dont le sens évolue selon le contexte, les normes et le projet dans lesquels on les présente. Par ailleurs, penser que les données associées aux images vont pouvoir circuler libérées de leurs premières attaches est une croyance qui ne résiste pas à la réalité. Il faut au contraire assumer leur inscription dans un projet et s’appliquer à en faire comprendre la nature et la logique à celles et ceux avec lesquels on souhaite les partager.

La pertinence des thésaurus face à l’art de la description : l’avenir est-il dans l’intelligence artificielle (IA) ?

Rafaël Messiez, coordinateur de Micro-Folie à la mairie des Avenières Veyrins-Thuellin, est ensuite revenu sur son travail de description du fonds Robert Parant, journaliste indépendant, photographe attitré de la Ville de Montluçon. Déjà confronté à la problématique de la description des images lors d’un précédent projet d’artothèque pour laquelle il avait dû « bidouiller » une indexation à base de Rameau finalement peu opérante, il avait eu le sentiment de se perdre dans un grand fourre-tout.

Le projet Robert Parant s’inscrivait dans une perspective inter-services : médiathèque, musée, archives. Le logiciel Lightroom d’Adobe a rapidement été choisi pour sa prise en main facile et sa capacité à importer de conséquents thésaurus tout en suggérant automatiquement des mots. Du côté du thésaurus, c’est l’indexation Blanc-Montmayeur qui répondait le mieux au projet, ce recueil d’autorités matières ouvert et non hiérarchique a permis d’ajouter les lieux, les rues, les édifices et les personnalités. Rafaël Messiez a conclu sur une note prospective détonante : « Si c’était à refaire, je m’amuserais à rentrer un thésaurus dans Chat GPT et je lui dirais : « tu n’as le droit d’utiliser que ces mots-clés là et je lui enverrais ensuite les images à décrire. »

Ce fut ensuite au tour de Charles-Édouard Thiébaud, responsable des archives judiciaires aux Archives de l’État de Fribourg (AEF), de présenter un projet peu ordinaire mené par son institution qui vise à partager des photographies issues d’affaires judiciaires, car une partie de ces images, bien que tirées de dossiers légalement inaccessibles pendant 100 ans, sont « montrables ». Elles sont pour la plupart des preuves dans le cadre d’enquêtes, et permettent notamment d’observer l’évolution des techniques policières, de montrer des lieux insolites ou difficilement accessibles ou, plus simplement, de mesurer l’évolution des paysages. Décrire ces photos est parfois difficile, car il faut les situer géographiquement et temporellement et, enfin, choisir la juste profondeur de description permettant de toucher le plus large public.

Autant d’images que de publics

Après la pause déjeuner, Emmanuelle Royon, chargée de mission patrimoine de l’ARALL, et Danièle Méaux, spécialiste de la photographie contemporaine et professeure des universités en esthétique et sciences de l’art à l’université Jean-Monnet de Saint-Étienne, ont entamé un dialogue sur les usages et les besoins des chercheurs en matière d’indexation des images. Danièle Méaux mène actuellement un travail autour du Furan 2

Arts, recherche, territoires, savoir, université de Saint-Étienne.

, un cours d’eau qui prend sa source dans le Pilat et traverse Saint-Étienne. Son objectif est de faire dialoguer des documents d’archives avec le travail artistique du photographe Pierre Suchet. Elle fait le pari que de nouvelles connaissances peuvent émerger de la confrontation d’images documentaires et artistiques. Lors de ses recherches dans les catalogues des différentes institutions, elle dit se sentir peu à l’aise avec le vocabulaire métier des bibliothécaires, elle déplore par ailleurs l’austérité de certaines interfaces et craint que les étudiants s’y perdent si on ne les accompagne pas.

Sans transition, l’après-midi s’est poursuivie avec un retour de Carole Duguy, bibliothécaire Image & Son de la bibliothèque municipale d’Oullins, sur les ateliers d’audiodescription menés dans le cadre du dispositif Passeurs d’images proposé à la BmL en 2017. Il s’agissait d’inviter adultes et enfants à décrire les images présentées lors de deux expositions avec pour objectif premier de les rendre accessibles à des déficients visuels, mais aussi d’apprendre à lire une image, à comprendre sa structure, son cadrage, et enfin de découvrir et faire connaître les œuvres et les artistes.

Description des images : la force de la communauté

Enfin, c’est sur une table ronde autour des pratiques collaboratives et des plateformes en ligne que s’est achevée la journée. Philippe Rassaert de la BmL a présenté la plateforme Photographes en Rhône-Alpes, créée en 2010 et qui rassemble aujourd’hui près de 100 000 photographies sur la région, pour une partie issues de la contribution de photographes amateurs. La description des images reste cependant l’affaire des bibliothécaires, même si les internautes peuvent apporter leur expertise dans un deuxième temps.

Pour Plantnet, plateforme d’identification des plantes grâce à l’IA, portée par l’Institut national de recherche en sciences et technologies du numérique (INRIA), l’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) et Agropolis, présentée ensuite par Vanessa Hequet, botaniste tropicaliste, les 400 000 utilisateurs journaliers sont laissés libres de leurs descriptions. Les données fausses ne prêtent pas à conséquence sur le volume ; par ailleurs, elles sont corrigées par une importante communauté de contributeurs.

Il en est de même pour les données descriptives des images versées dans Wikimédia Commons, dont Lucas Lévêque, wikipédien expert, a rappelé l’énorme force de frappe en termes de vues (100 millions par jour) notamment grâce à l’utilisation du web sémantique qui multiplie les portes d’entrée vers les images. Là encore, la dynamique de communauté permet de mettre en commun le travail de correction.

En guise de conclusion, David Cizeron, de la BmL, Documentation régionale, a proposé une synthèse rapide de la journée : l’image s’articule autour du trio producteur-archiviste-public. Elle est tout d’abord le fruit d’un contexte et s’adresse à des destinataires précis avant de circuler mondialement sur le web. Proposer une description capable d’anticiper les attentes des publics qui pourraient la rechercher semble impossible. Nos thésaurus et nos outils de recherche sont des portes bien difficiles à ouvrir pour des non-initiés. L’utilisation de l’IA est tentante pour identifier des mots-clés, mais ne risquent-elles pas de générer une sur-description ? Il semble qu’actuellement seule une communauté engagée de contributeurs et de correcteurs puisse permettre de faire face à ces données de plus en plus massives.