L'informazione multimediale dal presente al futuro

le prospettive del multimedia information retrieval A cura di Roberto Raieli

par Philippe Marcerou
Roma, AIB Lazio, 2005, 190 p., ill., 21 cm.
ISBN 88-7812-161-4 : 30 €

L’Associazione italiana biblioteche (AIB, section du Latium) a confié à des bibliothécaires et documentalistes coordonnés par Roberto Raieli la rédaction d’un ouvrage collectif  1 sur le « MultiMedia Information Retrieval » (MMIR). On pourrait définir le MMIR comme un système d’information documentaire multimédia qui inclurait les procédures, procédés, techniques, méthodes et outils qui permettent à un bibliothécaire ou à un documentaliste de décrire un objet ou une information, quel qu’en soit le support (texte, film, son, image fixe, objet, etc.), et à un usager de le retrouver, quelque forme que prenne l’expression de sa requête (texte, dessin, son, etc.). Il s’agit à la fois d’une description des objets, d’une exploration des contenus et d’un système de recherche.

Un ouvrage et des procédés complexes

L’ouvrage se compose de deux parties. La première, consacrée à des définitions et à une position du sujet, comporte une introduction générale de Roberto Raieli et un long article qu’il a écrit avec Piera Storari sur le « Projet d’expérimentation du MMIR à la bibliothèque des arts de l’université de Rome-III », qui couvre un spectre documentaire aussi vaste que celui des départements spécialisés de la Bibliothèque nationale de France et de l’Institut national d’histoire de l’art : c’est autour de ce projet complexe, piloté par Roberto Raieli, qu’ont émergé les initiatives les plus innovantes. La seconde partie propose des études de cas et des comptes rendus d’expériences : la présentation d’un livre sur le MMIR par Massimiliano Tosato, une étude sur « Les archives photographiques et les systèmes de catalogage collectif des images » et une autre étude intitulée « Le système de références numériques : la médiation et les ressources multimédias » précèdent un article de Domenico Bagliolo qui décrit les chaînes de traitement (workflow) et la recherche documentaire appliquée à l’information non textuelle ; Perla Innocenti et Roberto Raieli s’interrogent sur les principes d’organisation du MMIR ; enfin, Pasquale Savino, Giuseppe Amato, Claudio Gennaro et Fausto Rabitti décrivent « Milos : un système de management des contenus pour un développement des bibliothèques numériques ». Une très riche bibliographie complète l’ouvrage.

La seule lecture des titres des articles et des contributions permet de comprendre la complexité et l’ambition du propos. Les intervenants s’accordent à dire que les procédés (catalogage, indexations, métadonnées, etc.) qui permettent de faire une recherche sur la forme et le contenu d’un texte fonctionnent correctement, pour peu qu’on favorise une interrogation croisant tous les moyens possibles, y compris le langage naturel, et qu’on renonce à la croyance d’une adéquation parfaite entre requêtes et résultats. Tous les auteurs s’accordent aussi à dire que chaque support d’information appelle un traitement documentaire spécifique : reconnaissance de formes, analyse de sons, métadonnées normalisant des titres, indexation du contenu, etc. Le MMIR trouve sa raison d’être dans le traitement informatique de cette complexité : sa mise en œuvre n’a de sens, comme à la bibliothèque des arts de l’université de Rome-III, que si on a affaire à des supports documentaires variés et si on doit servir un public spécialisé rompu à l’interdisciplinarité et à la recherche sur plusieurs médias.

Pour une requête naturelle

Le MMIR décrit le plus précisément possible la forme et le contenu de l’objet ou du document et donne parfois accès à la représentation de l’objet lui-même. Il s’appuie, peu ou prou, sur la théorie des ensembles flous : combinés entre eux, les procédés qui composent le MMIR permettent des approximations raisonnables sur lesquelles s’appuie la recherche. Loin de la fiction que bibliothécaires et documentalistes parviendraient à décrire un objet ou un document de manière univoque grâce à des langages normés inventés par eux et fondés sur des descripteurs combinés (thesauri, listes contrôlées, langages d’indexation, etc.), le MMIR postule que l’usager sera capable de formuler sa requête grâce à un code simple (forme, son, langage naturel, etc.). Pour que l’usager en soit capable, le système informatique devient l’interface entre lui et le document : il doit à la fois être capable de décrire, d’analyser et de reconnaître les caractéristiques intrinsèques des objets de recherche et permettre à l’usager de proposer sa requête par tous les biais possibles et, le cas échéant, lui suggérer des pistes nouvelles si sa recherche initiale ne lui donnait pas satisfaction. Ainsi, une personne qui chercherait un morceau de musique doit pouvoir le retrouver par son titre, son auteur ou les références d’un enregistrement, mais aussi en fredonnant un air ou en formulant une requête fondée sur quelques mesures.

Le MMIR est encore au stade de l’expérimentation : certains intervenants parlent, à son sujet, de « science fiction ». Pourtant, les principaux moteurs de recherche, les outils de référencement informatique, certains systèmes informatiques de gestion documentaire fondés sur des procédures de moissonnage et d’interrogation croisées de contenus, de métadonnées, de liens, de formes et de sons en ont fait une voie de développement. Si les techniques du MMIR étaient, à l’avenir, plus largement diffusées dans les bibliothèques, bibliothécaires et documentalistes auraient enfin les moyens de proposer aux chercheurs des modes de recherche proches de l’expression naturelle : ils abandonneraient ainsi leur rôle d’interprètes pour celui de chefs d’orchestre.