Library Trends

Progress in Visual Information Access and Retrieval

par Élizabeth Giuliani
Beth Sandore, Issue Editor. Library Trends, 48 (2), Fall 1999. - Champaign, Ill. : University of Illinois, Graduate School of Library and Information Science. – 241 p.; 23 cm. - ISSN 0024-2594 : $ 18.50.

Cette livraison du périodique Library Trends publié par la Graduate School of Library and Information Science de l'Université d'Illinois, impressionne à plusieurs titres. D'une part, comme les autres, par la qualité de réflexion et la richesse de l'expérience développées aux États-Unis en matière de sciences de l'information et, plus encore, de son enseignement. D'autre part – et c'est plus particulier à ce numéro –, par l'acuité et l'actualité du propos qui remue les idées attachées traditionnellement au traitement documentaire : plaçant au centre de l'activité bibliographique, non plus la description ou l'analyse de l'information, mais sa recherche et son usage, et donc privilégiant le point de vue du lecteur et non celui du document; envisageant en outre au cœur des contenus, non plus le texte et les signes linguistiques, mais l'image et les objets sensibles. C'est la généralisation des technologies numériques à l'ensemble de la chaîne documentaire dans l'environnement Web qui explique un tel déplacement du centre de gravité des méthodes documentaires.

Un ensemble de dix articles est réparti en trois parties, allant de la théorie aux expérimentations, en passant par une deuxième partie – la plus développée – qui rend compte de programmes très variés déjà réalisés utilisant les ressources de la numérisation d'images fixes. Comme souvent dans les productions anglo-saxonnes, la part de la réflexion méthodologique est quantitativement très présente (explicitée dans des résumés, des introductions et des conclusions), mais tourne plus souvent à l'inventaire et à la compilation qu'elle ne développe une véritable problématique.

Les contributions sont d'inégale qualité, comme il se doit dans ce genre d'ouvrage collectif et du fait de la relative « nouveauté » du propos. Toutes, du moins, offrent l'intérêt majeur d'une abondante bibliographie qui révèle et accuse sans doute cette suprématie anglo-saxonne.

L’émergence de modèles

De la première partie théorique, on retiendra, visant à rationaliser les processus d'appréhension de l'image par le spectateur, l'émergence de modèles (ils sont différents, mais font le plus souvent référence aux travaux de Panofsky) pour construire des systèmes d'indexation qui leur correspondent. Ils articulent deux niveaux logiques : le plus haut (concept based, sémantique) qui passe par l'association du texte (contrôlé ou non) aux images et aux concepts qu'elles expriment ou représentent; le plus bas (content based) qui applique des traitements automatiques directement aux paramètres iconiques élémentaires (couleur, texture, forme…).

Les outils de recherche conçus et, parfois déjà mis en oeuvre dans des bases de données d'images numérisées combinent les deux niveaux et envisagent une stratégie de recherche associant sens et formes, éléments textuels et iconiques, feuilletage d'index et reconnaissance de forme.

Quoique intégré à la deuxième partie des réalisations concrètes – car il commente un test d'observation des usages d'une base d'images sur le Web, réalisé en 1997 au sein de la School of Library and Information Sciences, de l'université de Denton –, l'article de Samantha K. Hastings (p. 440-452) éclaire plutôt cette section en examinant les multiples corrélations entre les outils de recherche disponibles, spécifiques ou non à la recherche d'images, et les modes de consultation des images elles-mêmes.

Des réalisations disponibles

La deuxième partie est en effet la plus riche par la quantité des informations et leur statut. Il s'agit de réalisations réellement disponibles et conduites par des organismes documentaires. Certaines n'ont qu'une existence limitée de prototype (MESL-Museum Educational Site Licensing), d'autres sont devenues des services courants et réguliers. On s'attardera ainsi avec un grand intérêt sur l'exposé de Caroline R. Arms qui a coordonné, à la Bibliothèque du Congrès, le National Digital Program. Rendant compte d'une opération complexe (aux implications techniques, bibliographiques, juridiques…) qui associait et la Bibliothèque du Congrès et un réseau national d'organismes divers, cet article sollicite aussi bien la réflexion théorique que la prise en compte empirique des réalités quotidiennes du « bibliothécaire ».

Les éléments saillants de ce témoignage sont que la dimension technique d'une telle entreprise de numérisation est mieux assumée par le recours à la prestation extérieure d'experts (informaticiens notamment), mais que les multiples aspects de la dimension bibliographique (description, indexation, organisation des collections, processus de recherche, présentation des résultats) sont de la responsabilité du gestionnaire de collection qui, par sa pratique, « critique » et adapte les outils que mettent à sa disposition les professionnels de l'ingénierie documentaire.

L'automatisation possible de certaines procédures permet certes d'enrichir le catalogage et de proposer un traitement de l'image à l'unité quand seule celui du recueil ou du lot était envisageable dans un contexte manuel; mais le maintien du lien nécessaire de l'item à sa collection de production ou de référence est indispensable à la constitution d'un sens, d'où, pour des raisons tant pratiques (de 45 minutes à 4 heures de traitement par image) qu'intellectuelles (le feuilletage physique n'est pas le feuilletage on line), le choix de définir plusieurs « granularités » de traitement… On remarquera aussi que les avancées méthodologiques liées à la numérisation portent encore avant tout sur l'exploitation des données textuelles (recherche en texte intégral avec résultats pondérés) qui complète, et souvent supplée, la discontinuité et l'hétérogénéité des formats d'indexation.

Expérimentations

Enfin, la troisième partie, « expérimentale », fait place à des projets de recherche qui intègrent l'image à un contexte plus large, multimédia ou multimodal 1. Car, autant que les autres médias, le texte (en tant que média ou que métadonnée appliquée aux autres médias : descripteurs, légendes) est également affecté par l'expansion d'Internet. MARS (Multimedia Analysis and Retrieval System), MARIE ou autres MMIR (Multimedia Information Retrieval Systems) nous entraînent – et parfois nous perdent – dans les arcanes de la modélisation. Ils nous rappellent toutefois que la recherche documentaire est complexe, qu'elle articule paramètres physiques mesurables (numérisables) et éléments symboliques et qu'elle parcourt les voies (comparaison, analogie) de l'interprétation.

Entre les ambitions technologiques ou logiques de certains propos et des exposés parfois très énumératifs, le lecteur pourrait rester perplexe. Mais il trouvera partout présentes deux affirmations très stimulantes. Que la connaissance de l'usager et de ses besoins (et son vocabulaire) sont primordiaux dans l'élaboration et l'évaluation de systèmes documentaires qui doivent eux-mêmes prévoir la collecte et l'exploitation en retour de ses modes de recherche. Que les images sont de véritables ressources documentaires et ne peuvent plus désormais être envisagées comme « des boîtes noires décrites par des descripteurs textuels » 2.

  1. (retour)↑  Terme utilisé par Rohini K. Srihari et Zhongfei Zhang, « Exploiting multimodal context in image retrieval ». p. 496-520.
  2. (retour)↑  Samantha K. Hastings, « We are just now beginning to examine the content of images instead of viewing them as black boxes described by textual descriptors », « Evaluation of image retrieval systems : role of users feedback », p. 439.