Images et bases de données

Odile Le Guern

L'intégration de la base de données textuelle impose un mode d'indexation linguistique de l'image elle-même, et non d'une légende à laquelle elle n'est pas réductible. Cette indexation présente l'avantage de tenir compte des différentes fonctions de la base de données et de la très grande polysémie des documents envisagés ; d'en dégager les différents niveaux d'interprétation et de faire apparaître les différents contextes d'utilisation possibles, leur assurant ainsi une rentabilité documentaire maximale.

The integration of pictures into a textual database is imposing a method which is specific to the picture in itself, and not only a key to which it cannot be set. The advantage of such an indexation is that it takes into account the different functions of the database and the very large polysemy of the documents envisaged ; it also allows for the possibility to differenciate the many levels of interpretation and to show the different possible use contexts, therefore maximizing its information profitability.

« Tout mode de classification analytique d'une iconothèque est en soi une théorie de l'image » 1

A l'heure où l'image envahit nos magazines et les murs de nos villes, il devient banal de parler d'inflation d'images. A l'heure où il devient urgent, pour les entreprises, pour les institutions, etc., de se faire connaître, de faire connaître leur action, leurs produits, il devient également urgent d'améliorer la gestion de ces stocks d'images qui constituent à coup sûr un des moyens privilégiés pour entrer en communication avec les interlocuteurs éventuellement concernés ou pour faire en sorte qu'ils le soient. Cette explosion iconographique condamne l'empirisme de la gestion et de l'organisation de certaines iconothèques au « rendement documentaire » 2 extrêmement faible, qui entraîne sous-emploi des documents iconographiques accumulés et perte de temps pour l'utilisateur.

Les deux fonctions d'une base de données d'images

Les services que l'on peut attendre d'une iconothèque sont de deux sortes :

Communiquer

L'iconothèque est d'abord un outil de communication. L'utilisateur vient y chercher une ou plusieurs images pour illustrer un article, une conférence, etc. Il connaît parfaitement ou tout au moins possède un grand nombre d'informations sur l'objet, thème de la conférence ou de l'article en question. Il pourra donc retrouver cet objet sur les images que lui propose l'iconothèque. Les informations qu'elles apporteront sur l'objet entreront en relation de redondance ou de complémentarité avec le discours qui les intègre. De cette connaissance préalable de l'objet recherché dépend le bon fonctionnement de l'iconothèque comme outil de communication.

Informer

L'iconothèque est aussi un outil d'information et de connaissance qui peut fournir des renseignements comme le ferait une encyclopédie à un public désireux d'élargir son savoir sur tel ou tel objet. C'est alors l'information qui est recherchée pour elle-même et non plus seulement pour le mieux qu'elle est censée apporter à une communication de type documentaire, didactique ou journalistique.

On doit tenir compte de ces deux orientations et essayer de concilier leurs exigences propres pour concevoir l'organisation de l'iconothèque, c'est-à-dire l'indexation des documents et l'élaboration du système d'interrogation de la base de données qu'elle constitue (cf. schéma 1).

L'iconothèque

Définition

On peut définir l'iconothèque comme « une bibliothèque d'images »  3, comme le lieu institutionnel d'un regroupement d'images et d'un système de classement de ces images permettant à l'éventuel utilisateur de (re)trouver le document dont il a besoin. Elle est aussi « un carrefour où se rejoignent principalement des utilisateurs et leurs besoins, des images et leurs auteurs, des documentalistes qui tentent d'établir un lien entre les parties » 4 (cf. schéma 2).

Le mot « iconothèque »

Le mot « iconothèque » est un terme générique et désigne tout aussi bien une vidéothèque, une photothèque qu'une diapothèque. A la différence de ces termes, il ne dit rien du support et ne renvoie qu'au caractère iconographique des documents réunis. Plus générale et moins concrète, cette désignation nous semble toutefois préférable dans la mesure où la vocation d'une iconothèque n'est pas de se spécialiser en fonction du support des documents, mais en fonction d'une thématique propre à l'institution qui l'intègre et qui regroupera tout aussi bien des diapositives que des photographies ou des films vidéo. Elle nous semble en tout cas préférable à la pratique en vigueur aujourd'hui, qui accorde à chaque type d'image un traitement documentaire spécifique. Mais le but poursuivi par la recherche actuelle dans ce domaine vise à l'intégration des documents iconiques aux bases de données textuelles, ce qui ne veut pas dire que l'on renonce à la spécificité de l'image en tant que code sémiologique. Le stock d'images pourrait ainsi être géré par le même système documentaire que les documents textuels. Toute appellation qui isolerait le stock d'images des documents textuels deviendrait dans ce cas inutile.

Les supports

Les bases de données d'images regroupent actuellement des documents dont les supports sont nombreux et variés. Cette variété des supports n'est pas forcément problématique et peut être ramenée à un simple « problème technique de normalisation »: A. Moles 5 propose de « traduire en diapositive » les documents qui arrivent « sous des formes et des formats très disparates ». Mais elle peut aussi recouvrir une différence de nature entre les documents qui constituent l'iconothèque et traduit dans ce cas, de manière tout à fait concrète, des différences plus fondamentales entre ces documents, différences de nature sémiologique cette fois. Ainsi, le processus d'analyse que l'on applique à l'image mobile ne sera pas le même que celui que l'on applique à l'image fixe.

Indexation et interrogation

Une bonne gestion de l'iconothèque passe par une intégration des documents permettant de les retrouver par l'interrogation de la base de données (cf. encadré). L'intégration des documents à l'iconothèque résulte d'une description thématique et formelle de ces documents, cette analyse étant, selon la définition d'Hudrisier, « une activité de la chaîne documentaire... une opération de traitement de l'information susceptible de lui donner une forme différente de sa forme originelle, et permettant sa mise en mémoire et sa restitution dans le cadre du processus documentaire » 6 Cette opération se nomme généralement indexation. A l'autre bout de la chaîne documentaire l'utilisateur se livre à l'interrogation de la base de données. L'interrogation s'avère positive dans la mesure où l'indexation des documents tient compte de la richesse de leur contenu informatif en relation avec les besoins effectifs des utilisateurs potentiels de l'iconothèque, des aspects formels et techniques suceptibles d'entrer dans leurs projets de signification afin de mieux le communiquer.

C'est pourquoi l'indexation est une étape si importante pour le bon fonctionnement de l'iconothèque, c'est pourquoi elle intéresse au plus haut point la sémiologie de l'image qui peut sans doute lui indiquer quelques pistes pour une meilleure description des documents, sinon lui fournir une grille d'analyse valable une fois pour toutes et pour toutes les images.

L'interrogation

L'interrogation de la base de données est le plus souvent assistée par ordinateur. L'utilisateur tape sur un clavier un mot ou plus exactement un syntagme nominal. Ce syntagme est tiré d'une liste de mots-clés, ou descripteurs, obtenus par indexation des documents. Cette liste constitue le thésaurus de l'iconothèque et regroupe, en les classant alphabétiquement, tous les descripteurs issus de l'indexation de tous les documents rassemblés dans l'iconothèque. L'utilisateur recherche dans le thésaurus le syntagme nominal qui serre (et sert) au plus près son projet de signification. Deux possibilités alors se présentent, selon l'importance de l'iconothèque et selon l'équipement technique dont elle bénéficie : l'utilisateur pourra voir un ensemble d'images répondant au descripteur choisi grâce à un couplage ordinateur/vidéodisque. C'est par cette visualisation qu'il portera finalement son choix sur tel ou tel document.

Si la masse de documents répondant au descripteur choisi est trop importante ou si l'iconothèque n'est pas pourvue d'un système de visualisation automatique, on va poursuivre l'interrogation linguistique. A une première demande, l'ordinateur répond par une liste de références. Le plus souvent, il sera nécessaire d'affiner la recherche, c'est-à-dire de limiter cette liste de références, en faisant appel à d'autres descripteurs. Un ensemble plus restreint sera alors proposé, défini par l'intersection des deux classes désignées par les deux descripteurs.

L'interrogation linguistique et la visualisation présentent des avantages et des inconvénients : l'utilisateur peut théoriquement faire appel à autant de descripteurs que cela lui semble nécessaire pour préciser sa demande. Cependant, rechercher trop de précision dans la demande risque d'entraîner l'utilisateur dans une impasse : à la limite, plus aucun document disponible dans l'iconothèque ne conviendrait à son projet de signification. C'est « le silence documentaire » 7, plus préjudiciable au bon fonctionnement de l'iconothèque que le bruit que peut entraîner une demande moins précise et une réponse comportant des documents parasites, ne pouvant entrer dans le projet de signification de l'utilisateur. Par ailleurs, il est nécessaire d'évaluer le temps de consultation des documents eux-mêmes et le temps passé à interroger le système documentaire. Et il est vrai qu'« à partir d'un certain moment, si le temps de consultation et de prise en compte de cette analyse documentaire dépasse le temps de prise en compte et de consultation des documents eux-mêmes, on peut dire qu'il y a non-pertinence à poursuivre ce type de documentation uniquement textuelle » 8.

La visualisation présente des avantages certains qui rendent souhaitable la généralisation de systèmes d'accès automatique à l'image, tel que le vidéodisque, pour qu'elle puisse intervenir dans l'interrogation de la base de données et compléter l'interrogation linguistique. Mais elle ne peut intervenir efficacement qu'en fin de recherche sur un ensemble réduit de documents présélectionnés par l'interrogation linguistique, et non sur l'ensemble du stock constituant l'iconothèque, afin que l'utilisateur puisse conclure lui-même son choix. Par ailleurs, l'interrogation linguistique présente un avantage incontestable sur la visualisation directe des documents, si l'on envisage l'iconothèque comme outil d'information et de connaissance et non plus seulement comme outil de communication. La visualisation directe permet sans doute de trouver ou plutôt de retrouver ce que l'on cherche. Elle fonctionne sur la reconnaissance de l'objet représenté. Mais il est hors de question de reconnaître quelque chose que l'on ne connaît pas, dont on ne sait à peu près rien sinon l'étiquette qui lui est donnée dans un lexique, qu'il soit dit général ou de spécialité. Et passer par une interrogation linguistique permet à l'image de dépasser le simple rôle d'illustration auquel la ramène actuellement, il est vrai, la plus grande part des utilisations, et à l'iconothèque d'accéder à une vocation encyclopédique.

L'indexation

Si l'interrogation d'une base de données d'images relève d'un système automatisé, l'insertion des documents, l'analyse qui va les intégrer à la base et permettre à l'utilisateur de les retrouver est une opération manuelle qui doit beaucoup à l'habitude du documentaliste, à sa connaissance des besoins de l'institution qui l'emploie et des éventuels utilisateurs du centre de documentation qu'il gère. Cette analyse permet, pour reprendre les termes d'Hudrisier, de mettre en mémoire et de restituer les documents sous une forme différente de leur forme originale. Il s'agit donc d'une sorte de traduction, l'analyse traduisant en termes linguistiques un document qui relève d'un mode sémiologique autre, le mode iconique.

Avant d'aller plus loin, il est nécessaire d'insister sur deux points. Tout d'abord, le caractère manuel de cette opération d'analyse ne semble pas près d'être remis en cause dans le cadre de la pratique documentaire. Une traduction du document iconique qui s'appuierait sur la reconnaissance des formes et leur interprétation par la machine ne semble pas applicable pour l'instant aux images qui constituent l'essentiel du stock des iconothèques, qui ne sont que rarement des images de synthèse signifiant comme le langage verbal dans la discontinuité et relevant comme lui d'un code, de formes et de couleurs, préexistant. Par ailleurs, cette traduction en langage verbal, sur laquelle repose l'interrogation linguistique, semble nécessaire et ne peut être, nous l'avons vu, supplantée totalement par les techniques de visualisation.

Indexer une image consiste donc à donner des renseignements sur ses caractères formels et techniques et sur le contenu informatif qu'elle véhicule.

Nous ne nous attarderons pas sur les différents aspects techniques, supports, formats, etc., qui n'intéressent qu'indirectement la sémiologie de l'image. En revanche, certains aspects formels seront à prendre en compte dans la mesure où ils sont porteurs de valeurs connotatives qui modifient la signification globale du message. Parmi eux, citons les différentes approches du sujet (gros plan, plan moyen, plan d'ensemble, plongée, contre-plongée, etc.), les jeux de lumière (le contre-jour par exemple), les différences de focale (télé-objectif, grand-angle, etc.), ou encore le temps de pose (qui détermine la plus ou moins grande netteté de l'image).

Nous nous attarderons davantage sur l'analyse du contenu informatif des documents, qui est essentielle quel que soit le service que l'on attend de l'iconothèque: qu'elle soit envisagée comme outil d'information ou comme outil de communication, le système documentaire qui la gère devra toujours rendre compte de ce que l'image représente. De cette partie de l'indexation dépend le succès de l'interrogation. Une image mal indexée ne sera pas consultable (par visualisation ou par l'intermédiaire d'une référence). Elle ne viendra pas en réponse à l'appel d'un descripteur qui pourtant aurait pu cerner partiellement l'information qu'elle véhicule. Mais cette analyse pose de nombreux problèmes que l'habitude du documentaliste et une parfaite connaissance du public de l'iconothèque, et donc de ses besoins, ne peuvent pas totalement résoudre. Les difficultés rencontrées à cet endroit de l'indexation proviennent essentiellement de la richesse du contenu informatif des images et de l'opération qui consiste à traduire ce qui relève du code iconique en langage verbal.

Richesse du contenu informatif de l'image

La polysémie de l'image

La richesse du contenu informatif de l'image est liée à sa polysémie. Nous avons défini cette polysémie comme étant la possibilité pour chaque objet représenté de jouer le rôle de sujet logique d'une proposition et de thème à tout un discours. Il y a autant de propositions et autant de discours possibles pour une seule image qu'il y a d'objets représentés à l'intérieur de cette image. Elle offre donc plusieurs interprétations possibles, une seule sera actualisée par le discours qui va l'intégrer. Mais il est important que l'indexation lui permette de recevoir d'autres lectures et de ce fait d'être intégrée à des discours différents, d'accéder à d'autres utilisations. Il y va de sa rentabilité documentaire au sein même de la base de données.

Cette richesse de contenu informatif n'empêche pas l'image d'être perçue très rapidement, en raison de son caractère tabulaire. G. Bléry souligne bien ce paradoxe qui associe richesse de contenu et rapidité de perception et qui fait que l'iconothèque ne peut être gérée ni comme une collection d'objets, par des méthodes mises au point en muséographie, en archéologie ou dans les stocks d'entreprises, ni comme une bibliothèque, en raison du statut d'analogon de l'image. « Cette re-présentation du monde, tout comme lui, ne se laisse pas facilement épuiser par le discours » 9.

Evaluation quantitative de la description

Compte tenu de cette richesse de contenu informatif, il est nécessaire d'évaluer quantitativement la description. On ne peut viser à l'exhaustivité. Nous dirons même qu'il ne serait pas souhaitable d'y parvenir sous peine d'asphyxier la base de données et de la rendre finalement inutilisable. Une bonne description recherche une sorte de juste équilibre, toujours au carrefour de deux préoccupations antithétiques et fuyant les zones extrêmes de l'omission ou de l'excès.

« 1) Comment être sûr de ne rien oublier d'important dans la description de l'image, ou comment ne pas pécher par omission ?

2) Comment ne pas aller trop loin dans cette description de l'image et ne pas surcharger le fichier d'éléments qui ne seront pas utilisables... ou comment ne pas pécher par excès ? » 10.

Quelle quantité d'information contenue dans l'image est effectivement transmise par la description, et de quelle quantité d'information la description doit-elle rendre compte pour une utilisation et un rendement optimaux du document à l'intérieur de l'iconothèque ? Telles sont les questions sous-jacentes à l'indexation pour une rentabilité maximale du document et le bon fonctionnement de l'iconothèque qui l'intègre.

La légende

Pour limiter dès le départ la polysémie de l'image et les problèmes qui en découlent au niveau de l'indexation, certains auteurs posent a priori le principe suivant : « L'individu qui est à la source de la photographie doit en fournir lui-même la légende. Pour être plus précis: une image sans légende de la part de son fournisseur ou producteur n'a pas - en principe et en général - droit d'accès à l'iconothèque » 11. « L'image doit, devrait toujours être accompagnée d'une légende qui apporte des précisions informatives : date, pays, non du monument, nom des personnes représentées éventuellement. Il faut aussi que cette légende explicite l'action en cours. Comment reconnaître un rite vaudou si nous ne l'avons jamais vu ? Comment savoir la signification politique d'une manifestation si nous ne connaissons pas la langue dans laquelle sont rédigées les pancartes ?... L'analyste possède aussi les pouvoirs de refuser l'entrée en photothèque d'une image mal légendée » 12. « L'image ne parle pas d'elle-même » dit encore G. Bléry. Il est évident qu'une image ne peut remplir sa fonction d'outil de communication, et à plus forte raison d'outil d'information, si le contenu informatif qu'elle véhicule n'est pas explicité par une légende. Une image sans légende court le risque d'être mal indexée parce que mal interprétée par le documentaliste. Cette image ne pourra être retrouvée que par visualisation et choisie par reconnaissance de l'action, des personnages et des objets représentés que seul l'utilisateur informé pourra identifier. Mais la légende limite la polysémie de l'image, qu'il est important de préserver en même temps que sa rentabilité documentaire, et devrait s'en tenir à expliciter une action, à identifier un personnage, un lieu, des objets. Par ailleurs, il n'est pas souhaitable que l'opération d'indexation du document se ramène finalement à l'indexation de sa légende. Une image sans légende ne nous semble pas une image perdue pour l'iconothèque dans la mesure où l'identification des éléments qui la constituent relève encore de la compétence du documentaliste.

La définition institutionnelle de la collection

« L'iconothèque encyclopédique mérite une approche particulière, différente de celle adoptée pour les iconothèques dites "spécialisées" : l'iconothèque technique ou l'iconothèque destinée à une communauté scientifique étroite (la dermatologie, par exemple). Elaborer une méthodologie de la classification, spécifique d'une iconothèque encyclopédique, s'avère difficile pour les raisons suivantes :
- éclatement des champs linguistiques des usagers de l'iconothèque qui peuvent s'intéresser à la médecine, à la métallurgie, à la géographie, à l'histoire, etc., sans en être spécialistes et utiliser les langages propres à ces disciplines;
- ces différents champs de langage ne se juxtaposent pas: ils s'empruntent mutuellement les mêmes notions, les mêmes concepts en les utilisant, souvent métaphoriquement, avec des sens différents, ce qui est générateur de contresens et d'incompréhension ;
- les documentalistes archivistes ayant à "servir" cette communauté extrêmement vaste ne connaissent pas, et ne peuvent pas connaître, tous ces champs linguistiques. Pourtant, ils sont confrontés à la nécessité de les faire cohabiter dans un même système documentaire » 13.

Les remarques d'Hudrisier portent sur les aspects linguistiques de l'indexation dans le cadre d'une iconothèque encyclopédique et pourraient servir de fondement à son évaluation qualitative. Mais il semble que les difficultés qu'il y a à indexer un document dans le cadre d'une telle iconothèque apparaissent déjà au niveau des différents domaines d'expérience auxquels peut renvoyer une image, si tant est que l'on puisse séparer la réalité objective de la réalité linguistique qui la désigne. Avant le choix des termes linguistiques, se pose le choix des objets représentés. Avant de se demander comment indexer telle image, le documentaliste se demande ce qu'il va choisir de montrer (index) de cette image par l'indexation. Dans une iconothèque spécialisée, la définition institutionnelle de la collection, c'est-à-dire son intégration et son appartenance à telle institution, à telle entreprise, etc., lui permet de répondre en partie à cette question, de sélectionner les objets, de mentionner certains détails en fonction de cette définition et donc en fonction des besoins des utilisateurs de l'iconothèque. Sur une photo représentant des voitures sur un échangeur autoroutier, à taux de lisibilité égale, l'iconothèque d'une école de travaux publics choisira l'échangeur, celle d'une entreprise de construction automobile privilégiera les voitures.

Des ensembles d'images ou l'image comme unité documentaire

Les documents iconographiques regroupés dans une iconothèque sont de nature différente, cette différence de nature ne relevant pas seulement d'une différence de support. Ainsi, nous distinguerons les documents isolés, relevant forcément de l'image fixe, des documents ayant une organisation séquentielle au caractère narratif plus ou moins marqué. Ces derniers peuvent relever de l'image mobile ou de l'image fixe (livre d'images, bande dessinée, montage diapos, etc.) et leur traitement documentaire les envisage dans leur globalité, considérant l'ensemble d'images qu'ils constituent et non pas chaque image prise individuellement. L'image fixe et isolée est généralement, quant à elle, envisagée comme unité documentaire. Cette différence méthodologique au niveau du traitement documentaire s'érige comme un mur qui sépare nettement l'image fixe de l'image mobile et des documents à organisation séquentielle, syntagmatique. Elle trouve son fondement dans la différence de nature qui oppose ces deux types de documents mais elle est sans doute préjudiciable au bon fonctionnement de l'iconothèque.

L'image fixe et isolée peut être envisagée autrement que comme unité documentaire. Des regroupements thématiques peuvent être opérés, ces regroupements fonctionnant comme premier principe de classement. On peut travailler alors sur des ensembles d'images comparables au « reportage sur... », étant bien entendu que seule l'unité thématique relie ces images sans qu'aucune relation d'ordre ou organisation séquentielle n'intervienne dans le principe de regroupement. Nous avons affaire à des ensembles non ordonnés. Choisir de travailler sur des « trains d'images » présente au moins deux avantages :
- une économie au niveau de la description : « Est-il pertinent, sous prétexte que la photographie "image fixe" existe par elle-même, de considérer la photographie comme unité documentaire d'analyse, et de demander à la personne (ou au système documentaire) de répéter fastidieusement, pour chaque photographie, la partie d'analyse commune ? » 14;
- la possibilité d'identifier un détail sur une image au regard d'une autre image. Les documents s'éclairent mutuellement.

Cette méthode présente aussi des inconvénients :
- le premier tient à la détermination des ensembles thématiques et à l'existence inévitable de plusieurs entrées possibles pour une seule image. C'est un problème de classification croisée;
- le deuxième vient du fait que toute insertion d'une image dans un ensemble limite sa polysémie, le nombre des thématiques possibles qu'elle suggère, en court-circuitant les thématiques non retenues par l'étiquette donnée à l'ensemble. De plus, la thématique retenue, définissant l'ensemble, apparaît comme extérieure à l'image et la réduit à la seule fonction thématique.

L'image mobile ou l'ensemble d'images à organisation séquentielle sont habituellement envisagés globalement, ce « qui fait souvent oublier, dans l'analyse des films (et surtout l'analyse des films de fiction), de signaler tel ou tel plan qui pourrait être décontextualisé et resservir ensuite dans un tout autre montage » 15.

Décontextualisation, recontextualisation et rentabilité documentaire

Si l'on pose le problème en termes de rentabilité, l'image rentable, c'est-à-dire celle qui serait susceptible d'être intégrée à un très grand nombre de discours, serait celle qui pourrait être facilement décontextualisée, qui pourrait toujours apparaître comme autonome et indépendante par rapport au contexte que constitue l'organisation séquentielle qui l'intègre. Il est certain qu'une image relevant d'une organisation séquentielle sera d'autant plus difficile à décontextualiser que le caractère narratif de la séquence sera plus marqué, et l'on ne signalera pas tel plan pourtant réutilisable.

Il semble nécessaire d'évaluer les possibilités de décontextualisation, et donc de recontextualisation, de l'image. Deux oppositions interviennent dans cette évaluation :
- image fixe/image mobile. L'image fixe insérée dans un ensemble à organisation séquentielle est plus facilement décontextualisable qu'un plan filmique. La rapidité de projection des images cinématographiques, qui crée l'effet-mouvement, constitue une syntagmatique plus contraignante que la simple juxtaposition pourtant ordonnée du montage diapos ;
- réalité/fiction.

Une image documentaire ou d'actualité est plus facilement décontextualisable qu'une image de fiction. La narrativité semble être un lien plus fort que la chronologie historique.

Par ailleurs, et ceci est valable aussi pour l'image fixe et isolée, l'anonymat des personnes représentées favorise le réemploi des documents; la photo d'un personnage connu, même si elle semble pouvoir parler d'autre chose, est impossible à replacer dans un contexte nouveau où l'identité de la personne ne serait pas pertinente.

Enfin, il est parfois nécessaire de tenir compte du contexte que constitue le réseau des utilisations précédentes, des précédents discours qui ont intégré les documents. Ce contexte n'étant pas forcément connu de l'utilisateur n'est pas toujours suffisamment contraignant pour être pris en compte; pourtant, certaines images sont devenues des images symboles du premier discours qui les a intégrées et ne pourront que très difficilement faire l'objet d'autres lectures pour d'autres utilisations, originales par rapport à ce premier discours.

Lisibilité et prégnance visuelle des objets représentés

Le travail du documentaliste consiste en une sorte de balayage systématique du document à la recherche de son contenu informatif. Il dresse une liste des termes désignant les éléments qui apparaissent sur l'image, sans prétendre à une exhaustivité qui s'avérerait tout aussi inutile qu'illusoire. Certains éléments formels peuvent également orienter l'indexation.

- La surface occupée par les éléments représentés sur l'espace de représentation peut-elle être prise en compte ?

L'idée pourrait venir en effet d'une pondération des éléments représentés sur l'image. La surface occupée par la représentation d'un objet donné est mesurable et il est facile de mesurer le pourcentage de la surface totale occupée par chaque élément. Mais cette possibilité se révèle malheureusement sans grand intérêt opératoire, la structure même de l'image peut attirer l'attention sur un élément de petite taille et amener à considérer comme non directement pertinente une surface importante. Le qualitatif l'emporte sur le quantitatif.

- Le critère de la lisibilité : on peut poser comme principe que l'indexation ne porte que sur les éléments dont la lisibilité est évidente et dont l'interprétation ne pose aucun problème. « Pratiquement, pour une diapositive, il suffit souvent, après l'avoir observée au compte-fils, de se contenter de la regarder par transparence à la lumière du jour. Ce qui reste lisible est ce qui restera perçu le plus aisément par le spectateur. Cette technique relève plus du "truc" que de la méthode et il faut être sûr, avant de le faire, qu'il n'y a pas sur l'image un détail visuel qui implique tout le sens, comme une pancarte, par exemple » 16. La non-lisibilité limite de fait l'indexation, mais ce critère de la lisibilité sera utilisé différemment, selon que l'on envisage l'image comme unité documentaire ou que l'on procède par « trains d'images ». On peut parler alors en termes de lisibilité absolue si les éléments sont identifiables au vu d'une seule image, et de lisibilité relative si, pour les identifier, on a recours aux autres documents de la série.

- Prégnance formelle et prégnance culturelle des objets représentés. La prégnance visuelle, nous l'avons dit, n'est pas la lisibilité, même si elle la détermine dans une certaine mesure. Est prégnant, dans une représentation iconique, l'élément qui est perçu en priorité par rapport aux autres éléments de la représentation. La prégnance visuelle peut avoir des sources multiples, qui interviennent en même temps pour un même objet représenté. Le documentaliste essaie évidemment de ne pas tenir compte de la prégnance de tel objet lorsque celle-ci est liée à son propre vécu individuel: je ne vais pas mentionner tous les hommes à barbe du corpus sous prétexte que mon mari est barbu ! En revanche, il y a des objets que l'on relève parce qu'ils évoquent des problèmes de société, qu'ils correspondent à des préoccupations du moment et donc aux besoins immédiats des utilisateurs. Cette prégnance visuelle est d'origine culturelle. En tenir compte comporte un inconvénient : la validité temporaire de l'indexation et la nécessité de reconsidérer périodiquement des descripteurs qui ne signifient que temporairement 17. Enfin, certains éléments sont ressentis comme prégnants pour des raisons formelles, parce que les lignes de forces de la composition les inscrivent sur des zones de perception optimale ou qu'un jeu de contraste au niveau des couleurs les met en valeur.

Indexation comme fait de traduction

Indexer une image s'apparente à un fait de traduction : il s'agit de rendre compte d'un fait de représentation iconique par des descripteurs qui relèvent, quant à eux, du langage verbal.

Indexer par des syntagmes nominaux

Les descripteurs ne devraient pas être assimilés aux mots de la langue tels qu'ils apparaissent dans le dictionnaire. L'indexation est un fait de parole ou de discours, jamais un fait de langue, puisqu'il s'agit de décrire. Le mot dans le dictionnaire a un signifiant et un signifié que vient expliciter une définition. Il n'a pas de référence. Seule son actualisation dans un discours peut le pourvoir d'une référence précise. Le mot en langue ne parle que du langage, le descripteur, au contraire, parle d'une réalité extérieure au langage et entre en relation référentielle avec ce que représente l'image. Si j'indexe une image par le mot « (un) chat », il s'agit bien d'un mot en discours et non d'un mot en langue puisque, outre les traits de sens qui constituent son signifié et dont rend compte la définition du dictionnaire, il est investi de traits supplémentaires, traits de substance ceux-ci, propres au chat de la représentation iconique décrite.

De plus, envisager le descripteur comme syntagme nominal n'a pas que des justifications théoriques, mais permet de préciser considérablement l'indexation en donnant plus de renseignements sur la référence désignée par le jeu des déterminations grammaticales. Les descripteurs pourront se présenter de la manière suivante : /(un) chat/, mais aussi / (un) chat noir/, /(un) chat sur une chaise/, /(un) chat noir sur une chaise/, etc. Ces renseignements sont de nature strictement visuelle : couleur, situation spatiale des objets les uns par rapport aux autres, par exemple.

Notons enfin que ce mode d'indexation ne vise pas à hiérarchiser les éléments de la représentation entre eux, ce qui serait préjudiciable à la polysémie de l'image et à sa rentabilité documentaire. Il indique tout au plus une relation entre objets. Si un utilisateur appelle le descripteur /chaise/, on peut envisager qu'il obtiendra tous les descripteurs syntagmes nominaux dans lesquels apparaît le mot « chaise » avec référence des images correspondantes. Avant même la visualisation de ces images, sur vidéodisque par exemple, il saura que la chaise de l'image correspondant au descripteur /(un) chat noir sur une chaise/ aura sans doute moins de prégnance visuelle qu'une autre, à cause de la présence du chat, et risque d'être moins pertinente par rapport à son propos, ce qui restera bien sûr à vérifier par la visualisation.

Jusqu'où segmenter la représentation ?

Indexer, c'est projeter des mots sur une image. A. Moles dit que classer, c'est projeter des concepts sur un ensemble d'images pour dégager des sous-ensembles thématiques, nous reprendrons la formule : indexer, c'est projeter des concepts également sur chaque image. C'est en fin de compte introduire une discontinuité propre au langage verbal de nature symbolique sur l'image, reflet de l'univers continu qu'elle re-présente du fait de son statut d'analogon. La définition institutionnelle de la collection détermine quels sont les objets que l'indexation retiendra comme pertinents par rapport aux besoins des utilisateurs. Elle détermine aussi le degré de focalisation auquel doit viser l'indexation pour une utilisation optimale du document. Ainsi, pour la plupart des iconothèques, le descripteur /(une) femme assise sur un fauteuil / suffira; pour l'iconothèque d'une maison de couture, il faudra mentionner le type de vêtement et peut-être même, sur le vêtement, le type de boutonnière, etc.

Hyperonymes et hyponymes

Le syntagme nominal entre en relation référentielle avec l'objet représenté. De ce fait, et par le jeu des déterminations qui le composent, il a une extension plus réduite que le mot en langue. Plus l'extension du descripteur est réduite, plus il joue son rôle d'index conforme à sa fonction référentielle. C'est pourquoi on gagne à choisir des hyponymes, ou termes spécifiques, plutôt que des hyperonymes, ou termes génériques, à choisir /platane/, /chêne/ ou /sapin/ plutôt que /arbre/, /fauteuil/, /chaise/ ou /tabouret/ plutôt que /siège/, même si ces termes génériques peuvent être précisés par le jeu des déterminations qu'autorise l'indexation en syntagmes nominaux. L'extension d'un descripteur peut être réduite déjà au niveau de la structure interne de son signifié.

Dans le même ordre d'idées, on choisira de désigner les personnes par leur nom propre dans la mesure où elles sont identifiables et suffisamment connues pour que la base de données ait des chances d'être interrogée par ce nom propre.

Les hyperonymes devraient être réservés aux éléments difficilement identifiables, soit que la qualité de l'image (photographique par exemple) ne permette pas l'identification, soit qu'une identification plus précise de la référence ne corresponde pas aux besoins des éventuels utilisateurs. Là encore, la définition institutionnelle de la collection indique au documentaliste le degré de spécialisation du descripteur. Le descripteur /arbre/ peut suffire à l'analyse d'une image entrant dans une base de données dont la spécialité n'est pas l'arboriculture ou la botanique.

Le problème des termes abstraits

Peut-on indexer une image par des termes abstraits ? On a souvent tendance à confondre attribution d'une légende à une image et indexation. Les deux opérations poursuivent pourtant des buts bien différents. L'une sert un seul projet de discours, l'autre sert tous les projets de discours qu'une image peut véhiculer sans en privilégier aucun. Cette confusion explique en partie l'abus que l'on peut faire parfois de termes abstraits, qui interviennent au niveau des regroupements thématiques mais aussi au cours de l'indexation image par image. Ce sont par exemple /pollution/, /drogue/, /alcoolisme/, /prostitution/, etc.

Reprenons ici cet exemple célèbre d'une photo de Robert Doisneau cité et commenté par H. Hudrisier 18 et par G. Bléry 19: « Dans un café de la rue de Buci, non loin de l'école des Beaux-Arts, un professeur d'architecture, portant la cinquantaine, devise avec une de ses jeunes étudiantes ». Ainsi H. Hudrisier décrit-il cette image. Son auteur lui avait lui-même attribué la légende : « les bistrots de Paris ». La photo, mise en agence, est utilisée, à quelque temps de là, pour une campagne anti-alcoolique avec légende ad hoc. Le professeur et son élève, furieux, entament une action en justice. Le procès n'était pas terminé que la même photo réapparaissait dans un magazine « à scandale » avec pour légende: « Prostitution aux Champs-Elysées ».

Nous ne savons pas en quels termes les agences ont indexé cette photographie de R. Doisneau. Il n'est donc pas question de les accuser de lui avoir donné comme descripteurs lalcoolisme / ou /prostitution/ et ces interprétations sont sans doute le seul fait de ses utilisateurs. Rien dans l'image n'implique directement la troisième lecture qui en a été faite : « Prostitution aux Champs-Elysées » Il aurait été tout à fait indû de l'indexer par un tel descripteur. Il est pourtant probable que son insertion dans un article sur la prostitution n'a gêné personne sinon ce professeur des Beaux-Arts et son élève. Il suffit parfois d'apposer une légende à une image pour faire surgir, avec évidence semble-t-il, l'interprétation véhiculée par la légende de l'image elle-même. La deuxième interprétation est plus plausible. Il y a un verre plein sur le comptoir d'un bar, qui peut entrer en relation de contiguïté avec l'acte de boire - des personnes sont présentes, susceptibles d'effectuer cet acte - et pourquoi pas, en extrapolant un peu, avec l'alcoolisme. Mais ce n'est pas au documentaliste d'expliciter l'idée avec laquelle tel indice visuel peut entrer en relation de contiguïté. Il devrait se contenter de noter la présence de ces indices. « C'est au demandeur d'effectuer la transposition de l'idée à sa forme visuelle, sachant qu'il souhaite parler de l'alcoolisme, il demandera évidemment des personnes en train de boire. Pour la prostitution ne cherchera-t-il pas plutôt une femme vêtue d'une mini jupe arpentant un trottoir ? » 20.

Cependant, s'en tenir à l'indexation des indices visuels, sans expliciter ce qu'ils peuvent évoquer, présente aussi des inconvénients. On suppose de la part de l'utilisateur une compétence de lecteur de l'image qui lui permet d'établir cette relation de contiguïté entre le thème à illustrer et les indices visuels portés par le document. On suppose donc qu'il explicite cette étape de la lecture des indices, qui se fait si souvent de manière inconsciente lorsque l'on demande à des sujets de donner une légende à une image. Par ailleurs, le demandeur qui interroge une base de données d'images par ce qu'il suppose être les indices de l'alcoolisme ou de la prostitution le fait par des lieux communs : /(un) verre de vin / pour « alcoolisme », /(une) jeune femme vêtue d'une mini jupe sur un trottoir/ pour « prostitution ». Or il est évident que certaines images répondant pourtant à ces descripteurs seront malencontreusement interprétées si on les insère dans des discours sur l'alcoolisme ou la prostitution. Et certains documents au contraire évoquant davantage ces thèmes, mais dépourvus de ces indices visuels, ne répondront pas à l'appel.

Pour pallier ces inconvénients, on peut faire en sorte que le système permette de demander /(un) verre de vin / et restitue à l'utilisateur, en même temps ou avant visualisation des images répondant à ce descripteur, les autres descripteurs ayant servi à les indexer, Ainsi, il sera plus en mesure de juger de l'adéquation de tel ou tel document à son propos. On peut faire aussi en sorte que les termes abstraits apparaissent dans le thésaurus et renvoient à une liste de descripteurs correspondant à des indices visuels véhiculés par les images. Les uns entrent, de manière évidente, en relation de contiguïté avec le thème souhaité. Les autres n'entreront pas directement en relation de contiguïté avec ce thème mais permettront pourtant d'accéder à des images pouvant le servir,

- soit qu'il ait paru évident au documentaliste que cette interprétation était suggérée par ces images;

- soit qu'elles fassent partie d'un reportage sur le thème en question sans être porteuses elles-mêmes des indices visuels permettant d'y accéder directement.

Le problème de la connotation

L'indexation des images doit-elle rendre compte du message connotatif qu'elles suggèrent ? Comment peut-elle rendre compte de ce message connotatif sans réduire la polysémie des images, sans forcer le message dénotatif qui le sous-tend ? La plupart des iconothèques, il est vrai, s'en tiennent à l'indexation de ce qui est strictement observable sur l'image et se contentent de mentionner les éléments, supports du message dénotatif, attestés par la représentation iconique. Ce parti pris méthodologique relève de la prudence. Nous avons vu en effet :
a) qu'il est beaucoup plus difficile de faire la part entre dénotation et connotation pour l'image que pour le texte;
b) que « l'image signifie au-delà de ses éléments constitutifs » 21 et que l'émergence du message connotatif ne dépend pas seulement d'éléments internes à la représentation mais aussi du récepteur et de la situation de réception du document.

Cependant, ce serait occulter tout un pan, souvent le plus important, du contenu informatif d'une image que de négliger le message connotatif qu'elle peut éventuellement véhiculer, même si l'approche que l'on peut en faire est nécessairement très partielle. Car « prétendre cerner de manière absolue cette potentialité de l'image serait pure témérité » 22.

L'indexation de tous les éléments pouvant assumer le rôle de sujet logique d'une proposition, de thème à tout un discours, fournit une description partielle des possibilités connotatives d'une image. Si l'on fait de tel élément le support en dénotation de l'interprétation du message, les autres éléments apportent un éclairage particulier à cette interprétation. Mais, dans d'autres utilisations du document, inséré à d'autres projets de signification, ces autres éléments pourront être à leur tour porteurs d'une lecture dénotative.

L'interprétation d'une image est un jeu complexe de focalisation sur tel ou tel élément de la représentation, comme si la mise au point était faite sur l'objet support de la lecture dénotative. Le reste de l'image est relégué dans le flou de l'arrière-plan connotatif, qui n'en colore pas moins de sa présence l'interprétation globale du message.

C'est ainsi que s'opère, dans une situation particulière de communication, l'actualisation de l'une des nombreuses interprétations virtuellement véhiculées par l'image. L'indexation est censée tenir compte du plus grand nombre possible de situations d'utilisation du document et donc de ne pas départager les éléments entre dénotation et connotation, puisqu'ils sont tous virtuellement susceptibles d'une lecture dénotative et porteurs de valeurs connotatives. Le documentaliste ne peut s'en tenir qu'au simple relevé de tous les éléments représentés, le seul fait de les mentionner donnant déjà une idée des possibilités dénotatives et connotatives du document.

Si, à propos d'un document, une lecture connotative semble s'imposer, comme pour les termes abstraits, il sera toujours possible au documentaliste de faire en sorte que le thésaurus la mentionne et donne ensuite à l'utilisateur la liste des descripteurs et des images s'y rapportant. Mais, pour qu'une telle lecture connotative s'impose, il faut qu'il y ait redondance des valeurs connotatives qui la fondent au niveau des objets représentés. Pour qu'une connotation se dégage à coup sûr d'une image, il faut que plusieurs objets la véhiculant soient représentés. A cette loi de la redondance s'ajoute celle de la noncontradiction : ces valeurs ne doivent pas contredire le contenu dénotatif.

Certaines connotations ne tiennent pas à la représentation de tel ou tel objet, mais sont suggérées par les caractères formels du document, d'où l'importance de les noter au cours de l'indexation. Le problème réside dans le fait que ces caractères formels ne peuvent en aucun cas s'ériger en un vocabulaire fixe et stable une fois pour toutes et valable pour toutes les images. Pour chaque caractère formel, il existe plusieurs valeurs possibles et il est impossible, par ailleurs, d'établir une liste exhaustive de ces valeurs. Là encore, il y a un fait de polysémie: chaque trait formel n'accède à une signification précise que dans le cadre d'une représentation particulière.

Notons enfin que ces valeurs n'entretiennent pas de relation d'exclusion et qu'un même indice formel peut véhiculer deux ou plusieurs valeurs connotatives dans le même message iconique, à condition de ne pas entrer en contradiction les unes avec les autres. Ainsi, le traitement en noir et blanc d'une photo peut suggérer une atmosphère de tristesse ou correspondre à une volonté esthétisante : faire ressortir la ligne et les contours, à moins que, tout simplement il ne permette de situer historiquement le document par rapport à l'évolution de la technique photographique. Ces valeurs ne seront effectivement actualisées dans une représentation que si les caractères formels qui les suggèrent entrent en relation de redondance avec d'autres indices les véhiculant également. L'accès à tous les descripteurs de l'image peut mettre en évidence cette relation de redondance entre indices porteurs de valeurs connotatives qui fonde la légitimité d'une lecture connotative.

La simple mention de ces caractères formels au cours de l'indexation n'est pas entièrement satisfaisante : elle suppose une réelle compétence de l'image de la part de l'utilisateur. Or, le plus souvent, l'utilisateur n'a pas vraiment conscience des valeurs que ces caractères peuvent véhiculer même s'il les décrypte très bien en regardant tel ou tel document : la compétence de réception n'implique pas une compétence d'analyse.

Pour finir provisoirement sur cette question de la connotation, disons encore, même si cela relève de l'évidence, que les descripteurs ne doivent pas, ou le moins possible, être eux-mêmes porteurs de valeurs connotatives.

Portrait de Jacques Prévert

Si nous parcourons de haut en bas l'espace de représentation que constitue cette photographie de Robert Doisneau, nous rencontrons les éléments suivants : un auvent, des arbres (des feuillages, des troncs) que l'on n'identifie pas, des immeubles, des voitures, deux réverbères, un trottoir, des passants, des chaises, des tables, un verre de vin, Prévert, son chien, sa cigarette et, pourquoi pas, son chapeau.

L'arrière-plan

Certains des éléments que nous venons de citer sont à la limite de la lisibilité. Ils n'auront pas à être mentionnés par l'indexation dans la mesure où ils auront peu de chance d'être supports de discours. Mais ils permettent au documentaliste de caractériser un lieu. Ainsi, des arbres, des immeubles, des voitures, deux réverbères, un trottoir peuvent définir /un boulevard/, terme qui pourra apparaître comme descripteur. Les passants pourraient entrer dans cette catégorie. Nous les traiterons à part pour deux raisons :
1. Ce sont des personnages qui sont déterminés par la reconnaissance d'un lieu, qui ne sont désignés par un terme plus spécifique, « passants », qu'après définition du lieu dans lequel ils évoluent, ce qui ne les empêche pas en même temps de participer aussi à la définition de ce lieu; ,
2. La manière dont ils s'opposent au groupe principal, Prévert et son chien, peut être intéressante sur le plan sémiologique : ils se déplacent du fond à gauche vers le devant de la scène à droite alors que Prévert est assis et regarde vers la gauche. Cette mise en relation spatiale de Prévert avec les autres personnages peut véhiculer, par exemple, des informations sur la personnalité de Prévert, que l'image n'a pas la possibilité de montrer autrement que sur le mode de la connotation. Encore faut-il que le système d'indexation permette de rendre compte de cette mise en relation. On pourrait avoir : /des passants (allant) du fond à gauche vers le premier plan à droite / et /Prévert assis profil tourné vers la gauche/.

Le premier plan

Le premier plan est constitué des éléments suivants : un auvent, un trottoir, des chaises, des tables, un verre de vin sur une table. Contrairement à certains éléments de l'arrière-plan, ils sont tous, à l'exception peut-être de l'auvent dont nous reparlerons, identifiables et devront être mentionnés par l'indexation. L'ensemble de ces éléments opère également une transformation du trottoir en terrasse de café, trottoir qui participait déjà à l'identification de l'arrière-plan comme boulevard et assure, par cette double fonction, le lien entre l'arrière-plan et le premier plan. Ce trottoir s'efface au moment de l'indexation au profit des descripteurs suivants : /boulevard/, /terrasse de café/. Notons que l'auvent n'est identifiable en tant que tel qu'après lecture des chaises et des tables et après définition du lieu /terrasse de café/, mais qu'il participe aussi à cette définition.

Nous pourrions nous contenter de constater qu'il participe aussi à la transformation du trottoir en terrasse sans le faire figurer dans la liste des descripteurs. Cependant, il est difficile de ne pas remarquer qu'il sert de cadre à la représentation dans sa partie supérieure comme le tronc d'arbre à l'extrême gauche. Ces détails ne sont pas sans intérêt : ils traduisent une volonté de mise en scène du personnage Prévert, le boulevard est ici son décor. Il serait intéressant de pouvoir mentionner / Un auvent à la limite supérieure / et / un tronc (d'arbre) à l'extrême gauche /.

Le motif principal

Venons-en au motif principal constitué des éléments suivants : un verre de vin, une table, une chaise, Prévert, une cigarette, un chapeau, un chien. L'ensemble de ce motif est très sombre et se détache parfaitement sur le fond blanc du trottoir sans le moindre effet d'ombre portée, ce qui l'isole du décor qui l'intègre et lui confère une très grande densité visuelle, Au tout premier plan, le trottoir, devenu terrasse à cet endroit, redevient plus sombre comme si le motif principal était mis en valeur par un contre-jour qui ne gêne en rien l'identification du personnage : la lumière illumine le boulevard en arrière-plan et semble auréoler Prévert. Effet de mise en scène théatrâle là encore, obtenu sans doute par une mise au point sur Prévert à la prise de vue et, surtout, par une différence de temps d'exposition pour le motif principal au moment du tirage.

Mais comment l'indexation peut-elle rendre compte d'un tel travail sur l'image et, même si elle le pouvait, ne risquerait-elle pas alors de donner des informations qui dépasseraient les compétences de la plupart des utilisateurs en matière de production d'image et qui n'en verraient pas les possibilités d'effets produits au niveau de la réception ? Ce travail sur l'image est pourtant porteur d'une connotation, que nous appellerons « l'effet théâtre », qui entre en relation de redondance avec d'autres éléments de décor et que semble confirmer ce que l'on sait par ailleurs de la manière de travailler de R. Doisneau.

Indexation du motif principal

Cette photographie pose un autre problème : le personnage est sans doute célèbre, son image l'est un peu moins. Il est hors de question d'utiliser cette image pour illustrer un discours sur LA cigarette à partir d'une cigarette (ici, celle de Prévert), et peut-être sur le tabagisme, comme il est hors de question de la faire parler d'alcoolisme à partir du verre de vin. Pourtant, l'expérience nous l'a montré : ces lectures ont tenté des récepteurs qui n'avaient pas reconnu Prévert. Venaient à la rescousse de leurs interprétations, d'autres indices : l'attitude penchée en avant de Prévert, qui peut porter quelques connotations négatives, le noir et blanc, qui ici ne fait que dater la photo comme ce que l'on peut apercevoir des voitures en arrière-plan. L'isolement du motif principal, même si la manière dont il était obtenu restait mystérieuse, était très bien décrypté et a été réinterprété parfois en termes d'isolement affectif. Et comme Prévert n'est plus tout jeune sur cette photographie, on y a vu une évocation de la solitude du troisième âge, un des thèmes privilégiés de notre société actuelle. Il est nécessaire que l'indexation et le système d'interrogation permettent d'éviter la prolifération de ces lectures parasites et l'utilisation de cette image dans des discours où il ne serait pas question de Prévert.

La représentation d'un personnage célèbre souligne les avantages de l'interrogation linguistique sur la simple visualisation des documents. Si l'utilisateur a directement accès à ce document sans connaître Prévert, il risque de commettre les impairs que nous venons d'évoquer.

Si l'image est indexée, pour le motif principal, de la manière suivante: /une table/, /un verre de vin/, /Prévert/, /un chapeau/, /une cigarette/, /un chien/, et si la réponse renvoie aux documents par l'intermédiaire de leur référence, on encourt le même risque. Cette image pourra illustrer un discours sur l'alcoolisme à partir de la représentation du verre de vin. D'où l'intérêt pour l'utilisateur d'avoir accès aux autres descripteurs des documents que la réponse lui propose. L'apparition du nom de Prévert dans la liste des descripteurs de cette image rend impossible les utilisations qui ne tiendraient pas compte de sa personnalité.

Une autre solution semble encore plus satisfaisante, qui exploiterait au maximum les possibilités offertes par des descripteurs envisagés comme syntagmes nominaux. On pourrait avoir par exemple : /Prévert assis devant un verre de vin posé sur une table/, /Prévert fumant une cigarette /, etc. Si l'utilisateur demande / verre de vin /, on peut imaginer un système qui lui permette d'accéder à tous les descripteurs de la base de données qui intègrent /verre de vin /. Ainsi, il pourra exclure immédiatement le document décrit par /Prévert assis devant un verre de vin posé sur une table / si son projet est de parler d'alcoolisme.

Notons enfin que la fonction du descripteur, syntagme nominal, n'est pas de hiérarchiser entre eux les éléments représentés. Ainsi, n'importe quelle autre représentation de verre de vin peut parler d'alcoolisme même si la composition de l'image qui l'intègre semble suggérer en priorité d'autres lectures. Mais sa fonction est d'indiquer la prégnance relative des éléments entre eux et de définir l'organisation spatiale de l'image, d'indiquer finalement comment l'espace de représentation traduit l'espace représenté.

Au terme de l'exploration de cette photographie de R. Doisneau, nous proposerions les descripteurs suivants: /Doisneau/, /noir et blanc /, /un boulevard /, /des passants (allant) du fond à gauche vers le premier plan à droite/, /Prévert assis, profil tourné vers la gauche/, /une terrasse de café/, /un auvent à la limite supérieure (de l'image)/, /un tronc (d'arbre) à l'extrême gauche/, /Prévert assis devant un verre de vin posé sur une table /, /Prévert fumant une cigarette /, /le chien de Prévert/.

Deux informations auraient été nécessaires encore à la description de ce document :
- les quatrième et cinquième descripteurs traduisent ce qui oppose Prévert aux passants. Il serait intéressant de pouvoir souligner cette relation d'opposition au niveau de la présentation des descripteurs ;
- la mise en valeur du motif principal par le travail sur l'image que nous avons évoqué plus haut est difficilement traduisible en termes clairs pour l'utilisateur de la base de données. La visualisation des documents vient heureusement au secours de la description linguistique et permet à l'utilisateur de décrypter ce dont elle n'a pu rendre compte.

Au terme de cet inventaire, rapide et non exhaustif des problèmes posés par l'indexation des images, il nous semble important de souligner que les documents iconiques sont porteurs d'information et qu'à ce titre ils ont vocation à être intégrés à des systèmes d'information plus vastes et non spécialisés du point de vue du support, qu'il soit texte ou image, pour s'en tenir au seul domaine visuel.

L'indexation des documents iconiques n'étant pas encore automatisable, contrairement à celle des documents textuels, il faut faire en sorte, pour parvenir à cette intégration, de réaliser manuellement une indexation des images compatible avec l'indexation automatisée des documents textuels. Si l'indexation reste une opération manuelle, le système d'interrogation pour les documents iconiques pourra être le même que celui pratiqué pour les documents textuels.

C'est dans cette perspective que nous avons porté notre réflexion, éclairés dans notre démarche par les travaux menés par l'équipe SYDO (Systèmes documentaires) sur l'indexation automatique.

Illustration
La base de données d'images source d'information complémentaire