Indice, index, indexation

actes du colloque international organisé les 3 et 4 novembre 2005 à l'université Lille III par les laboratoires Cersates et Gérico

par Yves Desrichard
coordonné par Ismaïl Timimi et Susan Kovacs. Paris :  ADBS éd, 2006. – 304 p. ; 24 cm. – (Sciences et techniques de l’information).
ISBN 10 : 2-84365-088-7.
ISBN 13 : 978-2-84365-088-8 : 24 €

La réussite ou l’échec d’un colloque, et par conséquent de la publication de ses actes, résulte d’un savant hasard et d’une prudente nécessité : cohérence du thème, adéquation des différentes interventions avec ce thème, mais aussi détours iconoclastes et brillantes prospectives doivent alterner pour offrir aux auditeurs, puis aux lecteurs, tout à la fois un point solide et homogène sur les questions proposées, et quelques perplexités fécondes.

Une réflexion sans cesse renouvelée

Le thème du colloque « Indice, index, indexation », organisé par les laboratoires Cersates (Centre d’études et de recherche sur les savoirs, les arts, les techniques, les économies et les sociétés) et Gérico (Groupement des équipes de recherche interdisciplinaire en communication) de l’université Lille III en novembre 2005, avait tout pour séduire les professionnels de l’information soucieux de faire le point sur ces sujets. En effet, le travail descriptif des fonds a toujours été une composante fondamentale des métiers des bibliothèques et de la documentation, maintes fois revendiquée comme un des acquis techniques majeurs de la profession, donnant lieu à d’importants travaux normatifs (normes, listes, thésaurus…) et à une réflexion sans cesse renouvelée.

On se réjouissait donc de pouvoir, sous une forme synthétique et ordonnée par la pertinence des interventions et de leurs inférences, faire le point sur ces processus dont l’intérêt semble souvent battu en brèche par la « googlisation » accélérée des pratiques documentaires.

Hélas, entre fatras verbal et gratuité énonciative, bon nombre des interventions que, charitablement, on n’évoquera pas, découragent le lecteur néophyte et qui se revendique fièrement comme tel, pour faire réserver à l’élite (ou supposée telle) du discours informationnel la compréhension des recherches abordées, et des résultats présentés. C’est d’autant plus dommage, voire accablant, que ce qui est en jeu, c’est justement la crédibilité, en tant que discipline, des sciences de l’information et de la communication, de leur maîtrise, comme outil décisif d’aide à la recherche documentaire.

Recherche théorique, recherche appliquée

C’est, aussi, d’autant plus grave, qu’on a bien souvent l’impression que l’obscurité du discours cache en fait des notions simples, voire banales, déjà largement débattues, ou des objets de recherche dont l’intérêt laisse perplexe. Vieux débat que celui de la recherche théorique versus la recherche appliquée, qui traverse les sciences de l’information comme bien d’autres disciplines. On se permet cependant de penser que, à l’heure où il y a tant de documents à décrire, tant de documents à chercher, à évaluer, à sélectionner ou à rejeter, les recherches décisives sont sans doute ailleurs que là où nombre des auteurs du colloque vont les mener.

Quoique de haute volée, et obligeant à une lecture plus qu’attentive, l’article liminaire d’Yves Jeanneret, « Désigner, entre sémiotique et logistique », laisse espérer le meilleur. On en retiendra l’idée que « nous ne sommes pas libres d’inventer entièrement le monde, même dans le monde des signes », ce qui, sans doute, décevra plus d’un professionnel… Naviguant (c’est le cas de l’écrire) entre les notions d’index et d’indice, il démonte « la belle évidence de l’indicialité, roc apparemment ferme des manuels de communication, ouverte sur une constellation notionnelle aussi étendue qu’insaisissable ». Il donne envie de lire l’ouvrage de C. S. Peirce, Écrits sur le signe, qu’il utilise abondamment, avant de conclure ses interrogations sur la mise en œuvre des « ontologies », si à la mode à l’heure du web 2.0, « incapable[s] de rendre compte de la construction symbolique des représentations », mais qui peuvent « tout à fait s’imposer comme accès à l’expression des sujets et à la positivité des objets », avant de conclure : « Les sciences de la communication sont, décidément, plus que jamais, des sciences politiques. »

Corpus numériques et thésaurus

Plus anecdotique, la présentation par Susan Kovacs et Ghislain Dibie de « L’index du texte littéraire aux XVIIe et XVIIIe siècles, entre outil de consultation et discours critique », permet d’apporter un point de vue argumenté sur un débat qui fait rage entre partisans de Gallica, le corpus de documents numériques de la Bibliothèque nationale de France, avec sa numérisation en mode image, et de Google, qui propose, lui, la numérisation en mode caractère, permettant une recherche dans le texte intégral. On y découvre Montaigne adepte… du feuilletage, à propos des œuvres de Plutarque et de Sénèque : « Ils ont tous deux cette notable commodité pour mon humeur, que la science que j’y cherche y est traitée à pièces décousues, qui ne demandent pas l’obligation d’un long travail, de quoi je suis incapable. »

Hasard ou nécessité (voir plus haut), l’une des plus intéressantes interventions est sans conteste celle d’Isabelle Donze, documentaliste au laboratoire d’ethnologie et de sociologie comparative de l’université Paris X – Nanterre qui, dans « “Pékin”ou “Beijing” ? La construction d’un thésaurus de noms de lieux et la problématique de l’indexation des noms géographiques » propose une approche à la fois conceptuelle et pratique des modes de constitution d’un thésaurus géographique, tant par rapport aux objets à décrire (la Terre) qu’aux modalités de description (la représentation de la Terre, politique, géographique, etc.), aux modes de description (le ou plutôt les vocabulaires) mais aussi, voire surtout, aux pratiques de recherche des utilisateurs. Exposé dense et passionnant sur la construction de ce thésaurus, baptisé « GeoEthno », sur lequel on aimerait en savoir beaucoup plus.

Une dernière remarque : pas une seule fois la notion d’interrogation en « langage naturel » qui fut, de longues années, une des antiennes favorites de la recherche en sciences de l’information, sinon l’occasion d’avancées décisives, n’est évoquée dans cet ouvrage. Pourtant, à l’heure des ontologies, du web sémantique, du texte intégral, des moteurs de recherche et, aussi, de la « googlisation » évoquée plus haut, cette question aurait pu retrouver une certaine actualité.

Encore une fois, il ne s’agit là que du point de vue d’un amateur et, encore une fois, les actes d’un colloque ne peuvent proposer qu’une « vue en coupe », forcément schématique et lacunaire, de l’état de la recherche dans un domaine qui hésite entre concept et practicité, à la croisée du monde et de sa description. Pour autant, et dans un exercice masochiste souvent pratiqué, on ne pourra que comparer ces approches souvent vaines ou absconses et les projets anglo-saxons en la matière – entre réflexion et action, entre contemplation et mise en œuvre.