entête
entête

À quoi avons-nous renoncé ?

Yves Desrichard

À propos d’un article d’Éric de Grolier paru dans le Bulletin des bibliothèques de France  1

 

Vingt ans après… L’exercice peut être cocasse, salutaire ou anodin. Relire le Bulletin des bibliothèques de France avec ce recul est une proposition qui n’a de sens que si, d’une part, on veut bien replacer le texte dans son contexte (évidence aujourd’hui disparue, et qui vaut aussi pour les images, les sons, etc.), d’autre part, on n’adopte pas (en tout cas, pas d’emblée) une attitude surplombante, vaguement méprisante, entre le « Je vous l’avais bien dit » et le « Quelle naïveté de prévoir que… ». Inutile de préciser que l’exercice vaudrait dans tant de domaines, et pas forcément avec une telle ancienneté, qu’on s’étonne qu’il soit si peu pratiqué. Internet y est pour beaucoup – mais c’est une autre histoire.

Illustration
Couverture du BBF 1988-6

Le regard diachronique

Vraiment, c’est une autre histoire ? Pas si sûr. Car, en relisant « Taxilogie et classification : un essai de mise au point et quelques notes de prospective », écrit à l’aube du tout-informatique, on s’essaie sans vergogne à ce regard diachronique qui fait cruellement défaut. Non dans la recension de tous ces projets mirifiques et disparus dans les limbes de l’histoire des techniques documentaires (UMLS, Nephis, Smart, Intercolta, Tacitus…) qui se proposaient d’utiliser les possibilités de recherche informatiques, alors perçues comme sans limites, pour améliorer la recherche et l’identification de documents qui ne pouvaient être que textuels. Ni même dans l’ironie facile qui consisterait à placer en exergue la citation du plus qu’estimable Éric de Grolier sur le fait que « “Le livre électronique” a commencé à devenir une réalité ».

Non, ce qui oblige à la réflexion, c’est de constater qu’Éric de Grolier n’envisage le développement du document électronique que par le biais du livre alors que (vingt ans plus tard, tout de même) celui-ci reste le dernier bastion à conquérir et – surtout – que ce sont de nouvelles formes de documents qui ont assuré la domination de la documentation numérique, certaines « traditionnelles » (revues) d’autres spécifiques (sites web). Il ne s’agit pas de s’en gausser, juste d’inciter à la prudence, au risque d’un procès en archaïsme : aujourd’hui est au tout-numérique. Mais que sera demain ?

Plus moderne et plus troublant encore, le fait que de Grolier se prononce pour la « persistance de l’imprimé et du papier », annonçant qu’il ne croit « guère à cette paperless society dont […] tant de futurologues américains nous avaient annoncé le prochain avènement ». Ce faisant, il confond, ou feint de confondre, écriture, livre et support imprimé – l’erreur est commune  2. Ce qui est plus intéressant, c’est qu’il se place d’emblée dans une posture où les bibliothèques risquent d’être « transformées en musées de l’imprimé », autrement dit qu’il n’envisage absolument pas qu’elles puissent se saisir de ces nouveaux types de support, dont le nec plus ultra de l’époque est de les appeler « hypermédias ». Vingt ans plus tard, tout le chemin a pourtant été parcouru… alors pourquoi désespérer de demain ? La mission d’une bibliothèque n’est pas dans les supports qu’elle acquiert (ou non) et qu’elle communique. Les peurs non avérées d’hier doivent soulager de celles d’aujourd’hui même si tout n’est pas transposable.

Ces apartés ne sont pas, cela dit, le sujet de l’article. Il est essentiellement question de la classification du monde et, accessoirement, de sa représentation sous forme de mots. La phrase qui précède n’est pas une confusion. Loin de se cantonner à la sphère documentaire, de Grolier, suivant en cela ceux qu’il cite  3, va puiser ses références du côté de la sociologie ou des sciences de l’éducation, mais aussi de l’ethnologie, de la linguistique, de la sémiotique, voire de la philosophie.

Le grand débat qui sous-tend le texte peut (très grossièrement) se résumer dans la question suivante : « la connaissance précède-t-elle le langage ? » ou, traduit en langage bibliothéconomique, « peut-on concevoir une notion sans mots ? » (et si oui, que fait-on ?). Vaste sujet, qui excède très largement les efforts plus ou moins fastidieux déployés à l’époque, dans les associations de bibliothécaires et de documentalistes, pour le traiter. Comment ne pas percevoir que, dans un monde où l’audio et le visuel ont désormais la primeur sur les moyens d’information et de divertissement du plus grand nombre, le questionnement gagne en intensité, se force en résonance ? La collecte, le stockage, la gestion, la recherche et la restitution d’ensembles d’informations aussi vastes et aussi peu compréhensibles obligent à poser à nouveau ces questions : taxonomies, ontologies, folksonomies, tags et autres web sémantiques (on y revient) trahissent ces détresses conceptuelles. Vont-ils apporter des solutions décisives là où, vingt ans plus tôt, rien de tel ne se dessinait ? Bonne question.

Articuler

Ce qui frappe dans le débat tel qu’il est traité, c’est que l’auteur y convoque sans la moindre hésitation toutes les sciences qui peuvent avoir à faire avec : « On pourrait énumérer une dizaine ou une douzaine de disciplines intéressées », écrit-il. Et, sans embrasser si large, le propos se nourrit de philosophie, s’alimente de linguistique et de psychologie. Ce faisant, et dans l’évidence de cette démarche, il prouve que, vingt ans plus tôt, on se souciait mieux d’articuler les sciences de l’information et les autres sciences.

Autre remarque qui reste profondément juste, et qui est un peu le corollaire du souci de faire le lien entre les sciences de l’information et d’autres sciences, le fait que la taxonomie a été abandonnée par le champ des autres sciences, en d’autres termes, qu’elle est aujourd’hui « entièrement dominée par les mathématiciens et les informaticiens ». Plus que la présence des premiers, c’est l’alliance entre les deux qui étonne aujourd’hui. On a parfois l’impression, à lire certains discours, que l’informatique est devenue une science sociale, voire une science des comportements. Il y a vingt ans, ce type d’ambiguïté n’existait pas, n’avait pas lieu d’être. On ne s’était pas éloigné des présupposés algorithmiques (et donc mathématiques) de la science informatique. Il n’était pas question de qualifier de « réseaux sociaux » la création de liens hypertextes entre des pages écrites en html.

Un tel article aurait-il sa place aujourd’hui dans le Bulletin, alors même que la presse professionnelle est parfois sommée d’adopter une perspective utilitariste, voire égotechniciste ? La question mérite d’autant plus d’être posée qu’elle n’est pas sans conséquence sur la mise en œuvre de la formation professionnelle, du rapport de chacun à son exercice et à son métier, et donc du rapport de chacun à l’autre, décideur, usager ou non-usager. Retenons la leçon (qui ne s’érige pas comme telle) et pensons en transversalité – dans les limites humbles et égoïstes de sa propre « érudition », mais en convoquant justement ses « marges disciplinaires », au risque assumé de sa maladresse.

Mais qu’en est-il – donc – vingt ans après, de tous ces efforts taxologiques des années 90 ? À lire le compte rendu, parfois fastidieux, fait par Éric de Grolier des projets alors importants menés dans les différentes parties du monde, on se prend à se demander où en sont les tentatives de classification des connaissances qui ne seraient pas « polluées » par une vision mercantile, ou par une approche uniquement utilitariste (comment l’usager veut chercher) du sujet. S’ils existent encore, ces efforts semblent singulièrement modestes. Grisé par la possibilité de chercher partout, dans n’importe quoi, n’importe comment, on n’a plus l’ennui de penser/classer les choses, activité considérée comme fondamentalement conservatrice, en ce qu’elle induit (pense-t-on) non seulement la mise en perspective des productions mais, plus grave, une nécessaire hiérarchisation entre elles.

De fait, il y a un abîme entre l’importance accordée alors aux thésaurus dans la pratique documentaire et la réalité d’aujourd’hui. Il y avait le besoin, à l’aube d’internet, d’organiser les domaines de connaissance et leurs interrelations. Si l’outil documentaire semble désormais largement obsolète, faute de s’être traduit de manière convaincante dans l’aire informatique, la démarche d’organisation des domaines de connaissance et de leurs interrelations a-t-elle cessé d’être pertinente ? Comment l’affirmer alors qu’on peut multiplier les relations graphiques de représentation des résultats d’une recherche, dans des formes bien frustres si on les compare aux possibilités offertes par les versions… imprimées des thésaurus. Ce travail conceptuel, qui avait (a) le mérite d’une modélisation des connaissances dans une discipline donnée, gagnerait à être valorisé, et non écarté, par les gestionnaires à la recherche de techniques de plus en plus automatisées de formalisation de l’information et de ses contenus.

Traiter

Car, si l’informatique a (indéniablement) fait d’immenses progrès pour ce qui est de l’analyse morphologique, voire de l’analyse syntaxique, du vocabulaire, qu’en est-il exactement de l’analyse sémantique, la plus conceptuelle bien sûr ? Les moteurs de recherche les plus utilisés, et dont on suppose qu’ils sont les plus performants, devraient plutôt nous convaincre d’une régression dans ce domaine. On utilise souvent les « méthodes statistiques fondées sur la plus ou moins grande probabilité d’occurrence et/ou de co-occurrence utilisées pour la recherche d’informations en ligne », qu’Éric de Grolier présente en notant qu’on les préconisait déjà… en 1958. Certes, les capacités de traitement ont changé, et dans de gigantesques proportions. Mais, dans la mesure où le nombre de documents à traiter (souvent redondants, ce qui était moins vrai dans le « monde papier ») a explosé, tout comme la complexité des formes, des supports et des niveaux de ces documents, où est, exactement, le progrès ?

De plus, vingt ans après, a-t-on vraiment avancé quant à l’adéquation entre le vocabulaire d’interrogation et le contenu du document ? Paradoxalement, l’effacement de la notion d’index par la plupart des moteurs donne l’illusion de la recherche constante dans le texte intégral, alors que, le plus souvent, seule une partie du contenu est indexée, sans qu’on sache comment. Comme le dit bien Éric de Grolier : « Comme les techniques d’indexation automatique sont presque exclusivement fondées sur l’extraction de vocabulaires, il n’est nullement évident que ces techniques, si complexes soient-elles, puissent être efficaces en vue de fournir des représentations adéquates du contenu des documents. »

On ne saurait mieux dire, et l’article fournit d’autres exemples de ces pertinences anticipées qui sont le sel de l’exercice rétrospectif. Ainsi, on est étonné de voir évoquée la méthode des « réseaux sémantiques », sur laquelle on souhaiterait en savoir un peu plus, puisqu’elle ne peut qu’irrésistiblement amener à celle de « web sémantique », cœur du futur web 3.0.

Hélas, l’auteur l’écarte de son propos en écrivant « qu’il est cependant douteux que la théorie des réseaux sémantiques suffise à fournir une représentation adéquate des connaissances ». Le doute pouvait s’appliquer à la modélisation d’informations qui, ne l’oublions pas, étaient essentiellement secondaires, descriptives ou analytiques. Avec -l’accès direct aux documents primaires, nous sommes passés à d’autres schèmes de représentation et, par conséquent, de recherche. L’important n’est plus de savoir ce qu’on cherche, mais ce qu’on trouve, autrement dit non plus de conceptualiser sa recherche en en déterminant la correspondance avec un cadre préétabli (ontologie ou thésaurus), mais d’extraire de ce qu’on a trouvé les indices et les traces de son appartenance conceptuelle.

Autre prescience qu’il faut saluer, celle d’un d’universitaire américain ayant élaboré un « système de recherche d’information automatisé […] fondé sur l’extraction de termes pris, d’une part, dans les demandes de recherche des usagers, et d’autre part, dans les documents susceptibles de répondre à ces demandes ». Cette fois, nous y sommes.

Renoncer ?

Arrivé à la fin de l’article, on sent bien que ce n’est pas – pas forcément – ce questionnement sur l’efficacité de la recherche – ou non – automatisée, dans un contexte de tout-numérique, qui en fait le prix et la nostalgie. Si on peut s’interroger sur la place qu’occuperait, aujourd’hui, un tel article dans le Bulletin, sur ce que cet article traduit et que nous avons peut-être perdu, c’est au fond un rapport privilégié à l’analyse de ce que nous conservons. La possibilité de voir l’univers à travers nos collections, et la volonté de traduire « de manière concise, contrôlée et logique […] ce qui a été énoncé verbalement dans les textes compliqués [sic] des livres et des articles », comme l’indique un peu naïvement une documentaliste citée, qui souhaite (resic) « maîtriser la complexité de notre univers ».

Fortuite ou pas, la méprise entre l’univers et ce qui le décrit possède une vertu dynamique. L’univers peut encore être maîtrisé par ce qui le décrit à l’aube des années 90. Vingt ans plus tard, il n’en est plus même question. Nous avons largement renoncé à la mission de médiation, qui semble pourtant plus que jamais à l’ordre du jour, et plus grand monde ne va chercher dans ce qu’il lit, dans ce qu’il voit, dans ce qu’il entend, une connaissance de l’univers. Il ne s’agit pas de réhabiliter la perspective utilitariste, encore moins pédagogique, des collections, il s’agit de souligner que l’on ne pose plus, tout simplement, la question en ces termes. Nous avons renoncé. À quoi, je n’en sais trop rien. Mais nous avons renoncé.

Novembre 2008

  1.  (retour)↑  Voir : Éric de Grolier, « Taxilogie et classification : un essai de mise au point et quelques notes de prospective », 1988, no 6.
  2.  (retour)↑   Dont on trouve d’amusants échos dans les confusions journalistiques entre le papier électronique et les e-books façon Kindle d’Amazon, qui relèvent pourtant de techniques très différentes.
  3.  (retour)↑   Plus de 200 références pour un texte d’une douzaine de pages ! Beaucoup de rédacteurs du Bulletin des bibliothèques de France pourraient s’en sentir confus…