L’organisation des connaissances

Approches conceptuelles

Richard Roy

Après ses précédentes éditions (Lille, Lyon, Paris) plutôt consacrées aux questions de l’indexation automatique et des filtrages, ce quatrième congrès 1 de la société savante ISKO (International Society for Knowledge Organization)-France 2 a marqué un approfondissement théorique en recentrant ses travaux autour de deux questions fondamentales – Qu’entendre par « connaissance » ? Qu’est-ce que « organiser » des connaissances ? – en vingt communications structurées autour de cinq thèmes (Histoire ; Langue, terminologie et formalisme ; Multidimensionnalité ; Ontologies et thesauri ; Bibliothèque et appropriation).

S’il a manqué une session consacrée aux enjeux socio-économiques qui aurait pu développer la non-naturalité des classifications, cette dernière a néanmoins été illustrée par la conférence d’ouverture du philosophe Alain Lecomte, « Y a-t-il une logique de la classification ? ». L’activité de classement est fondamentale dans la cognition, mais de nombreux essais de formalisation de cette activité ont jusqu’à présent achoppé sur le problème en apparence insoluble des restrictions et exceptions.

Ni l’intelligence artificielle, ni sa version « réseaux connexionnistes » des années 1980 ne rendent objectivement et rationnellement compte des opérations de raisonnement naturel qu’il est peu vraisemblable de situer en continuité de procédures scientifiques. Quelques exemples tirés des sciences humaines montrent incontestablement le poids déterminant de l’idéologie dans les classifications.

Penser, classer à travers les siècles

Un historique de l’organisation et de la représentation des connaissances fut apporté sous trois aspects : bibliographique, politique et philosophique. Avec Susan Kovacs, nous avons observé l’apparition des index (nommés alors « tables » ou « indices ») dans les livres imprimés du XVIe siècle et leur développement dans des proportions démesurées (particulièrement dans les contrefaçons, sciemment calibrées en fonction de l’attente des lecteurs), sous l’influence des programmes pédagogiques humanistes, et notamment la généralisation de la pratique des « lieux communs » enseignée aux jeunes : relever idées et tournures classées par topiques pour y puiser ultérieurement la matière de nouveaux discours. Suivre l’évolution de cet outil le révèle en quête de sens. En effet, si le texte est bien consacré comme ressource informationnelle, l’index, conçu à la fois comme répertoire de thèmes et de personnages, classés par ordre alphabétique, et classification des savoirs appliquée aux contenus, comme système de classement de termes et système de classification de valeurs, comme recension et classification a priori, l’index révèle une ambiguïté fondamentale déjà signalée par Érasme, qui proposait (dès 1515) une évolution vers la représentation des concepts au moyen de mots-clefs. La pratique des annotations et ajouts manuscrits par des lecteurs confirme, elle, la démarche de recherche-réemploi véhiculée par l’index et révèle des pratiques culturelles de l’époque qui devaient influencer en retour la mise en forme des livres et leur appropriation.

Roger Bautier a abordé la fonction d’organisation des connaissances par les classifications sous l’angle politique, à partir de l’opposition entre « doctrinaires » et « saint-simoniens » durant la première moitié du XIXe siècle autour de la question de savoir si, dans cette période de lendemains de la Révolution et de l’Empire où se construisait une nouvelle société, l’on devait se lancer dans l’édification des « nouveaux systèmes » grâce au travail commun de tous les savants européens, autrement dit réaliser « une encyclopédie conçue dans un esprit essentiellement organisateur » (Auguste Comte, 1817), et jusqu’où aller dans cette volonté organisatrice. Guizot et son Encyclopédie progressive d’un côté, Saint-Simon (puis Armand Bazard) de l’autre, défendaient des approches opposées, pragmatiste pour les premiers, radicale pour les seconds. Opposition prolongée durant tout le siècle par l’élaboration des expositions universelles (éclatante illustration des théories des seconds, notamment Dupin et Le Play), que l’on peut déceler aussi dans la communication politique (avec, cette fois, montée du modèle anglo-saxon des news au détriment de la presse bâtie autour de l’édito à la française) et à laquelle les discussions sur la structure du web font écho aujourd’hui.

Avec Inaam Charaf, c’est l’évolution de la classification des sciences dans la pensée islamique du Xe au XIVe siècle qui fut présentée à partir de trois philosophes fondateurs : Al-Farabi, Al-Ghazali et Ibn-Kaldoun, et le passage de l’aristotélisme à une approche épistémologique, puis religieuse et enfin rationnelle-civile, pour souhaiter que le monde arabe d’aujourd’hui, où les besoins documentaires sont « satisfaits » au moyen d’adaptations de classifications anglo-saxonnes, développe à son tour un système basé sur sa culture propre.

Un échange fructueux autour des questions du web

Dans le cadre d’une session intitulée « Multidimensionnalité », le philosophe Benoît Hufschmitt posait la question d’une possible indexation des textes philosophiques, à l’encontre des objections aujourd’hui dominantes en France, objections fondées sur l’argument que, dans les discours de ce type (c’est-à-dire en langue naturelle), les concepts ne sont pas isomorphes aux mots. S’attachant à montrer en quoi les textes argumentatifs sont terminologiques, il propose de reprendre la notion de multi-terminologie, de distinguer dans tout texte philosophique ses espaces doctrinaux et dénotatifs et de les indexer à l’aide de descripteurs selon quatre facettes (doctrine-source, doctrine-objet, discipline d’usage, discipline-objet), l’automatisation de ces extractions restant toutefois à cette heure entièrement à réaliser.

Les ontologies, apparues dans la dernière décennie dans le domaine documentaire à côté des thesauri (ou contre eux ?), ne pouvaient manquer de faire l’objet de plusieurs communications, de même encore que les questions de langue, de terminologie et de formalisme. Enfin, la session « Bibliothèque et appropriation » permit un échange fructueux autour des questions du web et des catalogues en ligne. Elle fut l’occasion de présenter aux chercheurs et praticiens de la documentation les avancées réalisées en 2003 en matière d’accès thématique aux collections de bibliothèques via les interfaces web de leurs catalogues 3 et de croiser cette approche avec les travaux de Madjid Ihadjadene sur l’utilisation de la classification Dewey pour catégoriser automatiquement les résultats obtenus lors d’une recherche dans un catalogue en ligne, et ceux de Thierry Soubrié dans le domaine des auxiliaires pour l’appropriation de l’information sur le web (logiciel AUKAPIWeb en développement).

Les approches conceptuelles ne sont pas la démarche dominante aujourd’hui. Aussi ces deux journées marquées au coin de l’épistémologie faisaient-elle l’effet d’un bol d’oxygène… Pour la première fois aussi, ce congrès du chapitre français de l’ISKO était hébergé par un institut universitaire de technologie : signe d’une volonté de rapprocher enseignants et praticiens de la recherche vivante. Il est dommage que trop peu de bibliothécaires y aient participé. On peut espérer que la prochaine édition (dans deux ans) soit l’occasion de réparer cette ignorance sans doute due à une crainte (en partie seulement fondée) de débats trop techniques. Il est vrai que certains travaux de recherche présentés en ce genre de circonstance sont parfois à la limite de l’ésotérisme pour les gens de terrain, mais une participation plus significative de ces derniers aux communications et aux débats ferait incontestablement évoluer de telles rencontres au bénéfice mutuel de confrontations transdisciplinaires sur un thème aussi central pour les bibliothèques que l’organisation des connaissances.