Classification et analyse des relations

Désiré Kervégant

Le développement de la littérature des périodiques (représenté par une courbe d'allure exponentielle) et l'importance prise par la documentation dans le domaine de la recherche scientifique et technique, au cours du dernier demi siècle, ont donné aux méthodes d'accès aux documents une importance primordiale.

Les systèmes de classification traditionnels ne permettent malheureusement pas de réaliser cet accès d'une façon satisfaisante. « Aujourd'hui, écrivait Shera il y a quelques années, cette foi touchante dans l'efficacité de la classification systématique, telle qu'elle a été traditionnellement appliquée aux livres, commence à faiblir, car il ne peut être plus longtemps mis en doute que la classification bibliothéconomique a failli, et failli lamentablement, à réaliser ce pour quoi elle a été conçue. »

Les réactions des bibliothécaires et documentalistes ont été diverses. Les uns ont conclu à la faillite de la classification et ont cru trouver dans la sélection mécanique une solution au problème de l'accession aux documents. D'autres ont recherché des formules nouvelles, dégagées de l'ordre hiérarchique traditionnel et permettant de rechercher les sujets à partir de points de vue ou coordonnées multiples.

Les uns et les autres ont été amenés à approfondir les principes fondamentaux de la taxilogie bibliographique, et les conclusions auxquelles ils sont parvenus présentent de curieuses analogies. Il en est ainsi notamment en ce qui concerne l'analyse des relations entre les termes, considérée à l'heure actuelle par beaucoup comme l'un des problèmes les plus importants, aussi bien dans le codage en vue de la sélection par les machines que de la classification systématique ou alphabétique.

Relation de subordination.

La logique classique ne reconnaît qu'un seul type de relation : la subordination du spécifique au générique, appliquée dans la classification hiérarchique, la plus utilisée en bibliothéconomie (systèmes Dewey, Cutter, Bibliothèque du Congrès, Bliss, etc...).

Les grands domaines de la connaissance sont assemblés en classes principales, conformément à une certaine théorie philosophique. Chacune de celles-ci (« genre » logique), par l'addition d'une caractéristique, ou « différence », est divisée en sous-classes (« espèce » logique), lesquelles, par addition d'une nouvelle différence, sont divisées à leur tour en sections, et ainsi de suite jusqu'à ce que l'on parvienne à l'« infima species », qu'il est inutile de subdiviser davantage. Toute classe se présente ainsi simultanément comme incluse en une classe d'ordre supérieur et comme incluant une classe d'ordre inférieur, à l'exception de la classe considérée comme totale (genre suprême) et des classes considérées comme élémentaires. Chaque rang de la hiérarchie pourra, par contre, être occupé par un nombre indéterminé de classes primaires non ordonnées (logiquement) entre elles. L'ensemble de la classification présente la forme d'un arbre généalogique.

La division logique suit certaines règles, qui ont été formulées notamment par Berwick Sayers et qui peuvent être résumées succinctement comme suit :
a) Elle doit procéder des termes de grande extension et de faible compréhension aux termes de grande compréhension et de faible extension;
b) Elle doit être graduelle;
c) Les caractéristiques de division doivent être homogènes et essentielles par rapport au but poursuivi;
d) L'énumération des parties doit être exhaustive.

La relation de subordination, malgré la grande importance qu'elle présente en taxilogie bibliographique, ne permet pas, à elle seule, de construire des systèmes de classification donnant pleine satisfaction.

Il y a lieu de signaler tout d'abord que le principe de la proportionnalité inverse de l'extension et de la compréhension, s'il est applicable aux classes appelées par Piaget « faiblement structurées » (classes de la biologie, qui ont des relations purement intensives de parties à tout), cessent de l'être dans le cas des classes « structurées » (la plupart des classes mathématiques) et « semi-structurées » (classes physiques et chimiques, qui introduisent à des degrés divers les quantités extensives et métriques).

D'autre part, l'utilisation de la seule relation de subordination donne une classification énumérative, se développant dans un seul plan, avec une place déterminée pour chaque sujet. Il est très difficile d'introduire des sujets nouveaux, qui apparaissent avec l'avancement des connaissances, sans porter atteinte à la structure de cet ensemble « monolithique ».

Il est encore plus difficile de tenir compte des caractères multiples, appartenant à des classes différentes, sous lesquels un sujet peut souvent être considéré. Ainsi, les êtres vivants sont susceptibles d'être groupés d'après leur forme (plantes, insectes, oiseaux, mammifères), leur habitat (aquatiques, terrestres, amphibies, xériques), la distribution géographique, le mode d'alimentation, etc...

Dans une classification purement énumérative, les points de vue différents suivant lesquels est traité un sujet, peuvent être précisés, en introduisant ce dernier en plusieurs sections simultanément. L'écologie, par exemple, se retrouve sous les indices suivants dans la Classification de Dewey :
574.5 Écologie générale
302.3 - humaine
58I.5 - végétale
59I.5 - animale
634.94 - forestière

Bliss a systématiquement utilisé ce procédé dans ses tables « alternatives » Ainsi, la bactériologie peut être placée en botanique systématique, botanique appliquée ou biologie économique; la biochimie en biologie ou chimie; la minéralogie en chimie ou géologie.

Cette plurilocation, qui correspond d'ailleurs au désir du spécialiste de voir réunies dans la section correspondant à son domaine, toutes les questions qui l'intéressent, est motivée dans certains cas. La conception du groupement est, en effet, parfois très différente suivant les classes : pour les plantes, par exemple, en botanique, en pharmacologie et en agriculture; pour les animaux en zoologie et en agriculture.

Il reste cependant que les plurilocations seront, dans une classification générale, une source de confusion et d'éparpillement des sujets. Même si l'on décide, comme le conseille Bliss, de retenir un seul des emplacements et d'éliminer les autres comme ne correspondant pas au point de vue de la bibliothèque intéressée, ceci implique le sacrifice de points de vue qui, pour certains utilisateurs, peuvent avoir une grande importance.

Il apparaît préférable en conséquence d'envisager, pour traduire les différents points de vue, une classification à plusieurs dimensions, utilisant des types de relation autres que la hiérarchisation de la logique classique. La forme la plus simple d'une telle classification est représentée par les subdivisions communes des systèmes traditionnels.

Subdivisions communes.

La plupart des systèmes de classification modernes possèdent des tables, dites auxiliaires ou de subdivisions communes, groupant des caractéristiques susceptibles d'être appliquées aux sujets énumérés dans les tables principales. Il s'ensuit que la forme hiérarchique pure, que l'on rencontre en botanique et zoologie systématiques, n'existe pas en bibliothéconomie. Les caractéristiques communes sont ajoutées au sujet principal par l'intermédiaire d'un signe spécial (le point, le zéro, les guillemets, etc...), qui indique le passage à une série différente de concepts.

Les tables auxiliaires communes comprennent généralement les subdivisions de forme intellectuelle des documents (traité, dictionnaire, périodique, etc...), et les subdivisions historiques, géographiques, linguistiques s'appliquant au sujet.

Assez souvent aussi, on y inclut des caractéristiques applicables seulement à certaines classes. On retrouve de telles caractéristiques notamment dans les « tables catégoriques » de Brown, qui renferment, à côté des subdivisions de forme traditionnelles, des sujets aussi particuliers que « eaux résiduaires », « voyages », « marine », « chaleur », « construction » ; dans les « tables auxiliaires spéciales » de Bliss, utilisables en chimie, industries chimiques, botanique et zoologie systématiques, agriculture spéciale, zootechnie, etc... et dans les « subdivisions analytiques spéciales » de la chimie, botanique, zoologie, etc... de la Classification décimale universelle (C.D.U.).

La nature de la relation qui unit la caractéristique considérée au sujet principal est rarement précisée; il s'agit le plus souvent d'une relation vague d'attribution ou d'orientation  1. Parfois cependant, la relation est nettement déterminée, ainsi que le montre l'exemple suivant emprunté à la C.D.U. (extrait de la table des subdivisions communes de la botanique, 581) :
58I.0I Influence des facteurs internes
.03 - physiques et mécaniques
.04 - chimiques
.05 - géologiques et météorologiques
.07 - biologiques
.08 Méthodes expérimentales
.09 Méthodes de culture

Ce mode d'indexation donne cependant lieu à une grave critique : il masque l'information représentée par la subdivision. L'usager désirant réunir une documentation relative, par exemple, à « l'action des facteurs météorologiques sur les plantes », devra parcourir toutes les rubriques de la botanique (anatomie, morphologie, physiologie, écologie, etc...) auxquelles peut être accolé le suffixe .05. Or, en matière de classification bibliographique, il ne s'agit pas seulement de représenter correctement par un indice le sujet d'un document, mais encore et surtout de permettre de retrouver facilement et rapidement ce dernier.

Aussi, si les subdivisions analytiques spéciales peuvent être utilisées avantageusement par des organismes particuliers dont le point de vue est bien fixé, il n'en sera pas de même pour les bibliothèques générales, qui auront une clientèle de chercheurs dont les points de vue peuvent varier dans de larges limites.

Relation générale de la C.D.U.

La plus importante innovation introduite par Otlet et Lafontaine, dans leur adaptation de la « Classification décimale » de Dewey à l'indexation des références bibliographiques, a été l'emploi du signe de relation générale, les deux points « : ». Le « corset de fer » de la classification énumérative était ainsi brisé, et la possibilité était donnée de construire des systèmes de concepts par la mise en relation des termes d'une même classe ou de classes différentes.

Il existait malheureusement un revers de la médaille, accentué encore par la permutabilité des indices simples de la C.D.U. Les deux points, indiquant seulement une relation d'un ordre quelconque, sans préciser la nature de celle-ci, introduisent systématiquement l'homonymie, défaut cardinal pour un système de classification. On peut en donner les deux exemples suivants, qu'il serait facile de multiplier :
a) 576.8.097 :
(antibiotiques)
582.28
(champignons)
qui signifie « antibiotiques d'origine fongique » ou « antibiotiques antifongiques ».
b) 63I.4 :
(sol)
633-II
(blé)
qui peut avoir l'une ou l'autre des acceptations suivantes :
- Relations entre le sol et le blé;
- Terres à blé (ayant pour « vocation » la culture du blé);
- Terres en blé (cultivées en blé);
- Influence du sol sur le blé;
- Influence du blé sur le sol;
- Interactions du sol et du blé.

Pour réduire l'homonymie, il a été suggéré de préciser les fonctions grammaticales des termes. Bradford donne l'extrait suivant d'une table des nombres auxiliaires, qui ont été proposés pour la C.D.U. et qui sont à placer en exposants des indices classificateurs :
00I sujet
002 complément
043 terme précédent au futur
063 - à la voix active
064 - à la voix passive

Ainsi, la phrase « Le service de santé transportera par cargo les mercenaires atteints de choléra asiatique », serait exprimée par :
356.33001: 629.123.14043: 355.216002: 616.932064

Les « désinences fonctionnelles » de Cordonnier, introduites par la lettre « y », sont destinées aussi à former « une grammaire au moins élémentaire..., pour distinguer noms, adjectifs, verbes, sujets et compléments directs ».

Il ne semble pas cependant que la relation grammaticale représente une solution satisfaisante. « La grammaire n'a guère sa place ici, écrit de Grolier. La classification proprement dite, comme Ranganathan l'a bien vu, n'a besoin que de substantifs et de conjonctions. Elle n'a que faire du fatras grammatical des langues indo-européennes. »

Relations spécifiques des classifications analytico-synthétiques :

Ranganathan, qui, dans sa « Colon classification », utilise systématiquement la synthèse pour la construction des sujets particuliers des classifications énumératives, reconnaît six types de relation, chacun représenté par un symbole de connexion particulier :
I° Orientation, lorsque le second sujet constitue une forme d'exposition du premier. Symbole de connexion « O ». Exemple : Traité de mathématiques à l'usage des physiciens, des biologistes BOC, BOG (B Mathématiques, C Physique, G Biologie).
2° Utilisation, si le second sujet est l'instrument au moyen duquel est étudié le premier. Symbole : les deux points « : ».
3° Aspect, lorsque le second sujet représente l'aspect sous lequel est étudié le premier. Même symbole que dans la relation précédente, dont elle est parfois difficile à distinguer. Exemple : Microbiologie du sol J : 1 : 123 (de J : 1 sol et 123 Microbiologie).
4° Comparaison, lorsque les sujets sont comparés l'un à l'autre. Symbole « Oc ». Exemple : La Physique comparée à la Chimie COcP.
5° Influence, quand le second sujet influe sur la teneur ou le développement du premier. Symbole « Od ». Exemple : Géopolitique (Science politique influencée par la géographie) WOdU.
6° Relation générale, pour tous les types de rapports autres que ceux indiqués antérieurement. Symbole « e ».

Ranganathan semble limiter l'utilisation des relations ci-dessus aux sujets relevant de classes principales différentes (« phases »). Mais d'autres auteurs, qui se sont ralliés aux principes ranganathiens, Vickery par exemple, les étendent aux catégories (ou « facets ») d'une même classe et aux termes d'une même « facette ». Ceci avec juste raison. Les sytèmes de concepts et les concepts complexes, que l'on obtient par la combinaison des « facettes », ou concepts élémentaires, comportent, en effet, non seulement des termes, mais des rapports. Si la nature de ces derniers n'est pas indiquée, l'expression des concepts demeure le plus souvent imprécise ou incomplète.

Ainsi que l'a fait remarquer Mills, les relations de phases de Ranganathan sont en nombre très limité et ne constituent pas par ailleurs une série homogène. La relation d'influence, par exemple, représente l'interaction de deux domaines, tandis que celle d'orientation est une catégorie bibliographique (mode d'exposition du sujet).

Farradane s'est efforcé de ramener à quelques types très généraux, qu'il dénomme « opérateurs », toutes les formes particulières que peuvent revêtir les connexions entre deux concepts quelconques. Se basant sur l'épistémologie et, plus particulièrement, sur l'analyse de deux processus psychologiques considérés comme prédominants dans le développement des connaissances : l'acte de « différencier » une perception d'une autre, et celui de la « relier », d'une façon permanente ou temporaire, à d'autres perceptions, il a reconnu les neuf types (plus leur négation) donnés dans le tableau ci-après (voir tableau 1).

Les significations des opérateurs, qui représentent les combinaisons fondamentales de nos perceptions, sont difficiles à exprimer en termes simples, et les noms qui ont été donnés ne doivent pas être pris dans un sens trop littéral ou trop restrictif. Ainsi, la « concurrence » exprime la simple coexistence de deux faits ou concepts; l' « association », la coexistence régulière de deux faits; l' « équivalence » s'applique à des degrés divers de similitude et non seulement à l'identité.

Chaque opérateur indique la relation existant seulement entre les deux termes qui l'encadrent (à moins d'exception indiquée par les crochets carrés). La position du signe (orthographique ou mathématique) par rapport à la barre de fraction précise quel est le terme objet de la relation.

Exemples : Sujet : Histoire d'Angleterre
Analet : Histoire/+Angleterre
Sujet : Émulsion d'huile dans l'eau
Analet : Émulsion/(Huile /+ Eau

Selon Vickery, il n'est nullement certain que les opérateurs de Farradane englobent toutes les sortes de relation dont il y ait lieu de tenir compte, même si l'on se limite au domaine des sciences naturelles. Le même auteur estime, au contraire, que les relations sont trop nombreuses et variées pour qu'il soit possible de les ramener à quelques catégories générales.

L'analyse des relations au moyen de particules traduisant des rapports particuliers entre les concepts a été développée surtout dans les systèmes analytico-synthétiques, où les termes du langage (courant ou scientifique) sont résolus d'abord en leurs concepts élémentaires (« facets » de Ranganathan, « isolats » de Farradane, « facteurs sémantiques » de Perry, « descripteurs » de Mooers), lesquels sont assemblés ensuite en « agrégats sémantiques », selon l'expression de Vickery. Si elle paraît moins s'imposer quand il s'agit des systèmes de classification hiérarchiques traditionnels, qui sont déjà plus ou moins fortement structurés, elle est suceptible de rendre cependant ici aussi de très grands services, en permettant une indexation plus poussée et plus précise. On pourrait même sans doute soutenir qu'elle est une condition de la conservation, dans les services de documentation, de ces systèmes, qui tendent à cristalliser une connaissance multidimensionnelle en une hiérarchie linéaire unique.

Analyse des relations et classification hiérarchique.

Nous avons nous-mêmes suggéré, il y a quelque temps, divers types de relations susceptibles d'être appliqués à la C.D.U. Ceux-ci sont représentés par des nombres décimaux encadrés par des flèches, orientées vers l'objet de façon à distinguer éventuellement l'agent et le patient, le sujet et l'objet de la relation. Ce mode de symbolisation permet non seulement d'économiser les symboles (ceux proposés jusqu'ici ont été le plus souvent des signes arbitraires, variables avec chaque type de connexion), mais encore et surtout de construire des catégories de relations connexes, susceptibles d'une spécification plus ou moins poussée suivant les besoins, et de concilier peut-être ainsi les points de vue divergents de Farradane et de Vickery.

Ci-après ces types de relation, avec quelques modifications cependant par rapport à la façon dont ils ont été primitivement exposés.

I. Appartenance.
→ II → Inclusion, implication
→ 12 → Parties, organes
→ 13 → Composants, constituants
→ 14 → Propriétés, attributs
→ 14I → - physiques
→ 142 → - chimiques
→ 143 → - biologiques
→ 15 → Aptitudes, prédispositions.

2. Processus.
→ 2I → Action : agissant sur (sujet), affecté par (objet)
→ 2II → Favorable (stimulation, accroissement)
→ 212 → Défavorable
→ 212I → Retardement
→ 2122 → Inhibition
→ 2123 → Destruction
→ 2I ← Interaction
→ 2II ← Favorable (symbiose)
→ 212 ← Défavorable (antagonisme, concurrence)
→ 22 → Opération, moyen utilisé : procédé (sujet), produit, résultat (objet).

3. Dépendance.
→ 3 → Causalité, origine, etc...
→ 3I → Causalité : cause (sujet), effet (objet)
→ 32 → Origine : à l'origine de (sujet), provenant de (objet)
→ 33 → Condition, exigences; conditionnant (sujet), conditionné (objet)
→ 3 ← Interdépendance
→ 31 ← Corrélation
→ 32 ← Association
→ 33 ← Combinaison, synthèse.

4. Orientation.
→ 4I → Aspect, cas particulier
→ 42 → Application
→ 43 → Utilisation.

5. Comparaison.
→ 5I → Ressemblance
→ 5II → Analogie
→ 512 → Égalité, identité
→ 52 → Dissemblance
→ 52I → Différence
→ 522 → Opposition (de caractères).

La négation d'une relation peut être représentée, soit en faisant précéder d'un zéro le nombre correspondant, soit en surmontant ce dernier du signe utilisé à cette fin en logistique, le trait.

Un exemple plus complexe, où l'un des termes est constitué par un système de concepts délimité par les crochets carrés, est le suivant :
« Influence du climat sur la résistance de la pomme de terre aux maladies à virus. »
55I.8 → 21 → [63I.52I.6 → 41 → 632.38] → 42 → 633.49I
climat résistance aux virus pommes de terre

Il est facile, une fois déterminés la nature, le sujet et l'objet de la relation, d'effectuer la transposition des termes, de façon à mettre en vedette la notion intéressant les divers spécialistes : « climat » pour le bioclimatologiste, « résistance aux virus » pour le phytopathologiste et le généticien, « pomme de terre » pour l'agronome. On aurait ainsi :
[63I.52I.6 → 41 → 632.38] ← 2I ← 55I.8 → 42 → 633.49I
633.49I ← 42 ← [63I.52I.6 → 41 → 632.38] ← 21 ← 55I.58

Les catégories qui précèdent n'ont été données qu'à titre indicatif, en envisageant particulièrement leur application aux sciences biologiques. Il importerait d'effectuer des études plus poussées pour définir les formes de relation plus ou moins détaillées, utilisables dans les divers domaines de la connaissance.

Analyse des relations et classification alphabétique.

La classification alphabétique des vedettes matières est encore, à l'heure actuelle, le système de beaucoup le plus utilisé en bibliothéconomie. On la trouve appliquée non seulement dans le catalogue alphabétique de matières, le plus commun dans les bibliothèques américaines (où il prend le plus souvent la forme de catalogue dictionnaire) et officiel en France pour les bibliothèques universitaires depuis 1952, mais encore dans les index annuels des périodiques bibliographiques (« Chemical abstracts », « Bibliography of agriculture », etc...) et les index matières qui accompagnent les tables des classifications systématiques.

Nous ne signalerons que pour mémoire les classifications alphabético-systématiques et systématico-alphabétiques, types hybrides cumulant les défauts des systèmes méthodiques et alphabétiques et que l'on ne trouve plus appliquées que dans quelques catalogues anciens (tel celui du « British Museum »). Mais, même dans une classification alphabétique pure, la nécessité de recourir à une analyse des relations se fait sentir.

Tout d'abord le choix du mot vedette entre les nombreux synonymes ou quasisynonymes de la langue, courante ou même scientifique, se présente comme très délicat et comporte nécessairement une certaine subjectivité. L'utilisation des listes des vedettes qui ont été publiées réduit les difficultés, mais sans les supprimer (surtout quand il s'agit de bibliothèques spécialisées).

Sans doute les synonymes figurent-ils au catalogue et sont-ils reliés par des renvois « voir » aux vedettes. Il reste important cependant d'éliminer celles de ces dernières qui sont constituées par des termes synonymes, imprécis ou se chevauchant. Pour y parvenir et avoir des vedettes dont l'acception soit constante, J. Pettee a préconisé une analyse logique des sujets, qui conduit à construire des cartes de classification pour les différents domaines couverts par le catalogue, en vue de préciser les connexions de chacun de ces domaines.

Cutter, dont les « Rules for a dictionary catalogue » ont marqué si fortement la plupart des codes catalographiques, a jugé indispensable, pour permettre au chercheur, qui aborde souvent le catalogue par des termes trop généraux, de passer aux termes particuliers qui l'intéressent, d'établir des renvois d'orientation « voir aussi ». Ces derniers, estime-t-il, ne peuvent être convenablement élaborés que si l'on construit des « tableaux synoptiques », indiquant les connexions existant entre les termes. Pour éviter le travail considérable qui en résulterait, si ceci devait être fait pour un seul catalogue, une solution plus pratique consiste à se raccorder à un système de classification encyclopédique.

Un autre problème important de la Classification alphabétique est la subdivision des vedettes dans les rubriques complexes. Pour éviter les confusions et les duplications pouvant résulter des variations dans l'ordre de succession des sous-vedettes, divers auteurs ont proposé de classer ces dernières en catégories, à énumérer toujours dans le même ordre.

Ainsi, Kaiser distingue les termes « concrets » qui peuvent être des personnes ou des choses, et les « processus », ou actions accomplies ou subies par les précédents (tels que recherche, construction, propriétés, ...). Les premiers constituent les vedettes, et les seconds les subdivisions, classées dans l'ordre alphabétique.

Holmstrom, après avoir subdivisé hiérarchiquement chaque vedette, groupe aussi les sous-vedettes en catégories :
A - Action exécutée ou subie par le sujet figuré à gauche
C - Nom collectif en rapport avec le sujet...
E - Équipement utilisé pour le sujet...
H - Localisation géographique...
K - Type du sujet...
N - Nom de personne en rapport avec le sujet...
P - Partie du sujet...

Thompson, dans le cas de l'architecture, a retenu les catégories suivantes : A réalisation; B matériau; C processus et problèmes; D lieu géographique; E temps; F forme littéraire, qu'il convient d'énumérer rigoureusement dans l'ordre indiqué.

Cette façon de faire rappelle beaucoup la procédure appliquée par Ranganathan dans sa « Colon classification ». Ici, les concepts simples sont groupés en « facets » suivant les cinq grandes catégories : personnalité, matière, énergie, espace, temps, et, dans la construction d'un indice composé, apparaissent strictement suivant cette dernière séquence.

Si l'on admet que, dans le cas d'un sujet représenté par plusieurs termes, il importe d'établir les renvois à partir de chacun de ceux-ci, on ne saurait cependant songer à faire autant de renvois qu'il y a de combinaisons possibles entre les termes. « Une telle multiplication serait ridicule et intolérable..., ces combinaisons ne sont jamais toutes formées » (Mooers).

Ranganathan a préconisé, pour permettre à l'usager de parvenir au document, quel que soit le terme ou la combinaison de termes qu'il formule, l' « indexation en chaîne ». Celle-ci consiste à : déterminer l'indice qu'il y a lieu de donner au sujet dans une classification systématique; décomposer cet indice en ses éléments constitutifs; mettre, en face de chacun de ces derniers, le terme verbal approprié, et enfin disposer ces termes dans l'ordre alphabétique, en les faisant suivre de l'indice classificateur.

Soit le sujet : « Traitement du cancer du voile du palais », représenté par la vedette composée : Voile du palais-cancer-traitement, et par l'indice de la « Colon classification» : L 2153 : 4725 : 6. La décomposition de l'indice en ses éléments constitutifs donne :
L Médecine
L 2 Système digestif
L 21 Bouche
L 215 Palais
L 2153 Voile du palais
L 2153 : 4 Maladies
L 2153 : 47 Maladies plastiques
L 2153 : 472 Tumeur
L 2153 : 4725 Cancer
L 2153 : 4725 : 6 Traitement

En disposant les différents maillons de la chaîne des termes dans l'ordre alphabétique et en les faisant suivre des nombres indiciaires, on obtient :
Bouche : voir L 21
Cancer : voile du palais : voir : L 2153 : 4725
Maladies : voile du palais : voir L 2153 : 4
Maladies plastiques : voile du palais : voir L 2153 : 47
Médecine : voir L
Palais : voir L 215
Système digestif : voir L 2
Traitement : cancer : voile du palais, voir L 2153 : 4725 : 6
Tumeur : voile du palais : voir L 2153 : 472
Voile du palais : voir L 2153.

Quelle que soit la combinaison de termes formulée par l'usager, l'index alphabétique dirige ce dernier vers l'emplacement du catalogue méthodique où il trouvera l'un des anneaux de la chaîne qui le conduira au sujet cherché.

Cette façon de faire associe étroitement classification alphabétique et classification méthodique, considérées comme complémentaires dans la recherche des documents, la première permettant d'accéder directement à un sujet spécifique, qui peut d'ailleurs ne pas figurer dans les tables systématiques (comme constituant un cas trop particulier ou provenant d'une synthèse de notions simples) la seconde groupant tous les sujets apparentés génériquement.

L'application de la procédure en chaîne améliorerait aussi très sensiblement les index bibliographiques, dont les plus remarquables, tel celui des « Chemical abstracts », laissent à l'heure actuelle beaucoup à désirer en ce qui concerne la complétude et la régularité des références dans le cas de sujets composés. Elle permettrait, surtout si elle est associée à une classification à « facets » d'après Vickery, d'avoir des vedettes consistantes et d'accéder aux sujets complexes à partir de chacun des éléments qui les constituent.

Analyse des relations et sélection mécanique :

Dans les systèmes de sélection mécanique les plus simples, tel celui de Samain, chaque terme servant à l'indexation est représenté par un indice codé distinct. La machine trie, dans un paquet de cartes, toutes celles comportant un indice ou une combinaison d'indices déterminés. Ceci peut donner des résultats suffisants dans les cas relativement simples, que l'on rencontre souvent dans l'industrie et le commerce. Mais il n'en serait plus de même en matière de sélection bibliographique, suivant certains auteurs.

Perry et ses collaborateurs, à la suite de recherches approfondies en matière de sélection mécanique, sont arrivés à la conclusion que le « codage direct des mots servant à l'indexation, est une méthode d'approche extrêmement naïve, et d'une efficacité tout à fait limitée ».

Les concepts généraux (« animal » par exemple) nécessitent, en effet, souvent la recherche de tous les concepts plus particuliers qu'ils impliquent (cheval, chien, chat, rat...). Perry recommande, en conséquence, d'introduire dans les indices codés des sujets les éléments représentant les concepts plus génériques. Il donne comme exemple d'un tel code :
Animaux................. NA
Mammifères .............. NAMA
Rat ..................... NAMARA
Baleine .................. NAMARAWA
Insectes .................. NANI
Popilia japonica ........... NANIJA

En outre, pour que les sujets ayant un élément de signification commun soient codés de la même façon, les expressions de langage sont résolues en leurs « facteurs sémantiques ». Ainsi le « colorimètre », est un dispositif pour l'analyse au moyen de la couleur (MAC, NAL, COL); la « déshydratation », l'élimination de l'eau (MER, VAT).

Les « facteurs sémantiques » sont réunis au moyen de neuf types de relation, représentés chacun par une lettre, qui est incorporée à l'indice codé du facteur affecté.

Ainsi, « Thermomètre » sera représenté par : « Appareil (A) pour la mesure (U) de la température (W) ; « Insecticide » par : Produit (A) pour la destruction (U) des insectes (W) ».

Outre les relations précédentes, dites « analytiques », qui résultent de la définition même des termes verbaux, il en est d'autres, appelées relations « synthétiques », qui sont contingentes à des cas particuliers et sont données par l'observation ou l'expérimentation. Perry et ses collaborateurs ont indiqué dans la liste suivante, qui ne vise pas à être complète, les relations synthétiques qu'ils considèrent comme importantes :
I. Matière première;
2. Matière ouvrée;
3. Teneur (composants, constituants);
4. Propriétés données pour;
5. Propriétés données;
6. Processus;
7. Moyens employés;
8. Condition ou circonstances;
9. Discussion de;
10. Localisation géographique;
II. Relation attributive générale;
12. Domaine du document.

Dans le codage d'un sujet complexe, chaque terme sera précédé par l'indicatif de la relation synthétique. Par exemple, le sujet « Solubilité dans l'eau des bactéricides contenant du mercure » sera représenté par :

4/ Bactéries (W) Destruction (U) 3/ Mercure (E) 5/ Propriétés (A) 8/ Eau (A)

Les chercheurs du « Patent office » des E. U., compte tenu de ce qu'une analyse très poussée des relations entre les caractéristiques présente une importance toute particulière dans la sélection des brevets, vont encore beaucoup plus loin que Perry et ses collaborateurs, dans le détail des interconnexions.

Ainsi, Andrews et Newman retiennent les relations temporelles suivantes :
I. Syncwith-Syncwith : Simultanée, d'égale durée;
2. Syncstart-Syncbegin : Durée inégale, début simultané;
3. Syncstop-Syncend : Durée inégale, fin simultanée;
4. During-While : La plus courte apparaissant une fois pendant la plus longue;
5. Recurper-While : La plus courte revenant pendant la plus longue;
6. Aforlap-Aftlap : Périodes se chevauchant;
7. Timafor-Timaft : Séquence, pas de chevauchement;
8. Timnear-Timnear : Pas de séquence exprimée.

Par exemple, les termes relatifs à deux événements d'inégale durée et débutant en même temps seront séparés par la relation Syncstart-Syncbegin, le premier de ces symboles étant affecté à l'évènement ayant la plus courte durée.

Conclusion :

Les problèmes fondamentaux des différentes techniques d'accès aux documents enregistrés dans les bibliothèques sont étroitement apparentés. L'analyse des relations, qui se traduit par le groupement des concepts suivant certaines grandes catégories et, à un second niveau, par la détermination des connexions plus spécifiques, est sans doute le point commun qui retient le plus l'attention à l'heure actuelle.

Souvent, malheureusement, on s'est plu à insister sur les différences présentées par les méthodes de classification systématique, classification alphabétique des matières et sélection mécanique, au point que le chercheur de l'un de ces domaines ignore parfois jusqu'au vocabulaire des domaines voisins.

Ce manque de coopération a certainement contribué à retarder une organisation bibliographique, qui s'avère de plus en plus indispensable devant le volume chaque jour croissant des publications. Lord Rayleigh, cité par Vickery, écrivait en 1884 : « En science, par une fiction qui ne le cède en rien à aucune de celle de la jurisprudence, on considère comme connu ce qui a été publié une fois, fut-ce en langue russe, et l'on oublie trop souvent que le fait de redécouvrir en bibliothèque peut être une opération plus difficile et aléatoire que la première découverte au laboratoire. » Dans de nombreuses bibliothèques, la situation ne semble guère s'être améliorée, bien au contraire, depuis la fin du siècle dernier.

Illustration
Tableau 1

Illustration
Figure 1

Illustration
Figure 2

  1. (retour)↑  D'où des possibilités d'homonymies, telles que « Géographie en France » et « Géographie de la France », représentées toutes deux par l'indice C.D.U. 9I (44).