Deuxième conférence internationale d'études sur la recherche en matière de classification, tenue à Elseneur

tenue à Elseneur, du 14 au 18 septembre 1964, organisée par le Comité FID/CR sous les auspices de la Fédération internationale de documentation.

Sept ans après la première conférence internationale tenue à Dorking en 1957, des progrès considérables ont été faits dans l'exploitation des machines pour le traitement des grandes collections d'informations. Le but de cette 2e conférence a été de faire le point de la situation, de donner une orientation nouvelle aux travaux à venir (recherche théorique, applications, évaluation des systèmes de classification, classification automatique) et d'étudier les méthodes et les moyens à mettre en oeuvre pour remplir ce programme.

Conclusions et recommandations

1. Situation présente

La première Conférence internationale d'études sur la classification pour la recherche de l'information s'est tenue en 1957 à Dorking sous les auspices de la FID. Elle entrait dans le cadre des travaux entrepris par la FID depuis un certain nombre d'années au sein des comités CC et CA et lors de ses conférences annuelles, en particulier lors des conférences de Rome en 195I et de Bruxelles en 1955.

Dans les sept années qui ont suivi la réunion de Dorking, les travaux ont bien avancé, en ce qui concerne et le plan des systèmes de classification 1 et l'application des machines à la recherche de l'information. 5 nations étaient représentées à Dorking alors qu'en 1964 60 spécialistes de 16 pays différents et de 2 institutions internationales assistaient à la conférence. Le champ d'action de cette 2e réunion est beaucoup plus large que celui de la première. C'est là la preuve de l'intérêt croissant porté à ce domaine et de l'importance toujours plus grande des recherches qui y sont consacrées.

Il est inutile d'insister sur le rôle de la classification dans le stockage de l'information et dans l'élaboration des langages servant à la sélection des informations; ce rôle est évident. Les premiers doutes qui avaient été émis quant à l'efficacité de la sélection mécanique ont en grande partie disparu. Bien plus, on a reconnu unanimement qu'une organisation paradigmatique 2 est une caractéristique essentielle de tout système mécanisé efficace. De nombreuses questions théoriques ont été clarifiées et les progrès faits dans l'exploitation des machines pour le traitement des grandes collections d'information ont été considérables.

Des disciplines aussi diverses que la linguistique structurale, la sémantique, les mathématiques, la logique et l'épistémologie ont apporté une importante contribution à la théorie de la classification.

Des expériences sur les systèmes de classification en cours ont été réalisées sur une échelle toujours plus vaste. Aussi les personnalités présentes à la conférence reflètaient-elles la diversité des disciplines intéressées par les problèmes de la classification. Le but de cette conférence était de faire le point de la situation et de donner une orientation aux travaux à venir pour qu'ils soient fructueux.

2. Orientations nouvelles

2.I. Recherche théorique.

Les principes théoriques actuels ont besoin d'être approfondis sur divers points en ce qui concerne à la fois les systèmes de classification généraux et les systèmes spéciaux, qu'il s'agisse d'une part des applications courantes telles que le rangement sur les rayons, les catalogues sur fiches, les index, et les bibliographies ou d'autre part des systèmes mécaniques quel que soit leur degré de mécanisation et d'automatisation.

Ces recherches théoriques impliquent entre autres :
- l'étude des inter-relations mutuelles entre la pensée et le langage : par exemple les rapports entre concepts, les relations de concept à concept et leur expression dans le langage naturel;
- l'étude linguistique de la terminologie dans les domaines scientifiques et techniques,
- l'élaboration de vocabulaires rationalisés, de thésauri (que les relations hiérarchisées y soient ou non exprimées) aussi bien que de structures classificatoires précoordonnées;
- l'étude de diverses méthodes permettant d'exprimer les relations « analytiques » données par le contexte (appelées structures syntactiques);
- l'analyse et l'évaluation des relations fonctionnelles entre les différents composants des systèmes (y compris la classification, les codes et l'équipement) ;
- l'étude des comportements : par ex. les processus d'induction (au niveau des individus comme au niveau des groupes) qui déterminent dans une large mesure le choix des catégories sémantiques.

Dans cet ordre d'idées un certain nombre de problèmes particuliers relatifs à la théorie de la classification devront être étudiés de plus près :
a) la possibilité d'une séparation des relations paradigmatiques et syntagmatiques 3;
b) l'emploi de catégories universellement applicables ou de catégories applicables à plusieurs disciplines;
c) les domaines d'application et les conditions d'emploi des niveaux d'organisation (« intégrative levels ») ;
d) les bases formelles (mathématiques et logiques) de la classification;
e) la pertinence du système de classification par rapport au sujet classifié, compte tenu des questions sémantiques afférantes du point de vue socio-psychologique;
f) la classification des données (systèmes de consultation) en opposition avec la classification des documents;
g) le degré optimal de précision dans le langage classificatoire quand il doit exprimer des notions complexes.

A la limite de la recherche théorique et des applications pratiques nous devrons étudier :
h) les problèmes de symbolisation (notation);
i) les relations entre les classifications encyclopédiques « générales » et les classifications « spécialisées ».

2.2. Applications.

Les études théoriques mentionnées ci-dessus devront être appliquées à :
a) l'amélioration de la classification existante, y compris l'étude des méthodes pour l'élaboration de thésauri et d'instruments de travail analogues;
b) la mise au point d'une meilleure structure pour les nouvelles classifications;
c) l'étude et la mise en œuvre de la comptabilité entre les systèmes de classification et les thésauri, y compris les vocabulaires rationalisés;
d) la convertibilité des indexations d'un système à un autre;
e) l'étude de l'interaction entre les systèmes de classification et la technologie des machines à calculer au cours de l'analyse et de la programmation systématiques ; et les conséquences de la coopération entre le théoricien de la classification et le technicien.

2.3. Évaluation des systèmes de classification.

Le but des travaux poursuivis en ce domaine devrait être d'aboutir à des techniques unanimement reconnues et normalisées pour l'évaluation aussi bien que pour la mesure des dimensions d'un système de classification.

Il est nécessaire de trouver :
a) des types de tests expérimentaux et opérationnels mieux adaptés;
b) de meilleures techniques d'évaluation;
c) des modèles empruntés au langage mathématique pour décrire les systèmes de la façon la plus précise et la plus sûre;
d) des méthodes meilleures pour comparer et évaluer les systèmes de classification.

Les tests et les évaluations portant sur les systèmes existants dans toutes sortes de disciplines doivent être encouragés. Il faut coopérer sur le plan international pour expérimenter sur des collections suffisamment importantes l'utilité des systèmes de classification.

Les recherches doivent se poursuivre dans les perspectives suivantes :
e) tests qui porteront à la fois sur les usagers des systèmes de classification, les « classificateurs » et les « indexeurs » et qui permettront de dégager les divergences entre la description des index et l'analyse d'un article par son auteur lui-même;
f) études sur la sûreté et l'homogénéité des résultats de classifications pratiquées par différents « classificateurs » dans un système de classification et/ou dans divers systèmes;
g) méthodes plus précises et plus sûres pour évaluer la pertinence du document par rapport à l'objet des recherches.

2.4. Classification automatique.

Les questions relatives à la construction et à l'application possible d'une classification automatique auraient pu figurer sous tous les paragraphes précédents mais l'intérêt particulier porté à ce domaine à l'heure actuelle appelle un traitement distinct.

La classification automatique implique : I° la dérivation mathématique des tables de classification (domaine du théoricien de la classification) et 2° l'affectation automatique des documents aux catégories (ce qui correspond à la pratique de la classification, domainc du classificateur) sans qu'on se préoccupe de savoir si les catégories ont été dérivées automatiquement ou ont été choisies d'après un plan de classification préalablement élaboré.

L'affectation automatique des documents au moyen d'une table de classification préalablement élaborée est déjà opérationnellement réalisable. L'autre type de classification automatique fait l'objet de certaines expériences. Il est souhaitable que des expériences plus poussées soient faites sur une base statistique adéquate afin de déterminer la portée et les limites de ces méthodes par rapport aux autres méthodes de classification. Des études statistiquement fondées sont nécessaires pour déterminer dans quelle mesure la classification automatique supporte la comparaison avec le « classificateur » humain et avec la répartition du vocabulaire dans le document.

3. Méthodes et moyens

3.0. Des mesures ont été prises pour uniformiser la terminologie à l'échelon national afin de normaliser et de simplifier les vocabulaires utilisés pour la description des systèmes de classification. On est d'accord pour reconnaître que la normalisation des termes nécessite d'abord une coordination des concepts de la part des différents spécialistes intéressés. Il est instamment recommandé que cette tâche soit prise en main par une institution internationale telle que la FID/CR ou l'ISO.

3.1. On assiste déjà à une certaine coopération officieuse entre équipes de chercheurs. Elle devrait être intensifiée et organisée en particulier grâce à des échanges internationaux de chercheurs, des échanges d'éléments d'information et de programmes de machines à calculer, des bourses, etc.

3.2. Un inventaire des travaux en cours concernant la recherche classificatoire devrait être tenu à jour par un organisme compétent. La nécessité s'impose d'une publication renseignant rapidement sur les activités nouvelles. Un organe centralisateur devrait être chargé de recueillir et de diffuser des informations sur les systèmes de classification et sur les thésauri établis pour des disciplines spéciales, ainsi que sur les éléments disponibles dans les codes mécanisés pouvant être utilisés pour la recherche classificatoire. Il faudrait encourager la publication de comptes rendus critiques traitant des progrès de la recherche.

3.3. Le manque de personnel spécialisé dans la recherche classificatoire est un sérieux obstacle au progrès. Des mesures sont prises pour améliorer cette situation grâce à la formation du personnel; elles devraient être encouragées au niveau des établissements d'enseignement supérieur. Il faudrait également essayer d'intéresser des chercheurs de certaines autres disciplines aux problèmes de la recherche classificatoire.

3.4. En accord avec la recommandation de juin 1964 du Bureau de la FID la création de groupes nationaux pour l'étude de la classification et des langages pour la recherche des informations devrait être encouragée là où de tels groupes n'existent pas. Le Comité FID/CR doit être considéré comme l'organe de liaison entre ces différents groupes.

3.5. Des subventions plus importantes seront demandées pour la recherche classificatoire et les organisations qui s'en occupent. La responsabilité du financement des projets de recherche revient au premier chef aux organismes nationaux de recherche scientifique, aux fondations, et aux institutions internationales gouvernementales comme l'Unesco ou non gouvernementales comme la FID elle-même. En incluant éventuellement cette liste des problèmes prioritaires qui se posent pour la recherche fondamentale sur la classification dans le Programme à long terme de la FID, on pourrait peut-être s'attirer des appuis supplémentaires et encourager une coopération plus étroite entre les divers organismes concernés.

3.6. De nouveaux symposiums ou des groupes de travail devraient être organisés à intervalles assez rapprochés. Leurs programmes devraient être conçus de manière à faciliter l'étude détaillée et l'examen critique du travail en cours 4.

  1. (retour)↑  Par « classification » on entend toute méthode qui établit des relations, génériques ou autres, entre des unités sémantiques particulières, sans tenir compte du degré de hiérarchie du système ni de la possibilité pour ces systèmes d'être appliqués en connection avec des méthodes traditionnelles de recherche des documents ou avec des méthodes plus ou moins mécanisées.
  2. (retour)↑  Voir note au paragraphe 2.I a ci-dessous.
  3. (retour)↑  Ces termes étant équivalents respectivement à : structures lexicologiques et syntactiques, axes verticaux et horizontaux, etc.
  4. (retour)↑  Traduit de l'anglais par Mme Françoise Malet, bibliothécaire à la Direction des bibliothèques et de la lecture publique.