Les éléments de données et les normes EDI

Philippe Raccah

En amont de la normalisation technique, il faut définir le vocabulaire et la syntaxe qu'on utilise : c'est la normalisation des éléments de données. Dans les applications qui concernent les bibliothèques, prêt-inter, acquisitions, recherche documentaire, cette normalisation a d'abord pris la forme d'une norme spécifique : la norme ISO 8459 « répertoire des éléments de données bibliographiques ». Mais aujourd'hui se pose le problème de la cohérence de cette norme avec les normes, déjà très utilisées, qui concernent les échanges économiques et commerciaux : les normes EDI. Un effort d'harmonisation est entrepris au sein de l'ISO. L'enjeu pour les bibliothèques est de réussir à s'y intégrer sans perdre la spécificité et la richesse de leur langage propre.

First step technical standardization, it's necessary to determine which vocabulary and syntax we want to use : that's what is called data elements standardization. For libraries applications, interlibrary loan, acquisitions, information retrieval, there have been first a specific standard : ISO 8459 « bibliographic data elements directory ». But there is a problem of consistency between this standard and the today well used standards conceming economic and trade interchanges : EDI standards. There are nowadays important ISO initiatives to coordinate data element standardization : the libraries issue is to participate in this common programme without losing the specificity and the richness of its own language.

Bevor die technische Normierung eintritt, muß man den verwandten Wortschatz und dessen Syntax festlegen, d.h. die Normierung der Datenelemente leisten. In den die Bibliotheken betreffenden Bereichen (Büchertauschverkehr, Erwerbung, Dokumentennachforschung), diese Normierung hat zuerst eine eigene Norm entstehen lassen : die ISO-Norm 8459, « Verzeichnis der bibliographischen Datenelemente ». Heute aber stellt sich die Frage, inwiefern diese Norm den schon verwandteren Normen entspricht, die den Wirtschafts- und Handelaustausch angehen : die EDI-Normen. Die ISO hat doch angesetzt, diese Normen in Einklang zu bringen. Die Bibliothekare müßen Interesse daran finden, sich in dieses Normensystem einzumischen, ohne die Besonderheit und den Reichtum ihrer eigenen Sprache zu verlieren.

Pour échanger, on normalise. Et, à la suite d'autres domaines, ça démarre activement dans les bibliothèques. Logiquement, la normalisation porte sur la teneur des messages qu'on s'envoie, et d'abord sur les informations de base véhiculées dans ces messages. Ces informations, ou données, divergent considérablement d'un domaine à l'autre : défense, santé, assurances, banques, commerce, bibliothèques, etc. Cette diversité est d'ailleurs antérieure à l'informatisation, qui hérite du langage particulier à chacun des domaines et des pays. Dans le vocabulaire OSI (Open Systems Interconnection), la normalisation des éléments de données, c'est la normalisation du vocabulaire et de la syntaxe des messages.

Nécessité économique

Ce travail devrait théoriquement être fait en amont, mais dans la réalité, l'impulsion vient des projets concrets. Souvent, la normalisation des éléments de données accompagne, voire suit la normalisation des applications, d'où dispersion, incohérence, risque de conflit.

Dans le monde des échanges commerciaux, les nécessités économiques ont imposé depuis longtemps la normalisation et la cohérence des messages échangés, et ce, quelle que soit leur fonction, catalogue des articles, commande, facturation. D'où les normes EDI (Electronic Data Interchange).

Parmi les normes EDI, il existe deux normes consacrées aux éléments de données:
- EDIFACT (Electronic Data Interchange For Administration Commerce and Transport), norme ISO 9735 sur la syntaxe des messages,
- TDED (Trade Data Element Directory), norme ISO 7372, pour le vocabulaire. Ces deux normes ont été élaborées d'abord pour les besoins du commerce et des échanges économiques et administratifs internationaux, et sous le pilotage de l'ONU et des instances gouvernementales chargées de leur régulation : en France, le ministère des Finances.

La normalisation des éléments de données bibliographiques s'est faite dans un premier temps en référence unique aux besoins des applications bibliothéconomiques qui étaient mises en place : ce sont les trois parties terminées ou en voie de l'être de la norme ISO 8459. Cette norme se voit aujourd'hui remise en question par la normalisation EDI, qui lui offre un cadre général, des normes déjà établies, et lui propose donc de modifier sa démarche de façon à s'accorder, voire tout simplement à s'intégrer.

La norme ISO 8459 est élaborée au sein du comité technique « Information et documentation », sous-comité « Informatisation de la documentation », par les groupes d'experts chargés de la normalisation des éléments de données (ISO/TC 46/SC 4/WG 7 ; en France : AFNOR/CG 46/CN 4/GE 7). Son titre : Documentation - répertoire des éléments de données bibliographiques. Les deux premières parties sont des normes ISO publiées :
- ISO 8459/1 applications au prêt-inter (1989),
- ISO 8459/2 applications aux acquisitions (décembre 1992).

La troisième, soumise à enquête probatoire jusqu'au 20 février 1993, est en voie d'édition :
- ISO 8459/3 applications à la recherche documentaire : parution prévue en 1993 ou début 1994.

La norme ISO 8459 est un bon exemple de cette interférence entre le monde EDI et le monde des applications industrielles, et de la nécessité d'une intégration des données techniques et commerciales. La perception de l'interférence entre les répertoires de données commerciales du TDED et la norme 8459 fut d'ailleurs le point de départ de l'effort de coordination entrepris au sein de l'ISO (International Organisation for Standardization). Ce sont surtout les données concernant les acquisitions qui posèrent problème, ce qui, vu la place de l'échange proprement commercial dans le processus des acquisitions (commande, facturation) n'a rien de surprenant.

Une première étude a montré que, dans ce domaine précis, il y avait un taux de compatibilité de 70 %, ce qui est à la fois encourageant - sans concertation, il y a tout de même une assez bonne convergence - et révélateur du travail à accomplir.

Intégration et harmonisation

Pour les applications bibliothéconomiques comme pour l'ensemble des applications OSI, on en est à un tournant, une pause où l'on s'interroge sur les méthodes qui permettront l'harmonisation, si ce n'est l'unification des éléments de données. C'est aujourd'hui que ça se décide. Les grandes orientations ne sont pas encore définitivement arrêtées, mais les projets, par exemple de prêt-inter, et les réalisations, par exemple l'utilisation aux Etats-Unis de la norme américaine ANS1 Z 39-50 sur la recherche documentaire, norme qui sert de base à l'élaboration de la norme ISO correspondante pour des OPAC capables d'interroger diverses bases de données bibliographiques, exigent de normaliser les éléments de données. Ces travaux sont donc urgents.

Toutes les instances de l'ISO en sont conscientes. Le secrétariat central, à Genève, a impulsé une réflexion transversale aux différents secteurs de la normalisation et un travail de coordination des normes existantes - objectifs du DCG (Groupe de coordination des données). De même, et cet exemple nous touche de près, les groupes de travail chargés de la normalisation des applications bibliothéconomiques en France (AFNOR/CG 46/CN 4) ont décidé de suspendre provisoirement l'élaboration du répertoire de données bibliographiques (parties 4 et 5 de la norme 8459), et de participer à l'effort commun d'harmonisation entrepris au sein du JTC 1, c'est-à-dire par tous les acteurs de la normalisation en informatique, électricité, électronique, en référence à ce qui est déjà fait dans le monde EDI.

Le DCG est chargé au sein de l'ISO d'harmoniser la normalisation des éléments de données en cours dans les différents comités techniques. Son rôle est celui d'une agence de coordination : analyser les objectifs, définir les études nécessaires, faire des propositions concrètes aux différents partenaires. Il prend en compte, non seulement les travaux de normalisation effectués par l'ISO et le Comité électrotechnique international (CEI), mais aussi ceux d'autres secteurs, comme le TDED et tous les secteurs EDI. Les règles adoptées stipulent notamment qu'aucun répertoire de données ne pourra avoir le statut de norme internationale s'il offre une incompatibilité avec un répenoire existant. C'est alors aux organismes responsables d'amen der leurs spécifications de manière à faire disparaître le conflit. L'objectif est de parvenir à définir l'ensemble de règles communes à appliquer dans l'élaboration des normes d'éléments de données, d'établir une table de références des données utilisées avec celles du TDED, et finalement d'envisager la constitution d'un répertoire commun de données. Première étape : l'édification du BSR (répertoire sémantique de base), conçu comme un réservoir commun de concepts sur lequel pourraient s'appuyer toutes les normes d'éléments de données. Une étude, financée par des fonds européens, et dont l'AFNOR a été le maître d'ouvrage, a conclu récemment à la faisabilité du BSR. Reste maintenant à trouver le financement nécessaire pour poursuivre.

L'enjeu est double : réussir à se parler, et cela dans une langue qui sache parler bibliothèque, pas uniquement économie. Construire, donc, des répertoires d'éléments de données riches où l'expression des particularités techniques concernant les bibliothèques ne soit pas écrasée par un espéranto à base économique.

Réussir à se parler, c'est forger les outils de communication - les normes -, et d'abord élaborer le vocabulaire commun - normalisation des données -, avant que le développement désordonné des réalisations ne le rende impossible, ce qui freinerait considérablement le progrès technique. Les bibliothèques, et le monde de la documentation en général, ne peuvent se contenter de pouvoir communiquer entre elles car, à terme, leurs entreprises seraient condamnées par manque de viabilité. Pour être efficaces, les applications OSI ont besoin au contraire de s'ouvrir au monde de l'édition, de la librairie, des sociétés de transport, des banques, des télécommunications, etc. Il y a d'ores et déjà des zones de recouvrement où la compatibilité est indispensable.

Les groupes d'experts sur les éléments de données doivent intégrer leurs travaux dans ce cadre général, fortement marqué par la force économique et les avancées d'EDI. En clair, cela signifie que, si leur présence à tous les niveaux, et d'abord au sein des groupes nationaux, n'est pas affirmée, les bibliothèques risquent à terme de se voir imposer des normes qui ne tiendront aucun compte de leurs spécificités.

Il faut intégrer les bibliothèques et les centres documentaires dans l'ensemble du monde OSI, en préservant leur spécificité, et éviter la « babélisation technologique ».

La tâche à accomplir est vaste : c'est à la fois confronter entre elles les normes existantes, venir à bout des incompatibilités rencontrées, et définir les méthodes et les outils communs d'élaboration des normes à venir. Les bibliothécaires et les documentalistes sont pour cela appelés à travailler en commun avec les théoriciens (DCG, groupe « Méthodologie »), les informaticiens, les électriciens / électroniciens (JTC 1) et, bien sûr, avec ceux qui ont l'initiative des produits, les industriels.

A côté du DCG, une autre instance de l'ISO travaille en amont à la mise au point des méthodes et des outils : le SC 14, sous-comité chargé, au sein du JTC 1, de la méthodologie des données. Ce groupe tente d'élaborer un modèle conceptuel, ensemble de règles à utiliser pour avoir une bonne liste d'éléments de données, et d'attributs (projet de norme CD11179), et des mécanismes d'harmonisation. Ceux-ci peuvent donner lieu à un dictionnaire central d'éléments de données génériques ou à de nouvelles normes à envisager. L'équivalent français du SC 14 est un groupe de « Méthodologie des données » rattaché à EDIFRANCE. C'est à l'étude de ces outils prospectifs, comme à la participation aux travaux du DCG, que sont conviés les groupes d'experts de l'ISO/TC 46/SC 4 dont le rôle est la normalisation des éléments de données.

Aujourd'hui, l'objectif ambitieux, mais peut-être utopique, d'un dictionnaire de données commun à tous suscite beaucoup d'interrogations. Quelle que soit la réponse, les travaux actuels permettront d'assurer la cohérence nécessaire à une normalisation efficace.

Février 1993

Illustration
Liste des normes ISO et AFNOR