MARC et SUPERMARC

Roderick M. Duchesne

L'examen des modalités d'utilisation du format Marc II aux États-Unis et en Grande-Bretagne laisse apparaître des différences très difficiles à éliminer totalement. La permanence de réalisations nationales diverses rend donc nécessaire la création d'un format vraiment international appelé Supermarc. En France, Monocle conçu pour répondre aux besoins les plus exigeants et les plus complets des bibliothèques devrait être facilement compatible avec un format international tel que Supermarc.

I. - L'importance de l'échange international de données bibliographiques

On peut considérer les services mondiaux de bibliothèques et d'information comme des réseaux de diffusion des informations enregistrées et disponibles à volonté. On peut éclairer le rôle décisif de l'échange international de données bibliographiques dans un tel réseau par la considération de trois mondes hypothétiques qui délimitent progressivement cet échange :
I. Un monde sans échange interbibliothèque de données bibliographiques.
2. Un monde sans échange international de données bibliographiques.
3. Un réseau mondial tout à fait développé pour l'échange de données bibliographiques.

Dans le premier de ces mondes supposés, chaque bibliothèque accepte sans aide la tâche de se renseigner sur la publication à travers le monde de documents nécessaires à ses besoins, de les sélectionner au moyen des notices incomplètes obtenues, de les commander, de les classer et de les cataloguer. Des systèmes mondiaux de bibliothèques, celui-ci est le moins rentable : l'effort des bibliothèques est répété au maximum et il y a beaucoup de chances pour qu'un écrit quelconque échappe à l'attention de plusieurs bibliothèques ou services d'information, puisqu'il est impossible pour une bibliothèque particulière d'obtenir des renseignements complets sur tout ce qui a été publié.

Dans le deuxième monde supposé, chaque nation pourrait posséder une ou plusieurs agences pour recueillir et enregistrer ses propres publications, mais les bibliothèques de chaque nation accepteraient de partager, sans aide étrangère, la tâche d'information sur la publication de documents étrangers, de sélection au moyen des notices incomplètes obtenues, de commande, de classification et de catalogage des achats étrangers. La répétition d'efforts en ce qui concerne les publications intérieures du pays serait réduite au minimum, mais il y aurait encore répétition de travail pour les publications étrangères; le contrôle bibliographique des publications intérieures serait rendu beaucoup plus efficace mais il y aurait encore beaucoup de chances pour que des documents étrangers échappent à l'attention.

Dans un réseau mondial tout à fait développé pour l'échange de données bibliographiques, chaque nation maintiendrait une ou plusieurs agences pour recueillir et enregistrer ses propres publications et ferait l'échange des notices ainsi fournies avec d'autres nations pour se renseigner sur les publications étrangères. Idéalement, les notices étrangères doivent être d'une qualité suffisante pour être utilisées, sans édition humaine, pour le catalogage intérieur en plus des simples annonces - mais c'est déjà du raffinement. Il faut principalement pouvoir sélectionner et commander le matériel demandé dans le pays : la tâche de construire des notices catalographiques dans le style du pays est une priorité secondaire.

En ce qui concerne le développement d'un système mondial pour l'échange de données bibliographiques, on peut noter le réseau d'agences établi par la Bibliothèque du Congrès. Celui-ci ne fournit toutefois qu'une solution provisoire à laquelle succédera tôt ou tard un système d'agences nationales. La Bibliothèque du Congrès, par exemple, en viendra avec le temps à utiliser les notices MARC UK 1 plutôt que la copie reçue de son agence anglaise de catalogage partagé (UK Shared Cataloguing Agency) : dans ce cas une agence nationale aura remplacé une agence de catalogage partagé. Simplement à cause de la dépense, la Bibliothèque du Congrès ne pourra jamais cataloguer toutes les publications de chaque pays - ou n'accomplira cette tâche énorme qu'avec la coopération des nations.

Cette comparaison des trois situations mondiales hypothétiques démontre l'importance décisive de l'échange international de données bibliographiques. C'est par le moyen de l'échange que l'on rend plus rentable le réseau mondial de bibliothèques et de services d'information :

I. Coût.

L'échange international de données bibliographiques, par exemple sous la forme de notices MARC II, peut réduire le coût pour chaque nation, du dépistage et de la rédaction de notices bibliographiques des écrits étrangers.

2. Contrôle bibliographique complet et rapide.

Les agences nationales sont les mieux placées pour dépister la production imprimée publiée à l'intérieur des frontières nationales et, si chaque nation maintenait une telle agence, la proportion des écrits du monde entier, bibliographiquement contrôlés, serait beaucoup plus grande. Pourvu que les agences suivent le rythme de publication des écrits, un tel système fournira l'enregistrement le plus rapide des publications; les agences pourraient, ce qui serait encore mieux, distribuer des notices avant la publication de l'ouvrage.

Autrefois l'échange d'informations bibliographiques était fait en grande partie sous la forme de répertoires imprimés, de catalogues ou d'index. L'échange continuera assurément sous ces formes, mais les notices exploitables en machine sont si supérieures qu'elles paraissent beaucoup plus appropriées aux échanges internationaux de données bibliographiques et deviendront vite le principal véhicule d'échange. Le format destiné à cet usage est MARC II et il convient donc d'examiner deux réalisations nationales de MARC II pour voir si les problèmes pratiques de l'échange international de notices ont été surmontés.

2. - Comparaison des formats monographiques MARC II US et UK

La comparaison détaillée de l'annexe A s'est fondée sur la dernière documentation fournie par les services concernés, augmentée par l'information et les conseils de Mrs. Henriette Avram, Mr. Richard Coward et Mrs. Lucia Rather. Les remarques ci-dessous font ressortir les principales différences; pour des renseignements plus précis et pour constater combien de fois se répètent ces différences, se reporter à l'annexe A.

2.1. Format de la notice :

Le format est actuellement défini par la structure de la notice et le système des codes identifiant le contenu, employé à l'intérieur des notices. La structure de la notice MARC II définit la forme du guide, du répertoire, des zones de contrôle, des zones variables. A l'intérieur de cette structure les codes identifiant le contenu sont spécifiés. Ceux-ci comprennent les étiquettes de zones, les codes de sous-zones, les indicateurs, les codes d'information.

Les notices des deux services utilisent la même structure pour le guide, le répertoire et les zones de contrôle. Il y a pourtant des différences nombreuses dans le codage des désignateurs de contenu. Voici un exemple très simple de ces différences qui montre des éléments de données identiques diversement codés :

Dans ce cas, la traduction automatique d'un répertoire de codes dans un autre se fait sans peine, pourvu qu'un programme traducteur tenu à jour soit disponible. Une situation plus compliquée existe là où les deux services ne sont pas d'accord sur le niveau de détail à employer dans la désignation du contenu, par exemple :

En pareil cas, un enregistrement UK peut passer automatiquement dans le format US, mais un enregistrement US ne peut pas passer automatiquement dans le format UK.

On peut voir plusieurs autres différences de codage dans l'annexe A, par exemple :

2.2. Contenu de la notice.

Le contenu de la notice est actuellement défini par les éléments de données, avec ou sans codes identifiant le contenu, données qui sont insérées dans le format de la notice.

On peut distinguer deux genres de différences dans les contenus :
I. Les deux services utilisent nominalement le même élément de données, mais leur usage pour le construire peut être différent.
2. Des données entières sont tout à fait omises par un des services mais non par l'autre.

On a déjà traité dans la Section 2.1 ci-dessus le cas où les deux services fournissent une donnée quelconque mais où leur usage dans la désignation du contenu est différent.

I. Différences d'usage dans la construction des mêmes données.

La différence la plus connue se rapporte aux règles de catalogage employées par les deux services. Celui du UK utilise les règles de catalogage anglo-américaines 1967 (AACR67), texte britannique, avec un écart : les prénoms sont écrits en toutes lettres. Le service US utilise le AACR67, texte américain, avec la superposition de la vedette de la Bibliothèque du Congrès, dans les cas où il y a déjà dans le catalogue de la Bibliothèque du Congrès une vedette qui aurait un rapport avec l'ouvrage en question. Cependant, si en raison du nombre d'entrées sous cette vedette et des possibilités de catalogage, les vieilles entrées peuvent être remaniées, les vedettes du texte américain de AACR67 sont alors utilisées.

Il vaudrait la peine d'analyser un échantillon des notices pour déterminer si les autres différences de contenu entre les notices des deux services sont d'une importance égale ou plus grande que la différence occasionnée par la « superposition ». Néanmoins, il semble que l'on ait de bonnes raisons pour demander au service US de signaler par quelque marque d'identification les vedettes qui proviennent de l'emploi de règles autres que celles du texte américain de AACR67. Il apparaît de ce qui précède que les utilisateurs ne peuvent en aucune manière identifier ces vedettes-ci sans un effort intellectuel, ni donc facilement être certains (à supposer qu'ils le désirent) de n'accepter que les vedettes qui s'accordent avec les règles internationales de catalogage.

Outre les différences dans le choix de la vedette, les deux services traitent un peu différement la ponctuation. La BNB n'introduit pas la ponctuation qui figure à la fin de zones et des sous-zones, mais génère par programme sa propre ponctuation normalisée qui peut différer de celle qui figure sur la page de titre du livre. Il est probable que les différences qui en résultent sont peu importantes et que la ponctuation pratiquée par les deux services sera modifiée par l'accord futur sur la Description bibliographique normalisée (SBD), où pourra se trouver incorporée une ponctuation. Quant au codage, les deux services ont des usages différents à l'égard de quelques codes, par exemple, le code pour résumés dans les positions de caractères 24-27 de la zone 008.

L'emploi par BNB d'une définition plus limitée de ce code a pour résultat le codage d'une proportion plus restreinte de documents que LC.

2. Données entièrement omises par un des services mais non par l'autre.

La liste qui suit n'épuise pas toutes les différences :

La plupart de ces différences n'ont pas l'air très significatives, encore que la non-fourniture de renvois par le service US puisse être une question à discuter, puisque ces renvois sont conformes aux AACR67.

Bien que les différences particulières ne soient pas très importantes, les deux services sont en train de diverger en pratique l'un de l'autre, plutôt que de converger.

2.3. Format du fichier et spécifications de bande magnétique :

Le format du fichier est actuellement défini par les éléments suivants : label de bande, labels secondaires, marques de bande, facteur de blocage des enregistrements.

On utilise les spécifications de bande magnétique pour définir les dimensions physiques de la bande, le nombre de pistes, la densité, la parité, le jeu de caractères et le codage. Deux différences seulement entre les services méritent d'être remarquées dans ces zones.

I. Label.

Les bandes UK n'ont pas de label : une omission élémentaire.

2. Jeu de caractères.

Les deux services ont alloué des codes différents à l' « Alif » :

2.4. Sommaire de la comparaison :

I. Les deux services ont des spécifications de bande magnétique, des formats de fichier et des structures de notices hors tout, qui sont en pratique identiques.

2. L'utilisation des codes identifiant le contenu est loin d'être uniforme, et elle tend à devenir moins plutôt que plus uniforme. Il semble que les utilisateurs UK ont envie de voir une désignation de contenu dans les notices plus détaillée que les utilisateurs US : tandis que l'on pourrait normaliser les différences de codage superficielles, un noyau de différences nationales véritables resterait. Dans ce noyau figurent des différences non susceptibles de traduction automatique entre les formats.

3. Il y a bien sûr des différences de contenu importantes entre les notices des deux services par suite, par exemple, de l'emploi de règles différentes de catalogage. Il sera nécessaire de poursuivre les recherches pour établir en pratique l'étendue et la fréquence de ces différences.

3. - SUPERMARC.

« - But it's not destruction : it's fulfilment » (6).

(Mais ce n'est pas la destruction : c'est l'accomplissement.)

3.1. Le concept et sa justification :

Si les US et l'UK ne peuvent atteindre l'uniformité dans leurs réalisations nationales de MARC II, il n'y a aucune chance de l'atteindre dans d'autres réalisations nationales uniformes. Il en résultera un brouhaha de réalisations nationales dont le maniement deviendra rapidement impossible dans une situation dynamique. La traduction automatique entre formats ne fournira pas de solution satisfaisante, puisque la tâche de maintenir à jour les programmes traducteurs sera trop pénible lorsqu'il y aura beaucoup de nations qui feront de multiples changements; en outre un certain nombre de différences de format ne sont pas susceptibles d'être traduites automatiquement, comme l'a démontré la comparaison US/UK.

Pour résoudre le problème, il faut évidemment combiner et mettre en œuvre un format de communications véritablement international, qui est essentiellement un super-ensemble des réalisations nationales : SUPERMARC. Comme on l'a remarqué dans la comparaison US/UK les nations ne s'accordent pas sur la profondeur d'analyse dans la désignation des sous-zones; il est facile de traduire du plus détaillé au moins détaillé, mais non l'inverse. Il est donc inévitable que SUPERMARC fournisse un codage de sous-zones relativement détaillé, quoique le codage détaillé que les nations A à Y pourraient fournir dans leurs notices dans l'intérêt de la nation Z, qui veut plus de détails qu'aucune autre nation, soit en pratique limité. Il ne faut pas croire d'après les remarques faites dans ce paragraphe et qui concernent le codage de sous-zones que SUPERMARC aura nécessairement la structure de MARC II. Pourtant cela semble probable.

Les avantages de SUPERMARC sont évidents. Considérons cinq nations qui échangent les notices MARC. A l'aide de cinq réalisations nationales différentes de MARC chacune doit maintenir et opérer huit programmes traducteurs de format. La nation A maintient les programmes pour A-B, A-C, A-D, A-E et vice-versa. La nation A pourrait théoriquement partager le maintien de ses programmes A-B et B-A avec la nation B; cela pourrait rendre service, mais il resterait encore le grand problème de la « maintenance » des programmes. A l'aide de SUPERMARC chaque nation ne maintient que deux programmes traducteurs : la nation A maintient un programme traducteur de son propre format à celui de SUPERMARC et un autre de SUPERMARC à son propre format. Plus il y a de nations, plus on économisera le maintien de programmes traducteurs.

Les avantages réels l'emportent de beaucoup sur le coût nécessaire à l'obtention de ces programmes. Les éléments principaux du prix de revient sont constitués par les travaux nécessaires à la création de SUPERMARC, à l'obtention d'un accord international et à l'exploitation de ce format.

L'accord sur un sur-ensemble de formats MARC nationaux n'obligera pas les nations à utiliser le codage maximum des sous-zones dans les notices qu'elles offrent à l'échange, mais on peut facilement prédire que ces nations seront encouragées à observer quelques normes minimum de contenu et d'analyse de contenu dans leurs notices.

3.2. Comment changer le concept en réalité :

Le développement ultime du concept SUPERMARC implique :

I. Un organisme international pour l'accord initial et l'exploitation de SUPERMARC.

2. L'accord sur un format-machine SUPERMARC et sa mise en oeuvre, y compris la série complète des codes qui correspondent aux codes MARC II de zones, de sous-zones, d'indicateurs et d'information. L'accord sur le jeu de caractères, la structure du fichier et les spécifications de la bande magnétique.

3. L'accord et la rédaction de manuels de pratique précisant les règles à utiliser dans l'introduction des éléments de données, y compris les règles :
- de codage - étiquettes, sous-zones, indicateurs, codes d'information;
- de la description bibliographique - auteur/nom et description-matière pour catalogage descriptif;
- de la translitération.

Une politique pratique pour le développement de SUPERMARC doit donner la priorité à l'accord sur le format machine. Il y a quatre raisons principales pour choisir celui-ci en priorité :

a) Importance d'usages autres que le catalogage : tandis que, dans une situation idéale, la nation A doit assurément accepter les notices de la nation B sans catalogage nouveau, le catalogage partagé n'est pas la seule raison de l'échange. La nation A a besoin de savoir ce qui a été publié à l'intérieur des frontières de la nation B pour sélectionner, commander et acquérir les publications de la nation B. Cet emploi de notices échangées importe suffisamment pour ne pas être retardé par une tentative à plus long terme visant à atteindre l'harmonisation internationale de règles de catalogage.

b) Rapidité des résultats : il sera beaucoup plus facile de construire, de s'accorder sur et de mettre en oeuvre un format machine SUPERMARC que d'atteindre la normalisation internationale de la description bibliographique, y compris règles de catalogage et description des sujets.

c) Le travail est déjà en marche : le Comité technique 46 de l'ISO, sous-comité 4, doit déterminer une série normalisée de codes identifiant le contenu pour les notices bibliographiques. Ce travail constitue un point de départ évident.

L'attribution de la priorité à l'accord sur le format machine ne veut pas dire qu'il ne faut pas faire progresser les travaux sur les règles de catalogage, de translitération et la description des sujets mais seulement que l'on risque de ne pas réaliser rapidement l'harmonisation internationale dans ces domaines et qu'il ne faut pas laisser retarder la réalisation de buts plus immédiats. Il faudra en effet que la normalisation internationale avance parallèlement avec le travail sur le format-machine, parce qu'il n'est pas possible de séparer les décisions sur les codes identifiant le contenu de la considération du contenu lui-même.

Cependant la priorité du format-machine a un rapport direct avec le travail sur les règles de catalogage : ce dernier doit au début être concentré sur l'identification des éléments de données qui ont besoin de la désignation du contenu plutôt que sur la recherche d'un accord sur un manuel de pratique de formulation des données, par exemple les problèmes du choix de vedettes.

Illustration
Tableau 1

Illustration
Tableau 2

Illustration
Tableau 3

Illustration
Tableau 4

Illustration
Tableau 5

Illustration
Tableau 6

  1. (retour)↑  Dans cet article les abréviations suivantes ont été utilisées : US pour États-Unis (nom) ou américain (adjectif); UK pour Royaume Uni (nom) ou anglais (adjectif); BNB pour British national bibliography et LC pour « Library of Congress ».