Le marché des notices bibliographiques

La foire d'empoigne

Martine Darrobers

Le marché des notices bibliographiques en France : le thème des journées d'étude organisées le 25 juin dernier par l'ABF était d'actualité, puisque la base OPALE de la Bibliothèque nationale était consultable en local depuis moins d'une semaine, puisque les accords OCLC-DBMIST étaient affichés depuis quelques semaines à peine 1. Actualité donc, mais aussi, peut-être précipitation et amalgame, car des discordances - le mot n'est pas trop fort -sont apparues entre le projet annoncé et l'information offerte. Le titre général était le marché des notices bibliographiques ; la démarche annoncée était l'expérience concrète et immédiate des utilisateurs de réservoirs de notices ; la démarche suivie a oscillé entre ces deux pôles, d'où, à la fois, lacunes, redondances et non-dits : pas de présentation de l'offre et de la demande, pas de panorama des différents serveurs ni de leur politique - ce qui se concevait si on avait décidé de ne donner que le point de vue de la base ; par contre, présentation sélective et appuyée de certains prestataires, au premier plan desquels la Bibliothèque nationale, flanquée à sa gauche du CCN, à sa droite du CD-ROM de la Bibliothèque publique d'information (deux services qui, quel que soit leur intérêt, s'inscrivaient à la périphérie du sujet), tandis que les autres réservoirs d'informations bibliographiques présents sur le marché - LIBRA, OCLC ou SIBIL -n'apparaissaient que via leurs utilisateurs. Plus regrettable était l'absence totale d'allusion à ELECTRE, autre fournisseur national déjà implanté sur le marché des notices bibliographiques. « Pas le temps ! » fut-il répondu à ceux qui s'en inquiétaient. L'excuse est certainement juste ; est-elle pour autant satisfaisante ?

L'Evangile selon Saint MARC

C'est donc une impression mitigée qui se dégageait à la fin de cette journée, en dépit de la profusion d'informations sur cette nouvelle donne que constitue la récupération de données bibliographiques. En premier lieu, la question des formats, du format MARC et de ses épigones qui a longtemps constitué un serpent de mer réservé à quelques initiés. L'exposé de Marc Chauveinc débroussaillait la question, replaçant la création du format MARC dans une perspective historique, rappelant que sa destination était clairement inscrite dans la formulation initiale, Machine readable catalogue. Il s'agissait de mettre en place une structuration univoque des données, précisant leur nature (e.g. nom propre) et leur fonction (e.g. auteur principal), de manière à permettre les traitements voulus (tri, sélection, indexation, impression) ; d'où un découpage de chaque notice en zones et sous-champs séparés par des étiquettes auxquelles s'ajoutent un certain nombre de codes-indicateurs pouvant par exemple permettre d'éliminer un certain nombre de caractères lorsqu'on trie sur une zone donnée (e.g. les articles sur la zone de titre). Sur ce schéma de départ se sont greffés, au cours des années 70, de nombreux formats dérivés, chaque pays cultivant son propre format de catalogage, UK MARC pour la Grande-Bretagne, MONOCLE pour la France, CAN MARC pour le Canada, etc. Diversité reflétant les usages nationaux en matière de description bibliographique et de règles de catalogage, puisque le but de l'opération était d'aboutir à la production de mega-catalogues informatisés.

Je te tiens, tu me tiens

Aujourd'hui, avec l'émergence de la fonction « consultation en ligne », la tendance s'inverse et on assiste, sinon à une uniformisation, du moins à une simplification favorisée par l'échec des tentatives de reformatage pour les échanges internationaux de données. Pour l'heure, le format dominant en matière d'échanges internationaux est le format UMMARC, la Bibliothèque nationale restant fidèle à INTERMARC, tandis que les réservoirs bibliographiques d'Outre-Atlantique adoptent communément l'US MARC de la Bibliothèque du Congrès. Pour analyser la spécificité et la « pureté bibliographique » des notices créées dans l'un ou l'autre format, on se reportera aux notices, agrémentées à l'envi d'étiquettes à trois chiffres, de dollars et de séries chiffrées, la principale différence semblant en fait tenir beaucoup moins au format lui-même qu'aux règles de catalogage qui, selon le cas, traitent différemment les éléments d'une suite et optent pour la création (ou la non-création) de notices à niveau.

Même si la guerre des règles et des formats peut paraître dérisoire à l'observateur extérieur, ses enjeux n'en sont pas moins considérables comme l'a bien montré, depuis plusieurs années, la cristallisation des positions autour de l'un ou l'autre format ; c'est que le reformatage, pour être possible, n'en est pas moins difficile, aléatoire et onéreux, s'accompagnant généralement d'une perte d'informations et de bugs plus ou moins longs à récupérer. Les rapprochements, possibles, souhaitables, étudiés, s'organisent avec la plus sage lenteur, chaque partenaire attendant visiblement que son interlocuteur soit plus proche pour s'en approcher...

Pour en revenir à l'exposé introductif, les articles de foi de l'évangile catalographique sont reformulés sans ambiguïté : ne pas créer son propre format, choisir en tout état de cause un format MARC, en bref, s'assurer dès le départ des possibilités d'intégration aux courants d'échanges de notices intervenant au niveau national ou international. Est-ce réellement la démarche suivie par les différentes bases bibliographiques qui se constituent sur le territoire français ?

OPALE in

Première d'entre elles, la base OPALE 2 à laquelle on a entrepris de donner un recul chronologique, puisque les notices qui y sont actuellement chargées remontent à 1979 ; d'où ce qu'il est convenu d'appeler une opération de conversion rétrospective, ou, plus simplement, une reprise des notices antérieures pour 1970-1979. La démarche n'est pas propre à la Bibliothèque nationale : toutes les bibliothèques ayant informatisé leur catalogue y sont passées, utilisant des procédures variables pour faire une reprise-maison. Dans ce cas particulier, l'originalité tenait à l'ampleur du projet : plus d'un million de fiches à traiter, correspondant à 450 000 ouvrages, qu'il fallait intégrer à la base déjà chargée, avec toutes les harmonisations et ajustements nécessaires pour maintenir la cohérence de la base. Pour mener à bien ce travail de titan, le choix a été de recourir à une société de service, chargée d'assurer les opérations de saisie et de traitement, pour assurer la conversion des notices en format INTERMARC.

Ces opérations, dont le coût estimatif est de 20 F par notice, ne représentent cependant qu'une partie des tâches nécessaires : en amont intervenait tout un travail de tri, puisque c'était sur la fiche principale que portait le traitement ; ensuite intervenait le codage préliminaire des zones avant saisie ; enfin, en aval de la saisie, du traitement et de l'édition, s'inséraient la lecture et la vérification des notices, plus le traitement des inévitables anomalies et cas particuliers. Achèvement de l'opération prévu pour l'automne; chargement dans OPALE prévu pour la fin de l'année.

Que la Bibliothèque nationale constitue un cas particulier, nul n'en doutera : les dimensions du projet et des investissements corollaires constituent un témoignage suffisamment éloquent. L'historique retracé par Annick Bernard a mis l'accent sur l'importance des listes nationales d'autorité : noms propres de personnes et de collectivités, vedettes matières ; c'est ainsi que l'intégration des vedettes matières a été différée, dans la mesure où elles ne collaient pas à la logique de la liste RAMEAU (ex-LAMECH). Reste le cas des autres établissements qui ne peuvent envisager de telles mesures pour la récupération des notices de leur propre fonds. En attendant de pouvoir récupérer des notices sur les bandes fournies par la Bibliothèque nationale 3, il leur reste la possibilité d'aller voir du côté des fournisseurs affichés au programme : OCLC pour la bibliothèque de l'Université libre de Bruxelles (Roland Horne), SIBIL pour la bibliothèque interuniversitaire de Montpellier (Marguerite Pézeril) et LIBRA pour la bibliothèque centrale de prêt des Yvelines (Jacqueline Gascuel).

La parole est à la base

Tous trois parlaient d'expériences concrètes, sur des fonds de taille et de physionomie extrêmement diverses, dans des établissements fortement contrastés ; tous trois parlaient de catalogage rétrospectif, de catalogage courant, de catalogage partagé, de catalogage dérivé, de catalogues consultables en ligne ; peut-on dire qu'ils aient tous réellement parlé de la même chose, qu'on peut mettre sur le même plan le catalogage partagé de LIBRA, le catalogage dérivé d'OCLC ? La question est peut-être oiseuse ; si les philosophies des services sont fondamentalement divergentes, c'est en définitive l'usage que peuvent en faire les établissements qui constitue la donnée fondamentale.

Premier constat, significatif : un des acquis les plus évidents des expériences présentées consiste en une remise en cause fondamentale de la chaîne du catalogage traditionnel ; à Montpellier, des binômes, non-hiérarchiques, spécialisés par matière, ont été constitués de manière à assurer l'ensemble du circuit du livre secteur par secteur ; à Bruxelles, on a eu recours pour la récupération rétrospective à sept « cadres spéciaux temporaires » (recrutés sur des contrats de trois ans qui garantissent un bon niveau de qualification), encadrés par un spécialiste du catalogage chargé de suivre les fichiers d'autorité. A Versailles, ce sont également des TUC et des personnels administratifs qui participent pour une large part aux opérations de récupération des notices.

Accord plus nuancé des trois intervenants pour souligner le caractère positif de ce type d'opération : plus de 90 % du catalogage courant dans les Yvelines (la récupération des notices est astucieusement différée de quelques jours); à Bruxelles, les taux de recouvrement courants se situent autour de 80-85 % en sciences exactes, 60-65 % en sciences humaines, mais ces secteurs représentent respectivement 35 % et 65 % des achats de monographies. A Montpellier, le travail s'effectue en différé, à partir des traitements périodiques réalisés tous les 3-4 mois par le CNUSC (Centre national universitaire sud de calcul) ; aussi l'aide pour le catalogage courant décroît-elle au fur et à mesure que s'allonge le délai entre la réception de deux bandes, passant de 80 % en sciences humaines à ..., mais les comparaisons ne peuvent guère aller plus loin, car les expériences présentées s'articulent sur des bases bibliographiques et des analyses de besoins fondamentalement différentes. Ces divergences sont particulièrement manifestes si on examine non seulement la forme mais aussi la destination des produits : à Montpellier et à Bruxelles les bandes obtenues sont destinées à la confection de catalogues en ligne destinés au public ; à Versailles les produits-papier continuent à alimenter des fichiers manuels à usage interne.

L'OVNI Ovide

Bruxelles se situe sous le signe du gigantisme : l'opération d'informatisation concerne un stock de 600 000 volumes répartis dans 28 implantations hétérogènes (1 bibliothèque centrale, 8 de plus de 80 000 volumes, plusieurs unités de 10 à 50 000) ; les fonds comportent 40 % de notices anglophones, 38 % de francophones, 22 % de diverses... Le recours à OCLC devrait permettre la récupération rétrospective de 300 000 notices sur trois ans dans le cadre d'une opération MICROCON, qui consiste à entrer des clés de traitement simples (premières lettres du nom de l'auteur, du titre, ISBN pour les ouvrages récents, année d'édition) : compte tenu des diverses opérations de tri sur les fichiers qui s'intercalent entre les différentes phases de traitement informatique (sélection des fiches principales, repérage, avec des pastilles de différentes couleurs, des fiches saisies, en cours de traitement, validées, etc.) la récupération rétrospective d'une notice revient, tous frais de personnel compris, à 13 F dans un délai de 4 semaines à partir du moment où les disquettes sont envoyées à Dublin.

Compte tenu aussi du caractère massif de l'opération, la récupération rétrospective a été isolée du travail courant et a été confiée à un noyau autonome, ce qui assure un rendement satisfaisant : plus de 50 clés peuvent être entrées en une heure. En corollaire, tous les cas de figure doivent être étudiés de façon rigoureuse et intégrés aux fichiers d'autorité (règles de translittération divergentes en français et en anglais, cas des auteurs allemands pouvant être transcrits de façons différentes, collectivités internationales, auteurs anciens inconnus à l'OCLC dans leur version « française », etc.), de manière à moduler les clés d'interrogation et à établir une traduction automatique de certaines vedettes (collectivités ou collections). Morale de l'opération dressée par Roland Horne : des listes d'autorité francophones disponibles, en ligne, aussitôt que possible, pour les vedettes auteurs, les collections et les vedettes matières...

Libre acquis

Les problèmes de l'utilisateur de LIBRA se posent en termes tout différents : un rendement élevé (plus de 20 000 notices récupérées en deux ans) puisqu'il est possible de récupérer environ 10 notices par heure en catalogage courant, 30 en catalogage rétrospectif, mais des coûts directs dont l'ampleur devrait pleinement apparaître avec la réduction du soutien accordé par la Direction du livre ; la participation des adhérents à la banque de données devra déboucher sur une tarification, probablement inférieure à 10 F la notice et qui - a-t-on cru comprendre - sera d'autant plus faible que le nombre des utilisateurs sera grand. D'ores et déjà notait Jacqueline Gascuel, des prestations telles que l'édition en ligne de listes des nouvelles acquisitions ne sont pas demandées, car trop onéreuses.

Cette problématique de clientèle, de tarifs et de coûts indirects, présente chez tous les utilisateurs de réservoirs bibliographiques, semble, à la BCP des Yvelines, aggravée par deux facteurs, l'un structurel (la fonction « catalogue » reste seconde dans le fonctionnement de l'établissement), l'autre conjoncturel(les meilleures plages de connexion se situeraient le soir ou le samedi). Dans sa forme actuelle (320 000 notices représentant la participation d'une cinquantaine de BCP, d'une douzaine de bibliothèques municipales, des bases de la Bibliothèque nationale et de la BPI), LIBRA paraît bien convenir aux besoins catalographiques d'une BCP, mais on peut s'interroger sur le degré d'acuité de ces besoins : combien de BCP ne cataloguaient pas du tout (ou si peu que... ) avant 1981 ? Combien de BCP « catalogueuses » omettaient de reporter dans leur catalogue les éliminations effectuées ? De telles pratiques sont assurément le signe d'une mauvaise gestion (à laquelle peut remédier l'informatique), mais elles témoignent aussi d'une définition spécifique du service. Pour n'avoir pas posé aussi brutalement la question, Jacqueline Gascuel n'en a pas moins insisté sur l'urgente nécessité de rendre opérationnel le module de prêt ; on ne débordait qu'apparemment le thème de la journée, la fourniture de notices bibliographiques, qui ne constitue qu'un aspect (important) de l'informatisation des services et de leur définition.

Il n'est pas réellement paradoxal de retrouver une problématique par certains aspects similaire de LIBRA en filigrane de l'exposé sur SIBIL, dont l'image est celle d'une base faite pour et par des bibliothèques d'études. Le problème de SIBIL est, de toute évidence, de grandir et de se donner une dimension nationale en élargissant le cercle de ses utilisateurs, cela d'autant plus que les quelque 850 000 notices de la base proviennent au premier chef de la Bibliothèque cantonale et universitaire de Lausanne ; l'apport français dû à la bibliothèque de Montpellier (et aux tout nouveaux utilisateurs que sont les bibliothèques de Bordeaux et de Grenoble) est encore réduit (70 000). La fonction prédominante semble être pour le moment l'alimentation de la base qu'il est prévu de renforcer par des prolongements thématiques, par la constitution de catalogues collectifs régionaux. Il est surtout prévu un reformatage complet de la base REBUS (en format dérivé de MONOCLE) dans un format US MARC, de manière à assurer toutes les interconnexions nécessaires avec les bases de l'OCLC et de la Bibliothèque nationale.

Autre point commun avec LIBRA : une remise en doute non point de la priorité même de la fonction « catalogue », mais de son antériorité dans un processus d'informatisation, les tâches de prêt, légères en formation de personnel, devant être les premières automatisées, à l'inverse du catalogue qui implique des actions de formation sensiblement plus conséquentes. Dans l'immédiat, l'incidence de la dérivation de notices dans le catalogage courant apparaît limitée : les taux de recouvrement entre les sections droit de Bordeaux et Montpellier sont certes importants, mais combien de monographies sont-elles concernées et à quel coût unitaire ? Toute la question, en fait, est de savoir si on peut porter un jugement sur SIBIL, qui, à ses origines, s'est voulu un système de gestion intégrée, en fonction de ce seul critère. Peuvent entrer également en jeu des éléments tels que le service rendu au bout du compte à l'utilisateur final, et, en particulier, la mise à disposition de catalogues en ligne ouverts au public (le projet de Montpellier devrait être opérationnel à partir de l'automne). La question reste pendante, tout comme celle des coûts de fonctionnement, jusque-là pris largement en charge par la DBMIST.

Le service national

Si on met bout à bout les différents éléments d'information sur les coûts de récupération de notices, on pourrait au premier abord croire que la Bibliothèque nationale cassera le marché de l'information bibliographique. En fait, la chose est moins évidente : les tarifs annoncés par Serge Salomon défient toute concurrence, mais dans le premier cas de figure (récupération rétrospective) il convient de les mettre en regard avec les tarifs appliqués par l'OCLC et non les coûts supportés en fin de parcours par l'utilisateur ; le service annoncé semble en effet devoir être très proche des opérations MICROCON : les bibliothèques souhaitant s'informatiser pourront disposer de bandes comportant les notices de leur fonds extraites à partir de clés numériques (1,50 F par notice) ou de clés auteur/titre (2,50 F), les coûts de préparation manuelle et de vérification restant à la charge du client. Donc, beaucoup plus une mise à niveau que du dumping.

Quant à la seconde partie du service, abonnement aux bandes de la Bibliographie de la France avec possibilité d'extraction des notices, elle sera modulée en fonction des exigences des clients (soit uniquement les notices du Dépôt légal à 2,50 F l'une, soit les notices Dépôt légal + Bibliographie de la France à 3,70 F le lot). La réussite de cette opération sera conditionnée par la capacité de suivre le rythme de parution dans des délais acceptables ; elle le sera aussi par la capacité des systèmes de gestion locaux à « avaler » sans difficulté des notices générées sous un système particulier et conçues dans une perspective de diffusion internationale.

En dernière analyse, c'est la capacité de la Bibliothèque nationale à devenir un serveur national (LE serveur national) et international qui est mise en jeu. Peu importe que les prestations affichées soient, pour le moment, des prestations en différé : on sait bien que tout le secteur de l'informatisation des bibliothèques (et autres institutions) a toujours fonctionné par effet d'annonce et que l'essentiel est d'abord de conquérir une clientèle... Et puis, même si l'objectif de « serveur en ligne » ne peut être atteint à court terme, reste la possibilité de diffuser des notices sur CD-ROM : la BPI a déjà à son actif un premier prototype, LISE - dont on a cru comprendre qu'il ne permettra pas la récupération, puisque les notices BPI sont générées dans un format qui leur est propre -, mais ses successeurs seront sans aucun doute plus ambitieux. Un projet de CD-ROM co-produit par cinq bibliothèques nationales (Etats-Unis, Canada, Allemagne fédérale, Grande-Bretagne et France) a été évoqué.

Des notices pour quoi, pour qui ?

Le transfert de notices bibliographiques sur CD-ROM, s'il semble, au moins à terme, devoir lever certaines contraintes de coût et de connexion, n'en pose pas moins la question de la destination et de l'usage d'un instrument qui est encore loin d'avoir trouvé son marché et ses utilisations 4. Est-il d'abord une alternative aux catalogues en ligne consultables par le public (c'est l'option prise avec LISE), sera-t-il surtout utilisé comme un micro-serveur à domicile, doublé d'un logiciel permettant la récupération de notices (exemple de Bibliofile) ? Les questions de la destination des notices bibliographiques subitement devenues l'objet d'un marché n'ont pas fini de se poser.

La motion présentée en fin de journée explicitait les demandes sous-jacentes à l'organisation de la journée : l'information, la concertation; elle insistait surtout sur l'importance d'un format unique d'échange, sur la nécessité de développer des fichiers d'autorité et « un réservoir national pour l'accès aux notices françaises et étrangères et la fourniture de produits bibliographiques adaptés aux besoins des bibliothèques »: la demande elle-même suppose que les notices françaises et étrangères soient totalement compatibles ; ce sont donc, en fait, les usages dominants ou, si l'on préfère, les rapports de force en matière d'échanges bibliographiques internationaux, qui trancheront la querelle des formats et des règles de catalogage, qui diront si peuvent coexister sur l'espace français plusieurs bases plus ou moins complémentaires, plus ou moins compatibles, plus ou moins interconnectables, ou si on assistera à la fragmentation d'un marché déjà bien réduit...

Autre non-dit significatif de cette journée, le silence total sur le service à rendre au public, public plus sensible au contenu et aux modes d'accès aux notices qui pourront être mises à sa disposition qu'à leur provenance. Est-il vraiment logique de basculer une information technique, à caractère professionnel très marqué, sur un outil à vocation grand public comme le CD-ROM, demandait Claire Stra ; la question n'a pas fini d'être posée, tout comme celle, restée informulée, des liens éventuels entre les réservoirs bibliographiques et les banques de données ; or ces dernières commencent à envisager une diffusion élargie auprès du grand public. Les bataillons des « sans format » - plus exactement des sans format reconnu - les utilisateurs d'Harmonie, Texto et autres formats pirates, ont été passés sous silence, sans qu'on puisse évoquer leur faiblesse numérique pour justifier cette omission. La spécificité des banques de données permet-elle d'évacuer totalement le problème ? L'interrogation repose à nouveau le problème des règles de catalogage et des formats : le serpent de mer de l'information bibliographique universelle n'a pas fini de se mordre la queue.