Le catalogage rétrospectif en Europe
Documents imprimés XVe-XIXe siècles
Geneviève Boisard
A la suite d'une première conférence organisée à Munich, en novembre 1990, par la British Library et la Bayerische Staatsbibliothek, une deuxième conférence s'est tenue pour étudier la possibilité d'une coopération internationale en matière de conversion de fichiers des documents édités de 1450 à 1830 1.
Une cinquantaine de personnes représentant les plus grandes bibliothèques de recherche de quatorze pays d'Europe assistaient à cette réunion.
Des recommandations
Après la conférence de 1990, un groupe de travail de treize personnes avait été constitué, sous la présidence d'Ann Matheson de la Bibliothèque nationale d'Ecosse, Michel Crump, de la British Library, assurant le secrétariat. Pour la France, Odile Gantier, puis François Dupuigrenet-Desroussilles, de la Bibliothèque nationale, ont participé aux travaux. Après s'être réuni quatre fois, le groupe de travail a élaboré diverses recommandations :
- la création d'un réseau de catalogage unique pour l'Europe afm de réaliser, d'abord, une base de données des notices des documents imprimés de 1450 à 1830 constituant le patrimoine européen imprimé (le groupe propose le Research libraries group (RLG) comme modèle) ;
- l'adoption d'Unimarc, non seulement comme format d'échange, mais comme format interne de la base ;
- l'emploi de l'ISBD (A) 2 comme code de catalogage proposé pour les nouveaux fichiers qui seront ajoutés à la base des documents couvrant la période de 1450 à 1830 (à condition que les options en soient clairement définies et que ce ne soit pas une décision exclusive) ;
- la création d'un projet distinct présentant le rassemblement des notices d'ouvrages des années 1830 à 1950, et cela, aussi vite que possible, par le moyen de projets de rétroconversion.
Pour faciliter ces opérations, il recommande la constitution de grands fichiers sources, tels que le General catalogue of printed books de la British Library.
Formats, bases et fichiers
Parallèlement au groupe de travail, le professeur Snyder du Centre d'études bibliographiques et de recherche de l'Université de Californie, à Riverside, a fait une étude comparative des règles de catalogage et des formats, ainsi que des problèmes posés par un catalogue collectif. Il en conclut que, malgré les différences, la coopération est possible. Il faut cependant développer Unimarc pour l'adapter au livre ancien, définir une notice minimale, harmoniser la forme des noms de lieux et des collectivités, et plus généralement celle des vedettes, soit par un fichier d'autorité commun, soit par un thésaurus permettant de lier les formes différentes de la même vedette. Il faut également établir un code identifiant les bibliothèques.
Il souligne que les ouvrages en plusieurs volumes nécessitent une description particulière et qu'il est nécessaire de trouver un accord sur la notion d'unité bibliographique réclamant une description bibliographique séparée.
Elly Cockx-Indestege, de la Bibliothèque royale de Belgique, a exposé les conclusions d'une étude portant sur 2 000 vedettes auteurs de la lettre C provenant des fichiers d'autorité belge, anglais, français et italien. Elle a étudié le taux de recouvrement entre ces quatre fichiers, taux généralement assez faible, inférieur à 20 %. Elle a conclu à la nécessité de fichiers d'autorité, en format Unimarc, pour lesquels chaque agence nationale aurait la responsabilité de ses auteurs et collectivités-auteurs nationaux et la charge de contrôler et de valider les apports extérieurs. Pour éviter de polluer les fichiers, il serait nécessaire de lier l'information bibliographique à la vedette auteur.
Par ailleurs, le système de formes parallèles d'une vedette permettrait de transformer une forme adoptée nationalement en renvoi au niveau collectif. Elly Cockx a plaidé pour la création d'un fichier d'autorité commun constitué par le chargement des fichiers existants et des principaux répertoires, qu'il faudrait ensuite corriger ; les vedettes de collectivités et les titres uniformes devraient faire l'objet d'une étude particulière. Enfin ce projet devrait être soumis aux Communautés européennes pour un financement éventuel. Michael Crump a insisté sur l'intérêt du projet et la nécessité d'aboutir à une base commune.
Anton Bossers, de Pica 3, a manifesté son désaccord avec cette solution et marqué sa préférence pour une base répartie. La discussion s'est engagée sur ce point, mais la majeure partie des participants semblait s'accorder sur le fait que les techniques actuelles ne permettaient pas de choisir la solution répartie sans surcoûts excessifs. Alix Chevallier a fait état à cet égard des conclusions des études faites pour le Catalogue collectif de France.
Nous avons pu ensuite assister à une démonstration de la base test : Early European printed books, EPB, élaborée par le RLG à partir des données fournies par la Suède et les Pays-Bas.
Les notices suédoises, qui ne sont pas en format Marc, avaient été converties en Marc par les soins du RLG. A l'heure actuelle, les deux fichiers coexistent mais, pour les accès, le RLG a établi des tables de concordance permettant de chercher dans l'un ou l'autre.
Parmi les communications qui ont suivi, Ivan Boserup, de la Bibliothèque nationale du Danemark, a exposé le programme de conversion des catalogues. Alors que les fichiers manuscrits sont saisis par le personnel de la bibliothèque, les fiches dactylographiées sont saisies par reconnaissance optique de caractères. Un programme créé à la bibliothèque permet la conversion de la saisie en format Marc, de même que la correction automatique des erreurs. 130 000 notices ont été ainsi converties depuis le début de l'opération en 1991.
Mettre en œuvre
Alors qu'un consensus très large s'est dégagé sur le projet, beaucoup de problèmes demeurent encore à résoudre : la forme du « consortium » à créer, le coût de l'opération dans sa phase de lancement et dans la phase opérationnelle, les rapports avec les deux grands serveurs que sont l'OCLC 4 et le RLG. Il est parfaitement évident que l'Amérique du Nord est intéressée au plus haut point par une base contenant les documents européens imprimés avant 1830. Le désir des Européens est de rester maîtres du projet, bien que les possibilités financières de chacun soient limitées.
Michael Smethurst, un des co-organisateurs de la conférence a essayé de chiffrer les différentes options possibles. Les coûts sont évidemment très différents suivant qu'on envisage un consortium ayant une équipe et des machines propres, que le projet soit hébergé par une grande bibliothèque ou un réseau de catalogage existant. Plusieurs pays sont déjà candidats : l'Italie, le Portugal et l'Espagne.
Est-il possible de s'inspirer du RLG pour créer un groupe européen du même ordre ? Le RLG lui-même accepterait de s'étendre vers l'Europe et l'OCLC a proposé ses services...
En définitive les questions sont à la fois d'ordre politique et financier et il faut savoir combien les bibliothèques sont prêtes à payer.
La conférence a pris à son compte les recommandations du groupe de travail et a adopté la résolution suivante : il est proposé que soit créé un « consortium » provisoire pour définir les spécifications générales d'une base de données européenne. Une fois créé, ce consortium invitera à le rejoindre d'autres participants acceptant de partager le coût estimé de 50 000 livres de son fonctionnement pendant les six premiers mois.
La première tâche de ce consortium consistera à formuler un programme d'évaluation des options concernant la mise en œuvre de la base de données, qui ont été discutées pendant la deuxième conférence de Munich, les 29 et 30 janvier 1992.
La conférence demande que le projet soit reconnu par l'IFLA et LIBER 5, sachant l'intérêt du travail du consortium provisoire.
La grande majorité des participants a voté ce texte. En tout état de cause, les bibliothèques françaises ne peuvent être absentes de ce projet, les bibliothèques universitaires encore moins, dont les fonds anciens antérieurs à 1830 s'élèvent à près d'un million de volumes. Le ministère de l'Education nationale doit leur permettre de participer à cette base commune du patrimoine européen, qu'elles devront alimenter, mais qui leur permettra également d'opérer à moindres frais la conversion de leurs fonds.
Je rappelle à cet égard qu'au 1er janvier 1992, pour la bibliothèque Sainte-Geneviève, 635 notices antérieures à 1830 existent dans le CD-ROM, auxquelles il faut ajouter les notices à charger pour la Bible et l'Imitation de Jésus-Christ.
Pour la même période, la Sorbonne possède 875 notices et Cujas quatorze, soit 1524 notices au total sur le CD-ROM Quartier latin.