Internet, bases de données et livre ancien

Magali Perbost

Le but de la journée d'étude organisée par l'Association des Amis des Nouvelles du livre ancien, le 5 juin dernier à l'Institut de France, était de présenter les possibilités offertes par les supports et réseaux informatiques pour la recherche sur le livre ancien. Le temps assez bref (une vingtaine de minutes) imparti à chaque intervenant a permis à un grand nombre de personnes de s'exprimer et aux auditeurs d'avoir un vaste panorama de la question : présentations de catalogues collectifs, de bases de données spécifiques ou de cas de recherche concrets avec énumération des ressources disponibles se sont succédé.

Les catalogues collectifs informatisés

Dans le domaine des catalogues collectifs informatisés, on notera l'exposé de Julianne Simpson consacré à l'Early Printed Books Project d'Oxford. Le projet, initié en 1995, visait à décrire tous les livres étrangers imprimés avant 1641, conservés dans les bibliothèques universitaires d'Oxford hors la Bodléienne. Le travail va sans doute être étendu aux livres imprimés entre 1641 et 1800. Dès 1929, un catalogue collectif, l'Inter-Collegiate Catalogue, avait été constitué par copie et intercalation de fiches dans un fichier unique. Dans les années 50, les fiches concernant les impressions britanniques et les livres imprimés en anglais à l'étranger avaient été enlevées pour être incluses dans le Short Title catalogue. Dans les années 70, les notices ont été converties sous forme informatique. À partir de juin 1995, sur la base de ce fichier, une équipe a entrepris le recatalogage, livre en main. À la date de la communication, il y avait 15 000 notices créées dans OLIS (Oxford Libraries Information System) par le projet, soit la moitié des collections concernées 1. Les notices ont été récupérées quand cela était possible dans RLIN (Research Libraries Information Network), OCLC (Online Computer Library Centre) ou HPB (Hand Press Book). Des index autorités ont été créés, non seulement pour les auteurs, mais aussi les éditeurs, imprimeurs, graveurs, illustrateurs. Pour un tiers des notices environ, on a pu détailler les particularités d'exemplaires : notes manuscrites, description de reliures, marques de provenance, toutes choses recherchables par mots-clés. On envisage en outre de lier au catalogue des images des éléments dont la description textuelle ne suffit pas : marques d'imprimeurs, reliures, etc.

Les réalisations françaises et européennes

Pour ce qui est des réalisations françaises, le SU (Système universitaire), qui dépasse le cadre du livre ancien, a été présenté par Élisabeth Coulouma, de l'Agence bibliographique de l'enseignement supérieur. Cette base de données et réseau de catalogage partagé pour les universités françaises est encore en gestation. Elle comptera à son ouverture 60 000 notices de livres anciens, qui n'ont pas été dédoublonnées. Un groupe de travail va se réunir prochainement pour régler les problèmes spécifiques au livre ancien dans le SU.

Le SU s'intégrera dans un ensemble encore plus vaste, le Catalogue collectif de France, présenté par Edwige Archier, de la Bibliothèque nationale de France (BnF). Il donnera un accès unifié à trois ensembles : le Système d'information de la BnF, le SU, et le catalogue des bibliothèques municipales rétroconverties.

Rappelons que la conversion des catalogues des bibliothèques municipales, entre 1992 et 1996, a concerné au total 56 bibliothèques, pour 2 186 525 notices. Elle s'est faite sans reprise des livres, et il n'y a pas de points d'accès normalisés. Edwige Archier a d'ailleurs insisté sur le fait qu'il s'agit d'un catalogue de localisation et non de recherche bibliographique : les notices sont regroupées en grappes censées décrire la même œuvre ou la même édition.

Hand Press Book, base de données européenne créée par le CERL (Consortium of European Research Libraries), a été présentée par Marian Lefferts. Cette base visant à enregistrer tous les livres imprimés en Europe avant 1830 est constituée par la juxtaposition des fichiers fournis par les bibliothèques membres, et comptait à la date de la communication environ 792 400 notices. D'autres fichiers sont en préparation. En outre, la bibliothèque municipale de Lyon et plusieurs bibliothèques universitaires françaises sont sur le point d'adhérer au projet. En plus d'HPB, l'adhésion au CERL permet l'accès à l'English Short-Title Catalogue et à ses 400 000 notices de livres du XVIIIe siècle. La base est consultable par le Web.

Les essais de numérisation

Magali Vène, de la Bibliothèque interuniversitaire de médecine de Paris, a présenté quelques exemples de numérisation de fichiers, avec les différentes options choisies. A la Bibliothèque nationale d'Autriche, plus de six millions de fiches dactylographiées ont été numérisées en mode image noir et blanc et mises sur le site Web. Aucun élément textuel n'a été saisi : on s'est contenté de diviser le catalogue en tranches alphabétiques, et le logiciel de recherche, Katzoom, fonctionne ensuite par zooms successifs sur des séries de fiches de plus en plus réduites jusqu'à l'obtention de la fiche souhaitée. A la Bibliothèque nationale centrale de Florence, la numérisation en mode image et en couleur des 225 000 fiches dactylographiées du catalogue Palatino s'accompagne d'une courte saisie (vedette, début du titre et date de publication), mais se présente comme un système d'attente avant rétroconversion. Quant aux 337 000 fiches manuscrites du fichier ancien de la Bibliothèque interuniversitaire de médecine de Paris, elles ont été numérisées en mode image et 256 niveaux de gris, à cause du mauvais état du fichier, incommunicable. 25 caractères ont été saisis pour chaque fiche (nom et premier prénom de l'auteur, date de publication).

Les bases spécialisées

Plusieurs bases spécialisées dans des domaines précis du livre ancien ont également été présentées. Silvio Corsini, de la Bibliothèque cantonale et universitaire de Lausanne, a consacré son exposé aux bases concernant les ornements typographiques. Dans la mesure où les ornements typographiques utilisés par un atelier donné forment un corpus dont on retrouve des fragments dans la plupart des livres imprimés par cet atelier, ces ornements sont un outil majeur d'identification des imprimeurs. C'est pourquoi plusieurs projets existent déjà : Vignette (imprimeurs lausannois du XVIIIe siècle), Fleuron (imprimeurs de Suisse française dans les années 1770-80), Moriane (imprimeurs liégeois du XVIIIe siècle), etc. Quant à la base Passe-Partout, centre de l'exposé, c'est une banque internationale d'ornements typographiques hébergée à Lausanne. Son but est de fédérer les multiples recherches en cours sur le sujet, et elle fonctionne comme un « métacatalogue », chaque centre participant continuant à travailler sur ses propres bases de données. Pour pallier le problème de l'indexation des images, TODAI (Typographical Ornaments Database and Indexation), qui utilise les progrès réalisés par les logiciels de reconnaissance de formes, a été développé pour Passe-Partout : il permet une recherche automatisée à partir d'un ornement digitalisé, sans intervention de description textuelle, par simple comparaison.

La recherche

Enfin, plusieurs intervenants ont présenté des exemples de recherche, en profitant souvent pour dresser un tableau des bases disponibles. Ève Netchine, de la BnF, a commenté les différents résultats obtenus pour la recherche de brochures agronomiques françaises du XVIIIe siècle dans le catalogue Web de la BNF, BN-Opale plus, le cédérom de la rétroconversion (qui ne contient pas les anonymes mais offre plus de critères d'interrogation) et le catalogue des bibliothèques municipales rétroconverties. Il est intéressant de constater que ces instruments, qui n'offrent pas les mêmes services, sont complémentaires.

À propos de ses propres recherches, Chiara Lastraioli, du Centre de la Renaissance, à Tours, a parlé des avantages des ressources électroniques (rapidité de repérage, recherches par mots-clés qui permettent des découvertes, aperçu de la diffusion du livre et de l'importance numérique des exemplaires conservés), mais aussi des inconvénients (manque d'uniformité des catalogues dans la description bibliographique, erreurs de formats, hâte préjudiciable avec laquelle se sont faites les conversions rétrospectives de certains catalogues). Puis elle a présenté les ressources informatiques italiennes. Elle a notamment présenté l'ICCU (Istituto Centrale per il Catalogo Unico), qui dirige le service bibliothécaire national, SBN, lequel regroupe la plupart des catalogues informatisés italiens. Citons aussi, parmi beaucoup d'autres, le projet napolitain « Libro antiquo », qui vise à la numérisation du document manuscrit ou imprimé dans son entier.

Le texte des interventions de cette journée fort riche a été placé sur le site Web des Amis des Nouvelles du livre ancien 2, inauguré à la fin de la journée lors d'un « cybercocktail ». On y trouve également des liens vers tous les sites dont il a été question au cours de la journée, et la liste de forums de discussion et listes de diffusion sur le livre ancien présentée par Yann Sordet. Un petit tour sur ces pages est donc vivement conseillé à ceux qui n'ont pu assister aux exposés, et même aux participants, auxquels cette journée aura très certainement donné envie d'aller voir par eux-mêmes tout ce dont on leur a parlé.