La conversion rétrospective des catalogues

Catherine Lupovici

La conversion rétrospective est le complément de la démarche d'informatisation de la bibliothèque. Elle permet l'introduction dans le système des informations contenues dans les catalogues manuels. C'est une activité différente du catalogage courant informatisé, qui a ses propres techniques et qui peut être conduite soit à l'intérieur de la bibliothèque, soit par un prestataire de services extérieur spécialisé dans cette activité. Comme tout projet se déroulant sur une certaine durée et représentant un investissement important, il doit être géré par la bibliothèque en termes d'objectifs, de planification et de suivi.

Retrospective conversion of catalogs allows the library to offer the patrons on line access to bibliogrphic data, previously available on cards. This is a specifie activity completely different of current cataloging, with its own methods. It can be processed within the library or by an extemal supplier specialized in retrospective conversion. Such a project needs management and specifie organization in the library for the definition of goals, choice of the method(s), planning, control and evaluation fo the

La conversion rétrospective est l'opération qui permet de convertir sous forme exploitable par ordinateur, dans un format standard, un ensemble de notices bibliographiques de documents déjà catalogués manuellement ou informatiquement dans un autre format.

Cette opération ne doit pas être confondue avec le catalogage rétrospectif, il s'agit généralement d'une action de masse qui concerne des volumes qui n'ont rien à voir avec le catalogage courant.

Origines

Le terme est apparu aux Etats-Unis dès 1969, c'est-à-dire pratiquement avec la naissance du format MARC 1 et du service de distribution des données bibliographiques de la Bibliothèque du Congrès sur bandes magnétiques et simultanément à l'émergence de systèmes informatiques capables de supporter ces données. La première conversion rétrospective a été lancée en 1973 pour la contruction d'un catalogue collectif nord-américain des publications en série CONSER (Conversion of serials), et aujourd'hui, toute bibliothèque nord-américaine a déjà réalisé, est en train de réaliser ou prépare un programme de conversion rétrospective.

En Europe, certains programmes ont déjà été réalisés notamment pour la construction de catalogues collectifs, mais la généralisation de cette technique bibliothéconomique en est à ses débuts. Soutenue initialement par l'action de l'association LIBER 2, la conversion rétrospective est inscrite dans la ligne d'action 1 du programme de la DG XIII B pour les bibliothèques.

Toute la problématique et les techniques associées à la conversion rétrospective sont intimement liées à l'histoire de l'informatisation du catalogage et de la gestion des bibliothèques dont il n'est pas inutile de rappeler rapidement l'évolution dans le continent nord-américain, puisque cette évolution influence considérablement nos propres systèmes bibliographiques et de gestion.

La période 1968-1985 a été appelée l'âge d'or des réseaux coopératifs. C'est celle du partage des ressources informatiques de gros systèmes centralisés. Elle correspond aussi à la mise en place, dans la philosophie du Contrôle bibliographique universel, des puissants réseaux de ressources bibliographiques (bibliographic utilities) qui assurent la contribution de leurs adhérents à la création collective d'informations bibliographiques lisibles en machine et la redistribution de ces informations, ainsi que celles distribuées au niveau national par la Bibliothèque du Congrès et la Bibliothèque nationale du Canada. Ces réseaux ont permis la construction des catalogues collectifs, support du prêt entre bibliothèques et une informatisation, que l'on peut qualifier de type contrôle bibliographique à l'usage des bibliothécaires, plutôt que de type accès bibliographique à l'usage des lecteurs. Leur stratégie a associé, dès 1975, les services de conversion rétrospective à ceux du catalogage courant, d'abord pour les publications en série, puis pour tous les types de documents. Ces réservoirs bibliographiques sont aujourd'hui au nombre de trois et ont une dimension internationale : OCLC (Online computer library center), RLIN (Research libraries information network) et UTLAS (aujourd'hui UTLAS International, auparavant University of Toronto library automation system) 3.

Les années 80

La période qui commence au milieu de la décennie 1980 voit apparaître de nouveaux acteurs et de nouvelles technologies dans le domaine de l'informatisation des bibliothèques. C'est la période de mise en œuvre de nombreux systèmes locaux pouvant fonctionner sur des ordinateurs de plus en plus petits et puissants, et parallèlement d'une large disponibilité de services commerciaux complémentaires des systèmes locaux et qui entrent en compétition avec les réservoirs bibliographiques.

L'évolution technologique favorise l'autonomie locale et la coopération à une plus petite échelle. Les services vendus en association avec les systèmes locaux comportent aussi la conversion rétrospective de manière à favoriser la mise en œuvre rapide de modules tels que le prêt, et plus récemment l'OPAC 4. Les systèmes locaux clés en mains disposent tous d'interfaces de chargement de données bibliographiques. Le format MARC devient le standard de fait pour l'importation, la mise à jour et l'exportation de données bibliographiques, quel que soit par ailleurs le format interne de gestion des données.

Enfin la dernière évolution en cours est l'importance de plus en plus grande de la micro-informatique et l'émergence de stations de travail sur micro-ordinateurs, postes polyvalents permettant de communiquer à la fois avec les réservoirs bibliographiques, les systèmes locaux, les bases de données en ligne ou de piloter un CD-ROM 5. Le module fondamental de la gestion intégrée de la bibliothèque a été successivement le prêt, le catalogue et se déplace maintenant vers l'OPAC, qui est le module de l'ouverture pour l'usager à l'information locale et distante. On arrive enfin à une informatisation locale permettant à la fois la gestion de l'activité de la bibliothèque et l'accès à l'information bibliographique pour le lecteur, en attendant la consultation prochaine sur la station de travail du document lui-même.

La conversion rétrospective est bien entendu influencée par cette dernière évolution technique, notamment par l'apparition du CD-ROM.

La conversion rétrospective s'effectue donc dans un contexte marqué par l'une des deux grandes tendances historiques, informatisation sur réseau bibliographique coopératif ou informatisation par l'acquisition et la mise en œuvre d'un système de gestion de bibliothèque clés en mains. Elle peut donc avoir pour objectif principal la participation à un programme coopératif de conversion rétrospective en vue du signalement au niveau national, voire international, de collections particulières, notamment en vue du prêt entre bibliothèques, ou bien elle peut être le support de la mise en oeuvre d'un système de gestion locale avec un accent particulier sur un module tel que le prêt, le catalogue ou l'OPAC. Les objectifs coopératifs et locaux peuvent aussi être combinés. Dans tous les cas, de la définition des objectifs dépendra la technique de la conversion.

Les objectifs

Les objectifs d'une conversion rétrospective se déroulant sur un système coopératif ou dans le cadre de la constitution d'un catalogue collectif sont déterminés au niveau coopératif, à l'échelon régional ou national et vont être de nature généralement documentaire, comme support à la localisation et éventuellement au prêt des documents entre organismes. La bibliothèque intervient dans le cadre des organes coopératifs de décision ou, dans un contexte plus centralisé, applique des directives en ce qui concerne les données à convertir, les techniques et méthodes à utiliser, le planning à respecter.

Lorsque la conversion rétrospective est associée à la mise en place d'une informatisation locale, sa mise en œuvre va nécessiter les mêmes démarches d'analyse de besoins, de définition d'objectifs avec classement des priorités, d'organisation de projet, etc., que le choix du système informatisé lui-même. Toute cette réflexion va s'effectuer sur les collections et sur l'information bibliographique permettant l'accès aux collections. La conversion est en effet un projet de producteur d'information, le choix du sytème informatique de support étant un projet de serveur d'information. Les données rétrospectives devront aussi cohabiter avec les données bibliographiques courantes.

Les questions qui doivent être posées sont : quelle information, pour qui et pour faire quoi ? Alors que le choix du système de gestion locale répond aux questions : quel outil documentaire et quelle interface utilisateur ? Il est évident que les deux démarches sont complémentaires et que les données récupérées doivent être compatibles avec les possibilités techniques du système serveur de données. Cette réflexion peut faire apparaître le besoin d'améliorer les données disponibles pour la conversion.

Les données élémentaires nécessaires dans le système d'information en construction devront être clairement identifiées en relation avec les modules applicatifs mis en œuvre (prêt, acquisitions, bulletinage, catalogue, OPAC). Ces données élémentaires pourront aussi être en relation avec la politique documentaire globale de la bibliothèque ou des opérations sur les collections. Elles varieront selon le type et la taille de la bibliothèque.

Par exemple pour une bibliothèque publique, la mise en oeuvre du prêt informatisé et de l'OPAC sera fondamentale et pourra être associée à des opérations d'équipement de codes à barres. L'articulation entre les données bibliographiques et les données d'exemplaires sera fondamentale pour la conversion rétrospective.

Pour une bibliothèque d'étude et de recherche, l'OPAC sera peut-être plus proche d'un système documentaire sur le plan de l'indexation. La conversion pourra par exemple permettre, par l'utilisation de certains réservoirs bibliographiques, la récupération des informations de classification et des informations statistiques utiles pour la mise en œuvre d'un plan de développement des collections.

Une agence bibliographique de niveau national aura plutôt tendance à voir dans sa conversion rétrospective la possibilité d'une diffusion électronique de l'information qu'elle diffusait autrefois sur un support papier.

Enfin, dans tous les cas, des opérations de récolement, voire de conservation (restauration, reproduction) pourront être associées à la conversion rétrospective.

Les techniques

Les techniques de base de la conversion rétrospective sont la saisie intégrale des informations du catalogue manuel ou l'utilisation de réservoirs bibliographiques avec saisie des informations locales complémentaires et des notices qui ne se trouvent pas dans le réservoir.

Les techniques de saisie couramment utilisées sont la saisie au clavier des informations et des codes de structure. La reconnaissance optique de caractères permettant à la fois de saisir les informations et la structure est encore aujourd'hui du domaine de la recherche. Elle peut s'appliquer à certains catalogues de documents très homogènes avec une présentation très structurée par l'utilisation d'attributs typographiques qui vont au-delà des règles de présentation de l'ISBD 6. Bien que les progrès soient très rapides dans l'utilisation de cette technique, elle ne figure pas aujourd'hui dans les techniques de production de la conversion rétrospective des catalogues de bibliothèques.

L'utilisation de réservoirs bibliographiques peut se faire sur la base de données en ligne ou sur une version CD-ROM de cette base. Evidemment, comme pour la localisation sur un catalogue collectif, seule la version de la base en ligne est à jour à tout moment. Dans les deux cas, les informations peuvent être copiées et transférées ensuite sur le système de la bibliothèque, soit notice par notice, soit par groupe de notices. Dans le meilleur des cas, il sera possible lors de la dérivation de rajouter les informations locales de gestion. Dans le cas contraire, il faudra revenir sur chaque notice bibliographique sur le système d'accueil, afin d'y ajouter ces informations indispensables pour une gestion des exemplaires.

Enfin, l'utilisation de la base en ligne peut se faire par une connexion au système qui va comprendre une phase de recherche bibliographique, une phase de dérivation et d'ajout des données locales. Elle peut aussi se faire par un traitement en différé de recherches transmises sur support magnétique au serveur. Dans ce cas, la recherche n'est pas interactive. Si elle produit du bruit, elle ne pourra être précisée immédiatement et les réponses multiples devront être triées à l'aide du rapport de résultat. Si elle produit du silence, une autre recherche en différé devra être tentée. Enfin, elle peut produire une mauvaise réponse qui ne sera détectée que si les réponses sont vérifiées une à une. Ce taux de mauvaises réponses à une recherche en différé se situe entre 3 et 5 % selon les estimations des bibliothèques françaises qui ont testé l'utilisation des services en différé de la Bibliothèque nationale ou du réseau OCLC.

Les méthodes

Elles se partagent en deux classes : les conversions conduites à l'intérieur de la bibliothèque et les conversions sous-traitées à une société spécialisée à l'extérieur de la bibliothèque. Dans l'un et l'autre cas, toutes les techniques évoquées ci-dessus peuvent être utilisées. Enfin, toutes les techniques et méthodes peuvent être combinées dans un projet global de conversion rétrospective.

Cependant il faut être conscient que tout mixage des techniques et méthodes entraînera une organisation complexe et coûteuse et pourra entraîner des contraintes techniques lourdes.

Par exemple, l'utilisation de réservoirs bibliographiques divers, utilisant des formats d'échange et des règles de catalogage différents sera la source de problèmes techniques importants pour l'homogénéité du catalogue de la bibliothèque, en plus des coûts induits par la multiplication des interfaces d'importation de données.

La conversion par la bibliothèque elle-même

Ce type de conversion nécessite la mise en place d'une cellule de conversion rétrospective encadrée par du personnel permanent de la bibliothèque, ainsi que la mise à disposition de matériel informatique dédié pendant toute la durée de l'opération. Une organisation rigoureuse devra être mise en place dont la complexité dépendra de la technique ou des techniques utilisées.

La conversion par requêtes traitées en différé nécessitera toute une gestion des premières requêtes, des rapports de traitement, des deuxièmes requêtes, des rapports de deuxièmes traitements et quelquefois de troisièmes requêtes et rapports correspondants. Enfin, toutes les notices non trouvées devront être repérées et traitées par une autre méthode. Ceci nécessite du matériel dédié pour la saisie des requêtes. Si elle est effectuée sur le même réservoir que le catalogage courant coopératif, elle peut utiliser les mêmes interfaces de chargement des informations sur le système local et offre des notices homogènes avec celles issues du catalogage courant.

La conversion en catalogage partagé sur système coopératif ou sur le système d'un fournisseur d'informations bibliographiques est plus simple à organiser. Elle permet la décision immédiate puisque la recherche est interactive. Elle est plus coûteuse en télécommunications et nécessite des terminaux dédiés à la conversion rétrospective. Si elle est effectuée sur le même réservoir que le catalogage courant coopératif, elle peut utiliser les mêmes interfaces de chargement des informations sur le système local et offre des notices homogènes avec celles issues du catalogage courant.

La conversion sur CD-ROM : les systèmes disponibles offrent, soit un sous-ensemble de la base en ligne, soit la base complète. Ils peuvent être conçus comme un complément de la base en ligne et offrir le logiciel de connexion automatique en cas de recherche infructueuse sur le CD-ROM. Un programme de conversion d'envergure nécessitera de multiplier les postes de conversion (micro-ordinateurs, lecteurs de disques et abonnements aux disques). Un investissement de mise en réseaux pourra se justifier en fonction du nombre de postes.

La conversion dans la bibliothèque, sur le système de la bibliothèque : le fichier d'une autre bibliothèque de profil proche, ou des données acquises auprès d'un fournisseur sont chargées sur le système local et utilisées comme celles d'un réservoir bibliographique distant. En fin de conversion, les données non utilisées doivent être détruites. Cette méthode nécessite du matériel de saisie dédié à la conversion rétrospective et une configuration du système local permettant de supporter temporairement le fichier de référence chargé localement.

Les services commerciaux de conversion rétrospective

Ce sont des services spécialisés dans cette activité, connaissant bien les formats et les règles de description bibliographique. On en compte actuellement environ 25 dans le continent nord-américain, dont les réservoirs bibliographiques et la Bibliothèque du Congrès, qui offrent aussi ces services à caractère commercial, soit directement, soit par l'intermédiaire de coopératives régionales. En Europe, il n'y en a pas aujourd'hui plus de cinq et s'ils utilisent généralement des bibliothécaires professionnels, ils ne sont pas encore véritablement redistributeurs de données issues, soit du Contrôle bibliographique universel, soit de catalogage coopératif ou de conversions antérieures, comme le sont leurs homologues nord-américains. Cela tient principalement à l'organisation actuelle de la distribution des données en Europe.

Ces services commerciaux offrent de manière souple le service demandé par la bibliothèque sur la base de contrats précisant les engagements techniques, de délais, de qualité et, dans le cas d'utilisation de réservoirs bibliographiques, précisant le régime juridique de réutilisation éventuelle des données.

Certains offrent aussi des services de traitement d'amélioration des données, notamment en ce qui concerne les points d'accès par l'utilisation des fichiers d'autorité de la Bibliothèque du Congrès, ainsi que des produits-catalogues, allant du papier au CD-ROM, en passant par les microfiches encore très répandues dans le continent nord-américain.

Dans ce contexte, la bibliothèque n'a plus besoin d'organiser et de gérer une cellule spécialisée dans la conversion rétrospective elle-même. Cependant, comme tout projet, la conversion rétrospective nécessite un chef de projet à l'intérieur de la bibliothèque, qui reste l'interlocuteur permanent de la société pendant toute la durée de la conversion, et assure l'organisation du contrôle de la qualité demandée au fournisseur.

Planification

Un projet de conversion rétrospective s'inscrit dans une durée en vue d'un résultat. Cette durée sera fonction des objectifs déterminés pour la conversion, ainsi que des méthodes et des techniques retenues. Il devra être complètement planifié en terme de réalisation bibliographique et de budget.

Il est bon d'avoir une réflexion globale sur la conversion rétrospective à effectuer pour la bibliothèque et de définir ensuite des sous-ensembles selon certaines priorités telles que les domaines, les périodes chronologiques, les collections de prêt, les types de documents, un changement de classification, le libre accès, etc., de manière à aboutir à un ensemble final cohérent et à éviter la duplication des efforts. Une étude globale bien conduite permettra à la fois de déterminer les priorités, les normes, les méthodes, mais devra aussi être suffisamment souple pour être réorientée en fonction d'évolution dans la politique, les subventions ou les technologies. Ceci est très important pour les grandes bibliothèques. En effet, les petites bibliothèques sont les premières à pouvoir financièrement réaliser rapidement la totalité de leur conversion rétrospective.

Après avoir déterminé l'étendue globale souhaitable de la conversion, des études techniques seront nécessaires pour rassembler des données statistiques quantitatives et qualitatives sur tous les catalogues. Un échantillonnage aléatoire pourra être utile pour conduire ces études.

Les problèmes

La qualité des données servant de base à la conversion : tout projet d'informatisation est souvent vécu comme une « grande purification », qui va permettre une fois pour toute de remédier à toutes les imperfections des informations manuelles qui devront être parfaites avant d'être introduites sur le système informatisé.

Il paraît plus simple pour les personnes qui n'ont pas pratiqué un catalogue informatisé auparavant d'effectuer des corrections sur le papier plutôt que d'utiliser ultérieurement des programmes qui permettront d'effectuer efficacement des corrections en série regroupées par types de problèmes. On assiste alors à la dernière action de perfectionnisme de catalogage manuel qui prendra mal en compte les besoins réels du futur catalogue informatisé. Les questions fondamentales peuvent être classées en trois catégories.
- Quelles imperfections et quels manques d'homogénéité dans la description bibliographique apporteront une gêne réelle dans la recherche en ligne, selon les modes de recherche qui sont souhaités (recherche booléenne, feuilletage) ? Comment et jusqu'à quel point y remédier ?
- Quelles imperfections et quels manques d'homogénéité dans les points d'accès auteurs, collectivités auteurs et titres conventionnels apporteront une gêne réelle dans la recherche en ligne et, en particulier, quelles répercussion cela aura-t-il, par rapport à une option de contrôle des points d'accès par une forme contrôlée conforme à un ficher d'autorité ? Comment et jusqu'à quel point y remédier ?
- Quelles imperfections et quels manques d'homogénéité dans les points d'accès vedettes matières ou indices de classification apporteront une gêne réelle dans la recherche en ligne, en liaison avec le contrôle des points d'accès par rapport à une liste d'autorité ? Faut-il être puriste ou bien trouver une solution technique pour offrir le maximum de points d'accès, faute de pouvoir réindexer tout un fonds ?

Le choix des normes

La conversion rétrospective va permettre une saisie avec codification de la structure des données élémentaires. Cette structuration de l'information pourra être réalisée selon des standards nationaux ou internationaux qui sont publiés et mis à jour ou selon des prescriptions locales.

Le choix des règles de structuration de la conversion, associé au choix du système d'accueil, conditionne tout le futur du système d'information de la bibliothèque et de sa capacité à évoluer vers d'autres systèmes ou à échanger des informations avec d'autres bibliothèques. Les formats MARC ne présentent pas tous le même niveau de structuration des informations bibliographiques et, s'il est toujours facile d'appauvrir une structure, il est souvent difficile de l'enrichir sans aucune détérioration de l'information. Il faut être conscient que les systèmes commerciaux ont été développés et fonctionnent de façon optimale et sans surprise pour certains formats. Enfin il est recommandé d'adopter un format avec les règles de catalogage qui lui sont associées à l'origine de manière à pouvoir suivre son évolution sans problème.

Ces choix normatifs auront nécessairement une influence sur les techniques de la conversion, en particulier sur l'utilisation de réservoirs bibliographiques.

Le choix de réservoirs bibliographiques

Ce choix se fera après une étude des éléments suivants :
- le taux de recouvrement avec les catalogues à convertir pourra faire l'objet de tests sur différents réservoirs à partir d'un échantillon aléatoire du catalogue. Pour être significatif, ce test devra porter sur un échantillon suffisamment important. La taille minimale dépendra de l'homogénéité des collections ; cependant un seuil minimum de 200 à 300 notices est à prévoir ;
- la qualité des données retrouvées sur les réservoirs bibliographiques sera comparée à la qualité des catalogues sources de la conversion et au niveau de qualité souhaité pour le résultat. Cette qualité est la conséquence de l'organisation du réservoir bibliographique et de l'origine des notices qu'il offre. Elle pourra être évaluée selon les trois niveaux cités précédemment pour juger de la qualité du catalogue source ;
- le format et les règles de catalogage devront être compatibles avec les règles partiquées dans le catalogage courant informatisé, sauf à décider dès le départ que les données ne seront jamais fusionnées et seront éventuellement utilisées sur des systèmes différents ;
- les problèmes linguistiques seront évoqués. Ils se posent en termes différents selon les différents types de bibliothèques, en particulier selon l'intégration de leurs services, qu'elles prévoient au niveau européen ;
- le droit d'usage des données récupérées des réservoirs bibliographiques. Les données de certains réservoirs sont soumises à des restrictions d'usage qui doivent être prises en compte de façon pragmatique, c'est-à-dire par une évaluation de la gêne réelle qui risque de résulter de telles clauses pour les actions programmées à court terme par la bibliothèque.

Ces problèmes ne sont cependant pas insurmontables et on peut dire qu'aujourd'hui, une véritable mode de la conversion rétrospective est en train de naître en France et au niveau européen, justifiée par les programmes qui sont mis en œuvre pour une interconnexion des systèmes de gestion de bibliothèques et pour la réalisation d'un marché européen de l'information bibliographique, support de l'accès aux documents. Tout ce qui vient d'être exposé sur la complexité de ces opérations met en valeur le besoin de formation et d'information qui ne peut être totalement dissocié des questions relatives à l'informatisation.

Janvier 1991

Illustration
La British library : le pragmatisme