Les catalogues collectifs

Problématique générale et choix techniques

Michèle Lénart

Un certain nombre d'agences de coopération régionales sont aujourd'hui confrontées à la nécessité de diffuser leur catalogue collectif sur Internet. Le problème est moins simple qu'il n'y paraît, d'une part parce qu'il existe plusieurs types de solutions, mais surtout parce que les choix faits en matière de définition de projet et d'organisation du travail ont un impact sur les orientations techniques. La démarche de définition du projet est essentielle si l'on veut aboutir à des choix cohérents mettant en relation tous les paramètres du projet.

A number of regional cooperation agencies are today confronted with the necessity of distributing their union catalogue on the Internet. The problem is not as simple as it seems, partly because there are several types of solution available, but above all because the choices made in such matters as the definition of the project and the organization of the work have an impact on its technical orientation. Progression in defining the project is essential if one wants to succeed in making the coherent choices that put in context all the parameters of the project.

Gegenwärtig stehen eine gewisse Anzahl von regionalen Kooperationsagenturen vor der Notwendigkeit ihren Verbundkatalog auf Internet zu verbreiten. Das Problem ist nicht so gering wie es scheint, da nämlich verschiedene Lösungsmöglichkeiten bestehen, aber vor allem da die Entscheidungen bezüglich der Projektbestimmung und der Arbeitsorganisation sich einschlägig auf die technischen Orientierungen auswirken. Die Definition des Projekts ist wesentlich, will man zu zusammenhängenden Entscheidungen kommen, die alle Parameter des Projekts verbinden.

Des expériences récentes, pour la plupart menées en région au niveau des agences de coopération, ont mis en évidence les difficultés de mise en œuvre des catalogues collectifs sur le plan technique. Or, si les problèmes informatiques sont pour partie spécifiques, ils n'en relèvent pas moins d'une approche globale de gestion de projet. Le risque est en effet de donner la priorité à la problématique technique, alors que, pour garantir le succès et la pérennité du projet, l'accent doit d'abord être mis sur sa définition : contenu, objectifs et surtout cadre de fonctionnement et règles de coopération. Les principaux facteurs de risque portent essentiellement sur une dilution des pratiques de coopération bloquant la mise à jour du catalogue, voire sa réalisation, ou le retrait d'un financeur rechignant à soutenir une opération ayant des coûts d'investissement non maîtrisés ou des coûts de fonctionnement trop élevés. La problématique technique doit donc rester seconde et découler de l'analyse des paramètres définissant le projet, une solution informatique n'étant valable que pour un contexte donné. Il a donc semblé utile de la restituer dans le contexte plus général de la gestion du projet.

Un catalogue collectif, des catalogues collectifs

La notion en elle-même paraît simple et sans ambiguïté, mais en fait il n'existe pas un modèle unique de catalogue collectif, et c'est en grande partie là que réside la difficulté. Plusieurs paramètres interviennent pour différencier les modèles. Sans aller jusqu’à une typologie très rigoureuse, on peut distinguer au moins trois facteurs clés.

Les types de documents tout d'abord : les problèmes de gestion ne sont pas les mêmes selon que l'on traite des périodiques, des fonds anciens ou des documents iconographiques. Rythmes de mise à jour, contraintes techniques vont varier fortement d'un cas à l'autre. Les implications sont aussi d'ordre bibliothéconomique. Le cas le plus évident est celui du livre ancien, mais on peut aussi évoquer à titre d'exemple celui, moins connu, du livre d'artiste : on peut douter qu'une information bibliographique comme « cylindre en plâtre, 25 cm » donne une idée précise du livre. Seule une image, si possible en trois dimensions, pourra donner au lecteur une représentation visuelle d'un objet qui tient autant de l'œuvre d'art que du livre.

Le champ couvert ensuite. Les pôles associés à la Bibliothèque nationale de France (BnF) ont fait émerger la notion de pôles d'excellence, sans toutefois déboucher sur des réalisations de catalogues spécifiques en dehors du catalogue collectif de France (CCF). Les catalogues collectifs thématiques sont donc assez rares, mais ils pourraient se multiplier car ils répondent tout à la fois à un besoin du public et à une possibilité de marquer une identité régionale ou locale. Citons par exemple le projet de catalogue des fonds touchant à la préhistoire dans la vallée de la Vézère, qui fait l'objet d'un contrat de plan État-Région-Département.

La portée géographique enfin. Les projets nationaux, régionaux ou locaux ne se gèrent pas de la même façon. A l'heure actuelle, il semble que la région soit un excellent niveau pour mettre en place un repérage précis des collections, notamment celles qui se trouvent dans les petites et moyennes bibliothèques. L’échelon régional permet également d'ouvrir la coopération à d'autres établissements : archives municipales ou départementales, qui peuvent avoir de beaux fonds anciens ; musées, qui constituent souvent des fonds thématiques sur les spécificités régionales ; voire, mais plutôt en phase d'élargissement du projet, congrégations religieuses, etc.

A la faveur des informatisations/réinformatisations de bibliothèques municipales, on voit aussi apparaître des catalogues référençant les ressources documentaires locales : ville ou réseau de ville (communauté urbaine, Syndicat intercommunal à vocation multiple – SIVOM...). S'adressant à un public de proximité, ils sont souvent plus orientés OPAC – catalogue accessible en ligne – et pas nécessairement axés sur les documents patrimoniaux. Les fonctions du catalogue sont en effet différentes selon les projets.

Fonctions et fonctionnalités

Les fonctions principales d'un catalogue collectif sont à l'évidence l'identification et la localisation. Mais il peut aussi servir à la dérivation de notices, ce qui permet aux petites bibliothèques de reprendre leurs fichiers manuels. Il peut, enfin, comporter des fonctionnalités de commande et de facturation des copies des documents primaires...

C'est sur la fonction d'identification que porte la majorité des options à prendre. Les responsables du projet devront en effet trancher sur plusieurs points et d'abord ceux concernant les données :

– quel est le niveau de description bibliographique, à savoir : quelles sont les informations qui doivent absolument figurer sur une notice pour que celle-ci soit recevable pour le catalogue ? La notice peut être des plus succinctes, puisque, par exemple, dans le cadre des conversions rétrospectives BnF, seules les zones titres et dates devaient impérativement être remplies ;

– quelle position prendre par rapport au dédoublonnage ? L'utilisateur qui fait une recherche ne doit-il impérativement voir qu'une seule notice avec toutes ses localisations, ou accepte- t-on qu'à l'écran apparaissent les n références correspondant aux n localisations du document dans les bibliothèques du réseau ?

– comment traiter la cohérence des points d'accès et les autorités ? Faut-il revoir les indexations, toutes les indexations (auteurs, matière…), et si oui, comment ?

– les données relatives à la disponibilité des documents (ouvrage immobilisé en reliure, emprunté...) doivent-elles être consultables ?

– et, last but not least, complète-t-on les données bibliographiques par des images ou des extraits du document ?

De ces choix peut découler la nécessité d'effectuer des travaux préparatoires : conversion de fichiers, reprise des autorités (c'est par exemple l'option prise par la bibliothèque municipale à vocation régionale – BMVR – de Rennes pour les autorités auteurs du catalogue collectif des ouvrages de Bretagne).

Apporter des réponses à ces questions n'est pas toujours facile. D'abord parce qu'il faut souvent faire un compromis entre opportunité et faisabilité, entre ce que l'on voudrait faire et ce que l'on peut objectivement faire, ensuite parce que les décisions ne peuvent être prises qu'en parfaite connaissance des implications sur le plan organisationnel et technique. Or, souvent, les bibliothécaires sont démunis sur ce point faute d'expériences similaires.

Production et diffusion du catalogue

Pour maîtriser la problématique de catalogue collectif, il faut bien faire la distinction entre les fonctions de production et de diffusion de la base. Leurs mises en œuvre relèvent de logiques techniques et organisationnelles différentes et elles sont donc à déconnecter, au moins en termes d’analyse préalable. Comme le montrent les quelques exemples qui suivent, les solutions doivent être trouvées par rapport au contexte, aux opportunités et aux contraintes propres à chaque cas de figure.

Premier exemple, celui de la Basse-Normandie, qui est l’une des régions les plus avancées dans le domaine. Dès 1991, le projet a été lancé par Corail, l’agence de coopération régionale, et pris en charge par le Centre régional des lettres (CRL), nouvelle structure de coopération. Une étude préalable a permis d’élaborer des scénarios de réalisation qui ont été soumis au conseil régional et à la Direction régionale des affaires culturelles (DRAC) : l’objectif était de produire un catalogue des fonds anciens et des fonds locaux ; il était à constituer à partir des conversions rétrospectives espérées de la BnF (ultérieurement complétées par celles financées par les collectivités locales) et d’un catalogue collectif des fonds locaux sur microfiche à remettre à jour. Le support de diffusion retenu était le cédérom (à l’époque, la France ignorait tout d’Internet et cédérom s’écrivait encore CD-ROM...).

Deux options, elles-mêmes déclinées en plusieurs scénarios, ont été présentées, chacune d'elle s'appuyant sur une enveloppe financière et un calendrier de production précis. Les administrateurs de Corail ont validé le projet, sous réserve d’une réalisation d'une partie des travaux de constitution de la base par Corail, ce qui impliquait pour l’agence de coopération l’embauche d’opératrices de saisie et l’acquisition d’un système de gestion de la base bibliographique.

Où en est le projet, quelques années plus tard ? La première version du cédérom est sortie 1. Elle permet l’identification et la localisation des fonds, ainsi que, pour les bibliothécaires, la dérivation de notices.

En 1999, de nouvelles bibliothèques adhèrent au projet, et la possibilité de diffuser le catalogue collectif actualisé sur Internet est sérieusement envisagée.

En outre, le catalogue collectif devrait constituer le point de départ d’un projet plus vaste de bibliothèque virtuelle intégrant des images numériques des fonds patrimoniaux des bibliothèques de la région. Le support de diffusion sera cette fois Internet. En fait, les réflexions actuelles portent plutôt sur la manière de constituer un cadre général (organisation, partage des moyens, choix techniques...) pour les projets de numérisation des documents, ce qui est sensiblement plus complexe.

L’exemple de CLLR, l’agence de coopération pour le livre en Languedoc-Roussillon, se situe à l’opposé. La contrainte était, dans ce cas, de concrétiser très vite, fût-ce à travers une maquette, un projet qui, sans cela, ne trouverait pas de financement. Par ailleurs, il était clair que l’agence de coopération ne disposerait pas des moyens lui permettant d’effectuer un travail bibliographique en profondeur. Les solutions devaient donc générer le moins de charges de travail possible ; schématiquement, les options prises furent donc :

– la récupération de notices déjà informatisées ;

– pas de retraitement des notices ou des autorités ;

– une juxtaposition de bases sans travail de dédoublonnage ;

– la sous-traitance de la diffusion (hébergement de la base par le CNUSC – Centre national universitaire sud de calcul – de Montpellier).

Quelques mois plus tard, le catalogue était effectivement consultable sur Internet 2, et CLLR avait gagné son pari, même si beaucoup restait à faire, puisque seule une fraction des bibliothèques de la Région étaient représentées.

Ces deux exemples montrent, outre l’importance du contexte institutionnel et son poids sur les choix techniques, l'ampleur des différences entre les solutions en termes de constitution de la base (fonction de production) et de diffusion du catalogue. Si la fonction de diffusion est impérative (sans elle le catalogue n’a pas de raison d’être), la fonction de production peut être complètement évacuée... mais, dans ce cas, au final, il ne s’agira pas des mêmes catalogues collectifs.

Les autres réalisations (comme le catalogue Rhône-Alpes réalisé par Arald et la bibliothèque municipale (BM) de Lyon ou celui de Bourgogne mené par Abidoc et la BM de Dijon) ou projets (le catalogue de Bretagne construit par la BM de Rennes, celui de Champagne-Ardenne élaboré par Interbibly et les BMVR de la Région) constituent des variantes et mettent en évidence l'importance de la définition préalable du projet.

La démarche de définition du projet

La diversité des contextes et options pouvant être prises impose une démarche progressive qui repose généralement sur un découpage classique en trois phases :

– une première étape d’étude préalable qui permet de dresser un bilan de l’existant – état des collections et des catalogues, ressources sur le plan matériel, relais possibles, position des financeurs, etc. – et de statuer sur l’opportunité du projet ; elle n’aborde en principe pas sa faisabilité, sauf si l’on arrive à la conclusion qu’il n’est pas réaliste de se lancer dans un projet de cette envergure en l’état actuel de la situation (absence de volonté de coopérer, poids des traitements préalables d’inventaire ou de catalogage…). Cette première étape permet également d'évaluer les possibilités d'action des intervenants possibles : agence de coopération et/ou bibliothèque pilote (cela peut entrer dans les missions d'une BMVR) et bibliothèques « coopérantes » ;

– une phase d’élaboration de scénarios analysant les différentes solutions tant sur le plan organisationnel que technique : caractéristiques, avantages, limites, coûts, facteurs de risque... Même si certains choix sont souvent implicites – diffusion sur Internet par exemple –, l’analyse des solutions techniques ne doit être abordée qu’à partir de la deuxième phase. Et ce d’autant plus que faire le choix d’une diffusion sur Internet n’équivaut pas à faire le choix d’une solution technique ;

– la dernière phase permet de développer le scénario retenu et de construire ce que l’on appelle le plan de mise en œuvre : actions à mener, enchaînements, intervenants...

Ajoutons qu'une des règles de base veut qu'en cas de recours à une société de conseil pour une assistance technique ou méthodologique, on n’implique absolument pas une société susceptible d'assurer des prestations informatiques ultérieures (développement d’un antéserveur ou de fonctionnalités spécifiques) : en phase d’étude, ne doivent intervenir que des prestataires indépendants de toute solution technique. En outre, une autre règle de base, sur le plan purement technique cette fois, est de préférer systématiquement les solutions standard (progiciels), qui, sauf exception, existent, aux développements spécifiques.

A la suite de la phase de définition du projet, l'un des points cruciaux sur le plan méthodologique est la rédaction du ou des cahier(s) des charges. Il peut porter sur l'acquisition d'un système ou sur des prestations de service. Il est essentiel à double titre : d'abord parce qu'il permet de faire le choix du meilleur fournisseur possible (ou, du moins, il le facilite) et ensuite parce qu'il définit la base de la relation contractuelle avec ce fournisseur.

Ces règles sont très générales et doivent être affinées en fonction des caractéristiques particulières à chaque projet. Mais leur application permet d'éviter certains pièges et de prendre des décisions en fonction des avantages et des limites des différentes options possibles. Pris en connaissance de cause, les choix intègrent notamment la gestion des risques propres à la solution technique retenue.

Les solutions techniques

Le problème du choix d'une solution technique est donc, rappelons-le, toujours second par rapport à la définition du catalogue collectif et il découle largement des options prises au préalable. Cette réserve étant faite, on peut aborder d'une manière générale, c’est-à-dire déconnectée d'un cas concret, les solutions actuellement disponibles. Schématiquement, on peut établir une typologie articulée sur la différenciation entre les solutions dynamiques et les solutions non dynamiques (cf. figure 1).

Les solutions dynamiques

Les solutions dynamiques donnent accès à la base assurant la gestion des données en temps réel, c'est-à-dire que l'utilisateur pourra consulter toutes les notices bibliographiques, y compris celles qui viennent d'être incorporées, plus les données d'exemplaire, y compris la disponibilité du document.

Pour les interrogations via Internet, le serveur Web de système de gestion de bibliothèque ou du système documentaire joue le rôle d’interface entre le poste client de l’utilisateur qui s’appuie sur les langages de description de page et les protocoles du Web – HTML (HyperText Markup Language) et HTTP (HyperText Transfer Protocol) – et le système qui, lui, ne repose pas sur ces protocoles. Comme le montre la figure 2, le serveur transcrit donc les requêtes HTML dans une codification compréhensible pour le système et réciproquement en sens inverse, du système vers le poste client.

Les solutions de type antéserveur existent depuis longtemps. Les antéserveurs sont utilisés pour constituer des catalogues collectifs à partir de bases existantes et sans fusion de celles-ci : il s’agit en fait d’une couche logicielle qui vient s’implémenter en amont des systèmes de gestion (d’où son nom d’antéserveur) et qui joue le rôle d’interface entre le poste client et les systèmes de gestion pour assurer l’homogénéisation des requêtes. L’antéserveur s’intéresse aux correspondances entre champs d’information. Imaginons une recherche portant sur le champ auteur ; l’antéserveur reconnaîtra les étiquettes des champs auteur de toutes les bases du catalogue collectif et transcrira la requête en fonction de ces différents formats.

L’idée est séduisante : l’antéserveur permet de réaliser des catalogues collectifs sans duplication ni mise en commun des données. Il reste néanmoins un développement spécifique avec tous les risques que cela comporte : problèmes de pérennité de la maintenance, coûts de développements potentiellement élevés, maîtrise limitée du programme et de ses performances, notamment au niveau des temps de réponse… Il peut être indiqué si le catalogue ne concerne que peu de bases. Mais plus le nombre de bases gérées par des systèmes différents est important, plus les risques de dégradation des temps de réponse sont élevés et plus, mécaniquement, les coûts augmentent. Le cahier des charges à réaliser pour le développement doit donc être extrêmement rigoureux si l’on veut garder la maîtrise du calendrier et du budget du projet.

Remarquons qu'un serveur Web/ Z 239.50 assure des fonctions d’antéserveur dans la mesure où il constitue une norme simplifiée de réalisation d'un antéserveur. Il évite alors les développements spécifiques. Mais il faut que le système de gestion des bibliothèques (SGB) ou des centres de documentation qui participent au catalogue ait adopté cette norme dont l'implémentation est lourde. Ce n'est pas le cas pour tous les systèmes de gestion de bibliothèque et encore moins pour les systèmes de gestion documentaire. Pour le moment, les applications concrètes de bout en bout sont rares et on ne dispose que de peu de recul pour leur validation technique.

Les solutions non dynamiques

Dans les solutions non dynamiques – cédérom et copie de base pour une diffusion Internet –, la base ne comprend ni les données postérieures à la dernière mise à jour ni les informations sur la disponibilité. Si elles paraissent moins séduisantes, ces solutions restent au minimum valables pour les fonds figés, sans accroissement, ou les fonds anciens qui, sauf exception, évoluent peu et peuvent se satisfaire de mises à jour peu fréquentes. De plus, par rapport aux solutions dynamiques, elles présentent des avantages évidents sur le plan de la sécurité informatique.

On ne présente plus le cédérom. Il ne bénéficie plus de l'aura « nouvelles technologies », mais garde son intérêt dans certaines situations.

L'hébergement de base pour une diffusion sur Internet est moins connu. Il repose sur le principe d'une sous-traitance de la diffusion de la base, voire, le cas échéant, de certains traitements (dédoublonnage...). L'une des difficultés est de trouver un prestataire qui maîtrise l'information bibliographique... : les agences de coopération qui ont exploré cette voie se sont rendu compte que les fournisseurs sous-estimaient complètement les spécificités de ces bases. Là encore le cahier des charges est déterminant si l'on veut éviter de se tromper de prestataire.

Les hébergeurs doivent au minimum pouvoir gérer les formats MARC. Mais ils n'optent pas nécessairement pour un logiciel de gestion de bibliothèque classique, leur préférence pouvant aller à des logiciels documentaires sensiblement plus orientés recherche que gestion stricto sensu (cf. fonctionnalités dans le schéma page suivante)

Signalons enfin que les coûts comportent au moins deux composantes : l'hébergement à proprement parler et les charges de travail liées aux mises à jour. Plus fréquentes seront les actualisations du catalogue, plus importantes seront les charges financières de fonctionnement.

L'apport des logiciels documentaires

L'analyse fonctionnelle du système est fortement liée à la nature et aux caractéristiques du projet. Il n'est donc question ici que d'en donner une approche générale et de mettre l'accent sur une catégorie de logiciels peu présents dans les bibliothèques. Dans le cadre d'un catalogue collectif, les besoins fonctionnels peuvent être caractérisés comme dans le schéma ci-dessus.

On a vu précédemment que les fonctions de production de la base et celle de diffusion pouvaient être complètement déconnectées. Or, si la fonction de production d’un catalogue nécessitant des travaux préparatoires importants relève bien d’un système de gestion de bibliothèques (SGB), rien n’interdit d’envisager un autre type de logiciel pour sa diffusion. En effet dans ce cadre, ce sont essentiellement les fonctionnalités de recherche qui priment.

Un précédent article paru dans le BBF 3 présentait l’état actuel de l’offre des serveurs Web des SGB. Les deux tableaux des pages suivantes présentent celle des logiciels documentaires 4. On y retrouve des logiciels connus des bibliothécaires comme Texto ou Alexandrie. Tous sont à même d’importer et de gérer des notices au format Unimarc (souvent réduit mais généralement suffisant pour les projets de catalogue collectif). Issus du monde documentaire, ils disposent pour la plupart de fonctionnalités de recherche très riches. Les plus avancés ont intégré des possibilités similaires à celles des moteurs d’Internet. Ces fonctions trouvent tout leur intérêt dans des recherches en texte intégral, ce qui ne constitue pas une priorité pour les projets axés sur le pur bibliographique. Mais il a paru utile de les présenter, d'une part pour anticiper les évolutions probables sur ce plan et d'autre part parce que les hébergeurs ont pu avoir fait le choix de ce type de logiciel plutôt que d’un SGB (à titre d’exemple, le CNUSC dispose de Basis+).

Conclusion

On le voit, la problématique des catalogues collectifs est loin d'être simple et ne se limite pas aux éléments techniques. Mais ces catalogues correspondent à un besoin, les fonds demandent à être valorisés et les organismes ayant vocation à piloter les projets – BMVR, agences de coopération, voire bibliothèques départementales de prêt, selon les cas –, existent. Tout concourt donc à favoriser l'émergence des catalogues collectifs dans les années à venir. Et ce d'autant qu'il peuvent être le point d'intersection d'autres projets à dimension régionale : inventaires des fonds patrimoniaux, conversions rétrospectives...

Et l'une des questions qui se posera à terme, sera d'ailleurs celle de leur articulation avec les projets de numérisation qui risquent de fleurir ici ou là en dehors de tout plan global de traitement des documents primaires. Le catalogue collectif pourrait constituer l'un des cadres de référence permettant de coordonner les efforts de valorisation des collections patrimoniales.

Avril 1999

Illustration
Figure 1. Solutions techniques

Illustration
Figure 2. L'apport des logiciels documentaires

Illustration
Glossaire

Illustration
Les besoins fonctionnels pour un catalogue collectif

Illustration
Fonctions de recherche de base du serveur Web

Illustration
Fonctions de recherche avancées du serveur Web

  1. (retour)↑  Livres anciens et documentation régionale en Basse-Normandie : catalogue collectif des ouvrages conservés dans les bibliothèques, réalisé par le Centre régional des lettres de Basse-Normandie, 1997.
  2. (retour)↑  http://cllr.cnusc.fr
  3. (retour)↑  Marc Maisonneuve, « Bien choisir son serveur Web », Bulletin des bibliothèques de France, 1998, t. 43, n° 6, p. 34-39.
  4. (retour)↑  Diffuser la documentation via intranet et Internet : description des serveurs Web associés aux systèmes de gestion documentaire et de bibliothèque, TOSCA Consultants ; [rééd.] par Michèle Lénart, Nadia Bony, Marc Maisonneuve, Paris, ADBS Éditions, 1998.