Stratégies de numérisation

Analyse comparative des programmes de la Bibliothèque nationale de France et de la Bibliothèque nationale du Québec

Véronique Poirier-Brèche

Les bibliothèques nationales ont un rôle important à jouer dans la constitution de collections numériques, car elles possèdent des réserves énormes à exploiter et à valoriser. Mais quel type de collection créer et quels contenus sélectionner ? Les programmes « pilotes » réalisés à la Bibliothèque nationale de France et à la Bibliothèque nationale du Québec au cours des années 1990 illustrent deux politiques de numérisation différentes.

National libraries have an important role to play in the setting up of digital collections, for they possess enormous reserves to exploit and develop. But what kind of collection should be created and what contents should be selected? The pilot programmes carried out at the Bibliothèque nationale de France and the Bibliothèque nationale du Québec during the 1990s illustrate two different digitisation policies.

Nationalbibliotheken spielen eine wichtige Rolle in der Erstellung digitaler Sammlungen da ihnen enorme Reserven zur Erschliessung und Aufwertung zur Verfügung stehen. Aber was für eine Art von Sammlung aufbauen, welche Inhalte auswählen? Die Pilotprogramme, die während der 90er Jahre an der französischen Nationalbibliothek und an der Nationalbibliothek von Québec durchgeführt worden sind, illustrieren zwei unterschiedliche Massnahmen die für die Digitalisierung getroffen wurden.

Las bibliotecas nacionales tienen un papel importante que jugar en la constitución de colecciones numéricas, ya que poseen reservas enormes que explotar y valorizar. ¿Pero qué tipo de colección crear y qué contenidos seleccionar? Los programas pilotos realizados en la Biblioteca Nacional de Francia y en la Biblioteca Nacional de Quebec, en el transcurso de los años 1990 ilustran dos políticas de numerización diferentes.

Les bibliothèques nationales ont un rôle important à jouer dans la constitution de collections numériques et la diffusion de documents numérisés, car elles possèdent d'énormes réservoirs à exploiter et à valoriser. La problématique réside dans le fait qu'il ne s'agit pas simplement de présenter des collections sur un autre type de support, mais de constituer un autre type de collection, en y apportant une valeur ajoutée par rapport aux collections physiques. Ce qui est possible dans la constitution de ces dernières semble en effet plus difficile à réaliser lorsqu'il s'agit de collections numériques, au vu principalement du coût et de contraintes multiples ; elles réclament de ce fait de nouvelles méthodologies de sélection.

Les programmes « pilotes », conçus et réalisés à la Bibliothèque nationale de France (BnF 1) et à la Bibliothèque nationale du Québec (BNQ) au cours des années 1990, se voulaient tous deux novateurs et à la pointe des nouvelles technologies. L'un comme l'autre sont nés d'une incitation politique et ont de ce fait bénéficié de crédits spécifiques dans le cadre d'un projet plus large, qu'il s'agisse de la création d'une nouvelle bibliothèque, sur un autre site : Tolbiac, à l'initiative du chef de l'État français, ou du projet de développement des autoroutes de l'information, soutenu par le gouvernement québécois. Ces deux cas seraient cependant peu comparables si l'on en considérait uniquement l'aspect quantitatif et financier : ils n'ont pas eu, en effet, la même ampleur, celui de la BnF ayant bénéficié d'un budget dix fois plus important (70 millions de francs) que celui de la BNQ (environ 7 millions de francs) et de délais plus longs. Si, en revanche, nous analysons ces deux programmes d'un point de vue qualitatif, au stade de leur conception, nous verrons en quoi leur comparaison peut éclairer la réflexion actuelle sur les politiques de numérisation en bibliothèque nationale 2

Deux politiques de numérisation

Le type de collection que l'on crée dans le cadre d'un programme de numérisation est tout d'abord lié, à la fois dans ses contenus et dans sa structuration, à la catégorie d'usagers visée. Dès le début, c'est donc sur les types de publics ciblés que les politiques de l'EPBF et de la BNQ se sont différenciées.

Les concepteurs du projet EPBF souhaitaient développer et promouvoir les accès en bibliothèque à l'intention du public intra muros, plutôt que les accès distants déjà en plein développement ailleurs. Au départ, leur objectif était donc de proposer la consultation des collections numérisées dans les salles de lecture ' en réseau avec les bibliothèques universitaires ' sur des stations de travail spécifiques qui seraient conçues à cet effet et s'appuieraient sur une technologie de pointe 3. L'idée d'offrir un service amélioré ainsi qu'une valeur ajoutée dans la recherche et la lecture de textes 4 s'adressait en priorité à un public de chercheurs. Le livre type à numériser devait donc être à la fois rare, très demandé, et adapté à une lecture approfondie.

La BNQ a choisi une option complètement différente, celle de proposer d'emblée ses collections numérisées à distance sur Internet, par l'intermédiaire de son site web, dont la réalisation faisait partie du même projet. C'est à tous les publics qu'elle destinait ses collections numérisées, en les annexant en tant qu'extensions à son catalogue multimédia en ligne ' la base Iris. Son programme était donc axé sur l'offre de services et centré sur le catalogue.

Ainsi, l'EPBF souhaitait-elle promouvoir une nouvelle forme de lecture (savante) à l'intention du chercheur, tandis que la BNQ visait pour sa part une optimisation des accès (web et catalogue) destinée à un public élargi.

La BNQ a donc décidé de numériser un échantillonnage (environ 5 %) représentatif du patrimoine culturel et populaire québécois. C'était un programme bâti sur la variété des supports, qui faisait une large place aux collections spéciales (iconographiques et sonores), et s'alimentait dans des fonds peu volumineux 5, selon une logique thématique évidente : le Québec. Dans le cas de la BNQ, la sélection des 'uvres était donc en complète corrélation avec le fonds physique.

L'objectif de l'EPBF, en revanche, était de constituer « un rassemblement intellectuellement cohérent de documents » 6 (jusqu'à 100 000 titres), un assemblage autonome mettant en commun des contenus dispersés entre plusieurs établissements ; ce recueil virtuel des 'uvres significatives, essentiellement livresques, de l'Antiquité à nos jours, ne se voulait pas une simple juxtaposition de documents numérisés, mais cherchait à établir un lien, une syntaxe entre les documents, à reconstruire un « univers documentaire qui facilite l'appropriation par le lecteur et la navigation dans les ressources » 7. Quant aux autres supports, ils faisaient l'objet de programmes autonomes 8 : les documents audiovisuels numérisés seraient consultables sur d'autres types de postes (postes audiovisuels, ou PAV).

Dans le premier cas, il s'agissait donc d'une collection numérique, rassemblée à partir des propres fonds de l'établissement, selon une politique de valorisation patrimoniale et visant à en élargir l'accès au grand public par l'intermédiaire d'Internet. Le second cas concernait une bibliothèque d'érudition, de type encyclopédique, constituée selon une logique intellectuelle, à partir de ressources partagées, et destinée à servir en priorité la recherche.

Paradoxalement, donc, l'offre de la BNQ ne portait que sur les fonds conservés dans l'établissement, mais s'élargissait d'emblée à un public hors les murs. À l'inverse, l'offre de l'EPBF dépassait les murs de la bibliothèque, mais était initialement destinée à une consultation sur place.

Deux logiques de constitution

Ces deux types de programmes ont impliqué, de par leur nature, des méthodologies de sélection différentes. Les critères théoriques de sélection des œuvres à numériser ont, dans les deux cas, été définis par des comités spécialement constitués pour l'occasion.

À la BNQ, ces critères étaient l'appartenance aux fonds et la relation avec le Québec. Des critères esthétiques, d'intérêt documentaire et éventuellement de rareté ou de fréquence de consultation étaient appliqués dans le cas des collections spéciales, et malgré le croisement de ces trois critères, certaines de ces collections ont pu être numérisées dans leur totalité. En ce qui concerne les livres, la sélection s'est faite à partir d'un seul ouvrage de référence : le Dictionnaire des œuvres littéraires du Québec 9.

À l'EPBF, de nombreux comités, faisant appel à différents experts et universitaires, se sont successivement penchés sur la composition des corpus d'auteurs. Le travail de sélection et de rassemblement, poursuivi par les responsables d'acquisitions, a pris plusieurs années. Le choix se faisait parmi l'intégralité de la production imprimée française, parfois étrangère ; c'était à la fois un travail de bibliographe, voire d'historien, lorsqu'il s'est agi de reconstituer des milieux littéraires, et enfin, un acte quasiment éditorial au moment de structurer les documents numérisés sur le serveur informatique au moyen d'accompagnements documentaires comme autant d'outils de lecture.

Les contraintes

Les divers facteurs qui doivent être pris en compte dans les décisions de sélection sont parfois difficiles à combiner ; en effet, des contraintes de tous ordres, financières, techniques, juridiques, pèsent sur les choix théoriques. Ainsi, ceux-ci entrent souvent en conflit avec les critères de disponibilité des supports physiques (état des documents anciens, présence dans les magasins, existence d'un support de substitution, documents récents soumis à droits, etc.).

Ce sont tout d'abord les contraintes financières qui déterminent certaines options à prendre notamment du point de vue matériel, organisationnel, logistique et technique. Le financement par le gouvernement, sur des crédits spécifiques et dans des délais limités, a souvent pour inconvénient un manque de souplesse. C'était particulièrement le cas du programme de l'EPBF qui a été complètement imposé de l'extérieur, dans ses objectifs et dans sa structure, à travers un cahier des charges extrêmement rigide, interdisant le plus souvent la rectification de certains objectifs par rapport aux réalités, au fur et à mesure de son déroulement. Dans la réalisation de son programme, la BNQ disposait de plus d'autonomie, mais, en revanche, d'un budget limitatif et de délais très courts, ce qui obligeait à réduire la réflexion sur la sélection et les besoins.

Les contraintes juridiques sont également déterminantes dans les choix. En France, les lois concernant la propriété et la protection intellectuelle sont plus restrictives qu'au Canada 10. Mais pour la BNQ en particulier, qui avait d'emblée pour objectif l'intégration de sa collection numérique sur son site web, il fallait penser au droit de représentation 11, au nombre d'utilisateurs qui pourraient se connecter simultanément, ainsi qu'à la qualité d'image que l'on souhaitait offrir sur le réseau : un taux de définition plus ou moins élevé déterminerait en effet le flux de données et les temps de réponse.

L'opération de numérisation de la BNQ, plus centrée sur les collections spéciales, a subi davantage de contraintes techniques propres aux supports de toutes natures.

Les options choisies

Face à ces contraintes, les deux établissements ont adopté des démarches différentes de sélection et de rassemblement des documents.

La BNQ, afin de limiter les coûts, a opté pour une réalisation en interne, donnant la priorité au critère de disponibilité des documents : on a puisé uniquement dans les collections physiques détenues par la bibliothèque, excluant d'emblée de la numérisation les documents qui ne répondaient pas aux critères physiques, techniques ou juridiques. On a écarté toute numérisation à partir de microformes (plus coûteuse), il n'y a pas eu de recours à des réservoirs extérieurs (pas de partenariat avec d'autres établissements et très peu d'achats en librairie). La quantité de documents numérisés s'en est trouvée réduite, mais le coût également.

Par ailleurs, il a été fait appel prioritairement aux compétences des personnels de la bibliothèque, évitant l'embauche de personnel supplémentaire et limitant au minimum le recours à des prestataires extérieurs et à tous types d'intermédiaires. Il n'y a pas eu d'achat de matériel et l'entreprise chargée de la numérisation a effectué ses clichés dans les murs de la bibliothèque, ce qui a évité ainsi des frais de transport des documents et des délais trop longs ; toute idée de « déreliage » des ouvrages a été écartée. La BNQ possédant un double exemplaire de ses documents (l'un de conservation, l'autre réservé à la communication, c'est ce dernier qui était prélevé pour la numérisation) ; c'était à la fois un avantage (ne pas endommager l'exemplaire de conservation) et une contrainte (priver momentanément les lecteurs de l'exemplaire de consultation).

L'EPBF, de son côté, disposait d'un budget et de délais bien plus importants, en rapport avec l'ambitieux programme qu'on lui avait confié : d'autres options ont donc pu être prises. L'établissement a manifestement souhaité donner aux critères intellectuels de sélection des ouvrages, concernant en particulier les éditions critiques récentes, la priorité sur les autres critères, notamment juridiques ; la bibliothèque numérique étant au départ uniquement destinée à la consultation sur place, les droits s'annonçaient moins difficiles à négocier.

Des personnels spécifiques (informaticiens, universitaires...) ont été embauchés, qui n'étaient qu'une partie des abondantes ressources humaines figurant dans le budget général de la nouvelle bibliothèque ; on a eu massivement recours à des réservoirs extérieurs ' partenariats avec d'autres institutions et achats d'ouvrages en librairie (41 % d'ouvrages acquis spécialement) destinés à être massicotés pour une numérisation plus facile ; l'utilisation importante de microformes (59 %), récupérées, achetées ou fabriquées ; en bref, une campagne de numérisation faisant appel à un grand nombre de ressources et de compétences situées hors de l'établissement.

Pour des raisons à la fois économiques, scientifiques et techniques, les deux bibliothèques ont opté pour un mode image majoritaire 12. Le mode texte a été essayé à titre de test à la BNQ sur une vingtaine de titres et utilisé uniquement pour les tables des matières à la BnF. Celle-ci a en outre récupéré en mode texte des documents numérisés provenant de bases extérieures, fournis par certains partenaires.

Mais c'est surtout le type de collection qui détermine les coûts : si l'on se réfère aux deux cas développés ci-dessus, il s'avère que la constitution d'une collection numérique à partir de fonds propres à l'établissement se révèle la moins coûteuse (moyennant des lacunes dues à des supports absents, fragiles ou non adaptés à la numérisation), car elle permet une réalisation « en interne ». Après une aide à l'investissement, son développement peut être financé par le budget de fonctionnement de la bibliothèque. En revanche, il semble évident que la constitution d'un corpus diachronique ou transdisciplinaire à objectif scientifique demande davantage de moyens (nécessité de nombreux partenariats, délais plus longs...). Ce type de programme cumule en outre les contraintes de conservation et aléas techniques attachés aux documents patrimoniaux et, lorsqu'il aborde l'époque contemporaine, est freiné par de gros problèmes de droits.

Bilan des deux expériences

Il est intéressant de noter que ces deux programmes de numérisation illustrent, à travers la manière dont l'offre documentaire a été sélectionnée et structurée et à travers le type de public auquel elle était destinée, deux façons de concevoir les missions d'une bibliothèque nationale. Tout d'abord, les deux établissements ont adopté, dans leur politique documentaire, des positions différentes : lors d'un colloque 13, au début des années 1990, Gérald Grunberg, un des acteurs du projet EPBF, prônait le retour à l'encyclopédisme : « L'extrême spécialisation des bibliothèques est une ère révolue. L'évolution sociale l'exige et la technologie le permet : toute bibliothèque digne de ce nom a désormais un rôle éducatif, documentaire et patrimonial. Cela implique une [...] ouverture à des disciplines diverses (tous les savoirs, tous les supports) [...]. » Le président-directeur-général (PDG) de la BNQ, durant ce même colloque, exprimait une opinion différente : « Traditionnellement, les grandes bibliothèques nationales ont poursuivi un idéal encyclopédique, maintenu jusqu'à la fin du XIXe siècle, et qui visait à constituer des collections anciennes et modernes sur tous les sujets du savoir universel. [...]. Mais, avec l'explosion documentaire et l'atomisation du savoir [...], les bibliothèques nationales doivent restreindre leur développement à la production nationale et être en mesure de fournir des ouvrages plus marginaux, plus rares. »

Par rapport aux publics, les deux programmes illustrent également des traditions différentes propres aux pays latins et anglo-saxons : l'aspect patrimonial, centré plus particulièrement sur les 'uvres livresques, réservées à une « élite » intellectuelle, est spécifique à la tradition française ; d'ailleurs, les dernières recommandations du Conseil supérieur des bibliothèques (CSB) reviennent d'une certaine manière sur l'idée d'ouverture de la BnF au grand public, qui figurait dans le décret du 3 janvier 1994 14 : « La mission centrale de dernier recours et de soutien à la recherche de la BnF, qui est irremplaçable, est une priorité parce que, et il faut le souligner avec force, les différentes missions des bibliothèques ne sont pas interchangeables » 15. Au contraire, les pays anglo-saxons, qui ont une pratique ancienne de circulation et d'échange de documents, et qui attachent moins de valeur intrinsèque à l'objet lui-même, semblent naturellement plus tournés vers l'offre de services. La politique documentaire menée par le PDG de la BNQ, et sa conception des missions d'une bibliothèque nationale sont conformes à cette tendance : « Il faut continuer dans le sens de la démocratisation culturelle. La clientèle des chercheurs devrait s'amenuiser au fur et à mesure que les bibliothèques universitaires et les bibliothèques spécialisées joueront véritablement leur rôle. » 16

Au-delà de ces positions de principe, le développement rapide d'Internet a donné, en une dizaine d'années, une nouvelle dimension aux collections numérisées des bibliothèques nationales, permettant de les ouvrir à distance au grand public. La BNQ, en accord avec sa volonté de démocratisation culturelle, avait conçu d'emblée, son programme pour le web 17 ; quant à la BnF, elle a pris en 1993 la décision d'offrir gratuitement sur Internet les documents libres de droits de sa bibliothèque numérique en créant Gallica 18 ; ce site accessible à tous a finalement pris le relais du projet initial destiné aux chercheurs intra muros.

Ainsi, la numérisation, tout en s'avérant un instrument efficace dans le développement des missions spécifiques de conservation et de diffusion de la production nationale qui sont traditionnellement dévolues aux bibliothèques nationales, devient aussi le moyen de concrétiser leurs nouvelles orientations 19 que sont le recours massif aux nouvelles technologies, la démocratisation des accès et la coopération internationale.

Août 2001

  1. (retour)↑  La BnF, résultat de la fusion entre la Bibliothèque nationale (BN) et l'Établissement public de la Bibliothèque de France (EPBF), n'a été créée qu'en 1994.
  2. (retour)↑  Cf. le mémoire d'étude de l'Enssib dont cet article est tiré : Véronique Poirier, Les enjeux de la sélection des contenus dans les programmes de numérisation des bibliothèques nationales : analyse comparative des expériences française et québécoise : BnF et BNQ, Villeurbanne, Enssib, 2000.
  3. (retour)↑  Les PLAO (postes de lecture assistée sur ordinateur), qui sont devenus ultérieurement des PABN (postes d'accès à la bibliothèque numérique).
  4. (retour)↑  Cf. Yannick Maignien et Jean-Didier Wagneur, « Numérisation et nouvelles pratiques de lecture », Bulletin d'informations de l'Association des bibliothécaires français, 1995, n° 167, p. 39-42.
  5. (retour)↑  Le dépôt légal n'est entré en vigueur qu'en 1968, un an après la création de la bibliothèque, et la production éditoriale courante est en rapport avec la population de la province (7 millions).
  6. (retour)↑  C'est la définition que Bertrand Calenge donne d'une collection. Cf. Conduire une politique documentaire, Paris, Éd. du Cercle de la librairie, 1999, coll. « Bibliothèques ».
  7. (retour)↑  Jean-Didier Wagneur, entretien du 20 décembre 1999. Référence au concept de la bibliothèque de Warburg : reconstituer l'environnement socioculturel des auteurs et de l'histoire des idées.
  8. (retour)↑  Cf. l'article de Catherine Éloi, « Les images fixes numérisées à la Bibliothèque nationale de France : constitution et traitement de la collection », BBF, 2001, t. 46, n° 5, p. 80-86 (Ndlr).
  9. (retour)↑  Maurice Lemire, Dictionnaire des 'uvres littéraires du Québec, Montréal, Fides, 1978-1981, 6 tomes.
  10. (retour)↑  La loi harmonisant le droit français avec les dispositions européennes, promulguée le 27 mars 1997, repousse le délai officiel à 70 ans après le décès de l'auteur pour les monographies et de 70 ans après la date de parution du fascicule pour les périodiques. Au Canada, la loi sur le droit d'auteur actuellement en vigueur stipule que « la durée du droit d'auteur subsiste pendant la vie de son auteur jusqu'à la fin de la cinquantième année suivant celle de son décès ». (Cf. M. Baribeau, Principes généraux de la Loi sur le droit d'auteur, Gouvernement du Québec, Les Publications du Québec, 1998).
  11. (retour)↑  La représentation est constituée de la communication au public des documents numérisés par écran interposé (Ndlr).
  12. (retour)↑  Le mode texte est largement plus coûteux que le mode image et, si ce dernier demande une capacité de mémoire jusqu'à huit fois plus élevée qu'en mode alphanumérique, il offre cependant l'avantage de reproduire la page telle quelle, en fac-similé, avec ses illustrations le cas échéant.
  13. (retour)↑  Extraits tirés des actes du colloque international des Vaux-de-Cernay, 25-26 juin 1991 ; Les grandes bibliothèques de l'avenir, Paris, La Documentation française, 1992.
  14. (retour)↑  Il était stipulé dans ce décret que l'une des nouvelles missions de la BnF était « d'assurer l'accès du plus grand nombre aux collections ».
  15. (retour)↑  Conseil supérieur des bibliothèques, Rapport pour les années 1998-1999, p. 48.
  16. (retour)↑  Philippe Sauvageau, « Les grandes bibliothèques : leur mission et leur insertion dans le paysage documentaire », Documentation et bibliothèques, juil.-sept. 1991, vol. 37, p. 95-98.
  17. (retour)↑  Site de la BNQ (créé en 1997) disponible sur le web : http://www2.biblinat.gouv.qc.ca
  18. (retour)↑  Ouvert en 1998, ce site http://gallica.bnf.fr offre depuis un an l'accès à tous les documents libres de droits de la bibliothèque numérique.
  19. (retour)↑  Cf. le décret du 3 janvier 1994 (cf. note 14).