Numérisation du patrimoine des bibliothèques et moteurs de recherche

Anne-Laure Brisac

La Bibliothèque nationale de France accueillait, le 7 décembre dernier, la première journée d’un cycle intitulé « Institutions culturelles et nouvelles formes de médiation ». Les deux premières journées portaient sur le thème « Numérisation du patrimoine des bibliothèques et moteurs de recherche ». Voici quelques points abordés le 7 décembre. Plusieurs idées fortes se sont dégagées au sujet des mutations concernant les droits autour des documents à numériser, ou des décisions à prendre selon l’accès à la connaissance que l’on veut favoriser. Les mutations économiques induisent aussi de nouveaux modèles à inventer qui mobilisent tous les métiers de la chaîne du livre.

En introduction, l’économiste et essayiste Yann Moulier-Boutang a analysé les enjeux soulevés par le numérique pour les industries culturelles et celle du livre en particulier : à la fois un élargissement de la lecture et de l’accès aux données culturelles, mais aussi une restriction des libertés et de l’usage que l’on peut faire de ces données, ainsi qu’une intrusion possible dans la vie privée.

Il a proposé quelques suggestions fondées sur la notion de « capitalisme cognitif » : un capitalisme qui ne s’appuierait pas sur la production de biens mais sur les valeurs ajoutées apportées aux productions de l’esprit, et dont Google est le modèle. Par exemple, la proposition de services gratuits (Gmail…) implique qu’en retour 16 millions d’internautes travaillent gratuitement pour Google en fournissant des informations en temps réel sur leurs goûts, leurs connaissances, etc. Ce modèle heurte le modèle classique de l’industrie qui repose, lui, sur la vente d’un bien ou d’un service.

Ainsi, Yann Moulier-Boutang suggère :

  • de ne pas durcir les droits de propriété mais d’adapter le droit aux nouveaux usages et non aux nouvelles productions ;
  • d’aller dans le sens de l’évolution technologique en immatérialisant davantage. Ainsi, le réseau de distribution matériel tombe ; le prix du livre aussi. La marge est minime mais l’offre de Google, qui propose 40 % de droits aux auteurs, va au-delà des 5 à 10 % proposés traditionnellement. Il faudrait élargir la notion de droits d’auteurs aux graphistes et illustrateurs, et trouver un système de forfait de téléchargement assisté ;
  • pour les bibliothèques, de suivre le modèle de Google et d’offrir une plateforme gratuite, de passer au web 2.0 pour savoir ce à quoi s’intéressent les internautes ;
  • de réfléchir à la question de l’archivage : il existe l’obligation publique de dépôt légal, mais pas pour le web, du moins pour l’instant. Il suggère ainsi d’aller plus loin que ce que propose la BnF.

La question des contenus

Quels publics ? Quels besoins ? Le problème du contenu et du support était abordé par l’historien Jean-Yves Mollier  1. Selon lui, on ne doit pas raisonner comme si Google avait déjà gagné… Il préconise ainsi de mener une politique de numérisation plus intelligente, par plusieurs biais : d’abord en mettant en réseau la BnF et les bibliothèques d’Europe ainsi que les autres bibliothèques du monde (voir le projet de bibliothèque mondiale de l’Unesco) ; et en classant les ouvrages par grandes familles de langues, pour dépasser les problèmes étatiques. Il estime aussi nécessaire que l’État renégocie avec Google et reprenne à son compte tout ce qui est numérisé pour le mettre à disposition dans le cadre d’Europeana  2.

Patrick Bazin, de la bibliothèque municipale de Lyon, conçoit, quant à lui, les bibliothèques d’aujourd’hui comme un « work in progress » (en développement). Car le numérique est avant tout une activité autour d’une interface. « La numérisation du livre est nécessaire pour donner accès aux livres mais aussi pour que les bibliothèques puissent devenir des acteurs de l’économie du numérique et surtout de la socialisation de la connaissance. » Il indique qu’il faut alors concevoir les bibliothécaires comme des accompagnateurs et les former en conséquence.

Michel Marian, philosophe, administrateur civil au ministère de l’Enseignement supérieur et de la Recherche, réfléchit en termes de priorités, quand il s’agit de la numérisation. Il s’agit selon lui, tout d’abord, de définir les critères de rareté des documents ; de faire un signalement des thèses et une numérisation à la demande ; de développer un accompagnement de la recherche. Sur ce dernier point, l’Agence nationale pour la recherche a mis en place le programme « Corpus » qui détermine et enrichit l’ensemble des sciences humaines et sociales, sur tous supports (son, texte, image)  3. Autre priorité avancée par le philosophe : tout ce qui concerne le patrimonial au sens large, c’est-à-dire les plateformes de textes (par exemple, la plateforme Persée)  4 en accès intégral, accompagnées de niveaux d’accès (clés, outils, tags, etc.).

Œuvres du domaine, orphelines, œuvres sous droit ?

Michèle Battisti a défini trois types de documents (œuvres du domaine, orphelines et sous droit) et les problèmes posés par les œuvres orphelines que Google ignore dans son entreprise de numérisation massive. S’en est suivie une discussion (vive !) entre Sandra Travers de Faultrier (de la Société des gens de lettres), Jean Martin (avocat), et Jean-Baptiste de Vathaire (de Cairn.info)  5, à propos des droits d’auteur à protéger et le désir de diffuser les idées.

De la discussion, il apparaît qu’il faut harmoniser les pratiques au niveau européen avec des outils comme Arrow  6 pour l’Europe ; mobiliser les politiques pour aboutir à un équilibre entre droits d’auteurs et intérêt du public ; accepter l’idée de solutions transitoires, d’un « work in progress », et être toujours vigilant  7.

Une nouvelle économie du livre ?

Plutôt que « du » livre, on pourrait d’ailleurs parler d’une nouvelle économie « des » livres. En effet, la transition vers le numérique est déjà effective pour les livres juridiques et les sciences humaines et sociales : c’est une économie qui fonctionne déjà. Est nouvelle, par contre, l’émergence d’une pratique différente de lecture dans le grand public.

Les intervenants ont ainsi rappelé tout ce qui avait changé. D’abord, l’idée de chaîne du livre devient inopérante. Il faut désormais parler de réseau. Les modalités de toutes les étapes de la conception et de la fabrication d’un livre sont modifiées, ainsi que l’a souligné François Gèze (Pdg des éditions La Découverte). Une veille technologique est en permanence nécessaire tant les outils évoluent vite (on est passé du eBook au ePub…). Par ailleurs, selon Denis Zwirm (Pdg de Numilog), différents modèles économiques sont possibles et coexistent facilement.

Sandra Travers de Faultrier indiquait que les auteurs commencent à s’habituer à ces nouvelles pratiques – voire, selon les disciplines, le sont déjà – et que, même si l’on perçoit un parfum d’inquiétude, il y a déjà beaucoup de dialogue avec les éditeurs.

On notera par ailleurs, en allant voir du côté des librairies, que certaines ont su compléter leur offre physique par du numérique. Il s’agit de fait de l’apprentissage d’un métier très différent pour les libraires.

Il a aussi été rappelé qu’il faut des infrastructures sophistiquées, des métadonnées précises, un stockage sécurisé des catalogues, afin notamment de rémunérer les ayants droit.

Le prix du livre numérique, taxé à 19,6% au lieu de 5,5 %, a enfin été évoqué : cette TVA pénalise l’auteur et l’éditeur. Les intervenants ont donc jugé nécessaire de soumettre le livre numérique à la loi Lang.

Le dernier débat, introduit par Hervé Le Crosnier (université de Caen), avait pour thème « Quels services ? Quelles médiations ? ». Les intervenants se sont interrogés sur la notion de bibliothèque numérique : « Mettre à disposition des volumes considérables de livres ou d’images suffit-il à constituer une bibliothèque numérique ? » Ils ont réfléchi aux différents services qui devraient être associés, à l’avenir, aux entrepôts numériques. Ils ont par ailleurs donné quelques pistes de réflexion autour des médiations à inventer selon les publics, notamment ceux qui restent mal à l’aise face à l’offre pléthorique du numérique.

Un dialogue entre Bruno Racine et Yann Moulier-Boutang a conclu la journée.