Google Livres et le futur des bibliothèques numériques

par Hervé Le Crosnier

Alain Jacquesson

Paris, Éd. du Cercle de la librairie, 2010, 223 p., 24 cm
Coll. Bibliothèques
ISBN 978-2-7654-0980-9 : 36 €

« Qui aurait pu penser avant le 14 décembre 2004 que le futur des bibliothèques ne pourrait éviter de passer par le 1545 Charleston Road à Mountain View ? » (p. 165). C’est pour nous guider pas à pas dans la construction des bibliothèques numériques et des multiples avatars du livre numérisé qu’Alain Jacquesson a écrit ce livre très complet, informé et précis. Le fil conducteur en est le géant du web, parce que « Google Livres est un projet qui a été conçu dès le départ sur un mode industriel » (p. 194). Il ne se contente pas de décrire le projet de Google, mais fait un tour d’horizon de la situation des bibliothèques numériques, des controverses allumées par ce projet, des diverses forces et faiblesses des programmes en cours.

La stratégie Google

Tous les bibliothécaires connaissent le projet de Google de numériser les fonds des principales bibliothèques du monde et se souviennent des polémiques, initiées en décembre 2004 par Jean-Noël Jeanneney, puis relancées en 2009, suite au choix de la bibliothèque municipale de Lyon d’intégrer le projet Google Livres et aux hésitations de la BnF. Cet ouvrage va largement au-delà de l’écume des choses, et pose en chemin des jalons pour réfléchir à la place du livre et des bibliothèques dans le grand chantier de la numérisation du savoir.

Dans une première partie, nous suivons pas à pas la démarche de Google pour convaincre les premières bibliothèques de se joindre à son projet. Nous avons l’impression de suivre les négociateurs de Google et leur culte du secret dans les bibliothèques du Michigan, de Stanford ou de Harvard, sans parler du témoignage de première main de Hubert Villard, directeur de la Bibliothèque cantonale et universitaire de Lausanne (Suisse).

Les métadonnées, les droits d’auteur et l’économie du livre

Chemin faisant, l’auteur nous introduit aux méthodes du moteur de recherche de Google, aux techniques de numérisation et d’océrisation. Suit un descriptif des usages possibles de Google Livres, montrant les avantages de son interface, mais aussi les limites des descriptions catalographiques des documents, voire les copies abîmées.

Mais le plus intéressant porte sur trois aspects largement développés : les controverses autour du projet de Google ; le subtil passage de Google entre les divers métiers de la chaîne du livre, tissant des alliances avec OCLC (Online Computer Library Center) sur le versant des bibliothèques et devenant par ailleurs un libraire majeur pour le livre numérique du domaine public ; et enfin un panorama complet des autres projets de bibliothèques numériques, soulignant la diversité des approches et finalement l’existence de nombreuses solutions pour contrer le monopole de Google.

Chacun ici se souvient du soulèvement de Jean-Noël Jeanneney, alors président de la Bibliothèque nationale de France, à l’annonce du projet de Google, et des polémiques qui s’en sont suivies. Dans ce débat, la question du découpage du livre en pages a occupé une place très importante. Ce découpage revient à remplacer la structure séquentielle du livre comme support d’un savoir qui se construit dans l’argumentation par l’accès direct aux pages mentionnant tel ou tel terme, dispersant ainsi les raisonnements. La première approche nécessite une indexation et une classification fine des ouvrages, car la recherche passe alors principalement par les métadonnées. La seconde est utile à l’intérieur d’un ouvrage, remplaçant l’index, et pour le croisement de termes rares, convoquant des objets et non des idées, ou bien très spécifiques. C’est dans la recherche de termes dans un large corpus que Google excelle, alors que le travail des bibliothèques porte principalement sur la définition d’un contexte grâce aux métadonnées. Le catalogue Worldcat  * d’OCLC, nourri par les bibliothèques du monde entier, reste la référence pour le catalogage descriptif. Si bien qu’une alliance Google-OCLC prend un sens technique très fort… qui est cependant contrarié par l’approche commerciale de Google. Car, fort de millions d’ouvrages, dont une large partie appartient au domaine public, Google peut se lancer dans le secteur plus lucratif de l’édition de livres numériques, et dans leur vente, soit directe, soit par l’accrochage de publicités, couvrant ainsi les autres métiers de la chaîne du livre. Alain Jacquesson explique l’ensemble de ce processus, ses avantages comme ses effets sur l’économie du livre.

Cette construction monopolistique de Google Livres se focalise particulièrement autour de la question des droits d’auteur. Par sa stratégie de opt-out (un éditeur ou auteur mécontent peut retirer ses livres, par opposition à la règle opt-in qui demande un accord préalable), Google vampirise en réalité toute la production, y compris les « œuvres orphelines » (dont on ne peut aisément retrouver les auteurs). De multiples procès ont eu lieu, dans de nombreux pays. Aux États-Unis, un accord collectif a été trouvé entre Google, l’Association des éditeurs et la Guilde des auteurs. Celui-ci sanctionnait le pouvoir de Google, qui allait gérer l’identifiant unique des livres, et assumer son nouveau rôle économique en reversant les revenus de la publicité aux auteurs. Cet accord rendait finalement impossible toute concurrence, ce qui a conduit la Cour suprême à le réfuter. Tous les détails des procès et des enjeux figurent avec une grande précision dans le livre.

La place des bibliothèques

On a souvent souligné combien la concurrence dans la construction de bibliothèques numériques est une question géopolitique et linguistique. C’est pourquoi on suivra avec intérêt l’état de l’art des nombreux projets de bibliothèques numériques, avec leurs spécificités. En filigrane, dans cette étude des bibliothèques numériques majeures, se dessinent les objectifs et les méthodes qui devraient permettre à chaque bibliothèque d’apporter sa pierre à la numérisation raisonnée, contextualisée et documentée de l’ensemble des documents disponibles.

Un ouvrage indispensable pour tous les bibliothécaires qui veulent construire des bibliothèques numériques et réfléchir à la part respective du commerce, de l’industrialisation, de la responsabilité à long terme (préservation) et d’un accès diversifié (métadonnées et index de mots) aux connaissances qui gisent dans les livres.