L’avenir des livres, des bibliothèques de recherche et de l’édition intellectuelle

Spéculations d’un praticien

Michael A. Keller

La révolution numérique amène d’importants changements pour les livres, les bibliothèques, les éditeurs. Cet article, à partir des expériences et projets des bibliothèques de Stanford, propose des réflexions sur ces évolutions : pour le livre, de ces formes physiques traditionnelles à de nouveaux supports, mais aussi à de nouvelles formes de narration et de lecture ; pour les bibliothèques, à la refondation de ses missions traditionnelles dans l’environnement numérique, et à la mise en œuvre de nouvelles missions ; pour les éditeurs, la nécessaire adaptation à des modes d’édition changeants, mais aussi à des modes de commercialisation et de diffusion forcément différents. L’auteur conclut que la collecte, la conservation et la mise à disposition de collections sont et resteront de la responsabilité des bibliothèques.

The digital revolution has brought about significant changes for books, libraries, and publishers alike. The article draws on experiments and projects implemented at the Stanford university library network and explores some ideas about these developments – for books, the shift from paper to new media and to new forms of narration and reading; for libraries, the need to redefine their traditional remit in a digital environment and to come up with new projects; for publishers, the need to adapt to changing ways of publishing, selling, and distributing books. The author concludes that building and preserving collections and making them available will remain the fundamental duty of libraries.

Die digitale Revolution führt zu wichtigen Veränderungen für die Bücher, die Bibliotheken, die Verleger. Dieser Artikel unterbreitet ausgehend von Erfahrungen und Projekten der Bibliotheken von Stanford Überlegungen zu diesen Weiterentwicklungen: über das Buch, von seinen physischen traditionellen Formen hin zu neuen Informationsträgern, aber auch zu neuen Erzähl- und Leseformen, über die Bibliotheken, von der Wiedergründung ihrer traditionellen Aufgaben in einem digitalen Umfeld und den Einsatz neuer Aufgaben; über die Verleger, die nötige Anpassung an die sich verändernden Methoden des Verlegens, aber auch zwangsläufig andere Vermarktungs- und Verbreitungsmethoden. Der Autor schlussfolgert, dass die Sammlung, die Bewahrung und die Bereitstellung der Sammlungen in der Verantwortung der Bibliotheken liegen und liegen bleiben werden.

La revolución digital trae importantes cambios para los libros, las bibliotecas, los editores. Este artículo, a partir de experiencias y proyectos de las bibliotecas de Stanford propone reflexiones sobre estas evoluciones: para el libro, de estas formas físicas tradicionales a nuevos soportes, pero también a nuevas formas de narración y de lectura; para las bibliotecas, en la refundación de sus misiones tradicionales en el entorno digital, y en la ejecución de nuevas misiones; para los editores, la necesaria adaptación a modos de edición cambiantes, pero también a modos de comercialización y de difusión forzozamente diferentes. El autor concluye que la recolección, la conservación y la puesta a disposición de colecciones son y permanecerán bajo la responsabilidad de las bibliotecas.

« Multiplier les livres n’aurait pas de fin, et beaucoup d’étude est une fatigue pour la chair. » Si Qohelet, le sage par ailleurs inconnu qui écrivit vers l’an 500 avant Jésus-Christ l’Ecclésiaste, 21e livre de l’Ancien Testament, faisait il y a quelque 2 500 ans ce commentaire, quelle serait sa réaction face aux centaines de milliers de livres et aux innombrables autres écrits en tous genres publiés chaque année ? The Sources of Western Literacy porte en exergue : « Les livres sont un élément à part entière de l’histoire de l’humanité. Comme tout phénomène culturel important, le livre est un “one world concept” 1. »

Qu’est-ce qu’un livre, qu’est-ce qu’une bibliothèque ?

Chacune des valeurs culturelles que nous possédons aujourd’hui repose sur le travail des générations qui nous ont précédées. Nous avons été témoins ces dernières années de la diffusion sous forme électronique de documents auxquels l’impression donnait jadis la forme matérielle de livres, de journaux, de magazines, d’articles. Livres numériques, journaux et magazines électroniques, articles en ligne sont désormais d’usage courant. On peut les lire sur l’écran d’un ordinateur et, depuis peu, sur des liseuses et des tablettes, dans une mise en page et avec des polices identiques à peu de choses près à celles du format papier. Un livre est-il toujours un livre s’il n’est plus imprimé sur du papier ? On voit également se multiplier les projets de numérisation dont le plus ambitieux, qui allie Google à un grand nombre de bibliothèques nord-américaines et européennes de première importance, se propose de numériser d’énormes quantités de livres pour fournir sous forme numérique et mettre à disposition sur le web des notices ou, dans le cas de livres qui ne sont plus soumis au copyright, des textes. Des projets de numérisation plus petits naissent un peu partout dans les bibliothèques et les musées, autour d’œuvres d’art, de manuscrits antiques ou médiévaux, de papiers personnels, de fragments de papyrus, de cartes, de partitions, et de documents spécialisés et méconnus de nos collections.

Au cours des vingt dernières années, les informaticiens et les ingénieurs d’abord, et maintenant des chercheurs en sciences humaines et sociales, ont attendu que les bibliothécaires finissent de numériser leurs collections puis cèdent leur place. Car la question de la numérisation remet en cause la pertinence des bibliothèques et des archives dans un monde où la diffusion numérique des idées, des modèles et de l’information, sous forme de texte, de son, d’image fixe ou animée, se fait à l’échelle mondiale de façon relativement simple et à grande vitesse.

Une bibliothèque est-elle seulement un bâtiment abritant des collections de livres et d’autres objets physiques ? Ou est-ce une collection de livres, mais aussi d’autres outils de connaissance et d’information ? Quel avenir pour les bibliothèques face au développement du web qui représente, pour le commun des mortels, le bienveillant visage de l’internet, et face aux nouveaux usages qui en découlent ? Si tout ce que conservent les bibliothèques est, d’une manière ou d’une autre, numérisé et disponible sur le web, alors à quoi servent les bibliothèques ? Qui s’intéresse au contenu des bibliothèques numériques ? Quel est le rôle culturel des bibliothèques et des archives ? Quelles sont les missions des bibliothèques nationales qui, traditionnellement, ont collecté et conservé des manifestations le plus souvent écrites de la vie culturelle, sociale et politique de leur pays ?

Le besoin de communiquer et les bibliothèques

Le besoin humain de communiquer

Toute prédiction sur l’avenir des bibliothèques doit prendre en compte avant tout la tendance naturelle de l’être humain à communiquer, que ce soit par la parole, l’écriture, l’art sous ses diverses formes, les images (dans lesquelles on peut comprendre la peinture, les films, les dessins, l’art pariétal, mais aussi la sculpture ou l’architecture), la composition musicale, le théâtre et la danse. Cette communication humaine peut être éphémère et ponctuelle, ou elle peut être conçue pour traverser les âges. L’histoire de la communication entre les hommes, pour ce qu’on peut en comprendre, depuis ses origines, sur lesquelles nous disposons de peu de renseignements, jusqu’au présent, où au contraire la documentation de ses pratiques s’est faite compulsive, a montré que l’adoption des nouvelles possibilités d’expression est habituelle et même qu’il est nécessaire pour les artistes et les créateurs d’innover dans les techniques, la forme et le genre de la communication. On peut par conséquent considérer que les bibliothèques, et tout particulièrement les bibliothèques nationales, sont les gardiennes des traces de la communication humaine, afin de nous permettre de nous comprendre et de remettre en contexte nos activités d’un point de vue historique, religieux, social, entre autres.

L’avenir des bibliothèques

En ces temps de l’hypermédia, avec l’adoption (ou le rejet) de nouvelles techniques de communication, l’avenir des bibliothèques est, pour beaucoup, étroitement lié à celui des livres et de l’édition. La numérisation des livres, des journaux et des magazines anciens à des fins variées (meilleures description et analyse, conservation, partage, recherche, enseignement), et le renouvellement de ces documents originellement sous forme numérique peuvent sembler un bouleversement catastrophique des conventions, établies de longue date, de la communication écrite. Et, de fait, l’évolution rapide d’une culture numérique de la communication a imposé dans tous les types de bibliothèques d’importants changements dans les méthodes de sélection, d’acquisition, de description, d’interprétation et de conservation.

Les formats et les technologies ont beau se transformer, le rôle des bibliothèques de recherche n’a pas fondamentalement changé pour autant. Il ne dépend ni des documents, ni des formats, genres, techniques ou technologies. Ce rôle des bibliothèques de recherche, dont les bibliothèques nationales constituent un important sous-ensemble, reste en effet la collecte, la conservation et la mise à disposition, par-delà les siècles, de la production écrite, pilier de la communication humaine. Cette notion de production écrite inclut les diverses formes artistiques évoquées dans la première phrase de cet article. Elle englobe également les archives produites par les particuliers, les entreprises, les gouvernements et les groupes sociaux.

Mais cette présentation des missions des bibliothèques est encore trop simple, car on pourrait légitimement se demander si elles ont vraiment un rôle à jouer maintenant que de grandes sociétés utilisent internet comme outil de publication, pour mettre à disposition des outils de recherche, et pour une grande variété d’objectifs commerciaux. On pourrait se demander aussi comment les bibliothèques se sont adaptées à l’évolution des modes de communication et d’expression jusqu’à présent, et comment elles comptent le faire dans les années à venir.

Que deviennent les éditeurs dans ce scénario numérique ? Quelles sont les perspectives d’évolution pour les éditeurs de livres destinés aux intellectuels, de livres qui s’intéressent aux petites et aux grandes questions de notre temps, alors que la désintermédiation s’impose et que la distribution publique d’un texte devient grâce au web et aux traitements de texte que nous utilisons tous pour créer nos textes sur nos ordinateurs si facile et si banale ?

En Amérique et dans le monde entier, les journaux réduisent leurs effectifs, car leur nombre d’abonnés, et partant leurs revenus, diminuent. Cette situation constitue-t-elle un avertissement pour les autres types d’éditeurs ? Dans le dernier quart de siècle, la majorité des éditeurs universitaires ont constaté une baisse dramatique du nombre d’exemplaires vendus, en grande partie parce que les bibliothèques ont cessé d’acquérir systématiquement toute leur production. Qu’est-ce que cela présage ? Comment les éditeurs de livres peuvent-ils tirer profit du web, du numérique, et de leurs multiples possibilités ? Depuis une dizaine d’années, des ebooks sont proposés par de nombreux éditeurs et distributeurs via internet. Certains d’entre eux permettent seulement une lecture en ligne, mais, depuis quelques années, beaucoup peuvent être téléchargés sur des liseuses ou des tablettes. Ces écrits sont-ils vraiment des livres ? Bien sûr, la plupart d’entre eux sont des copies numériques de livres physiques. Il faut aussi prendre en considération les projets de numérisation petits et grands. Les pages des livres numérisés disponibles sur Google Books   2, Amazon  3  et d’autres sites web sont-elles toujours des livres ? Il faut aussi examiner les nouvelles formes de récit, la fiction hypertextuelle, etc.

On répondra mieux à ces questions en catégorisant les situations, et ce faisant il serait sans doute possible d’y répondre avec plus de pertinence, même si ces développements ont des implications culturelles globales. Beaucoup d’entre nous pensent que la diversité et l’acceptation de la diversité sont en soi des forces, même dans le milieu raréfié des livres, des éditeurs, des bibliothèques.

Trois entités culturelles

Cet article a pour objet l’avenir de trois entités culturelles : l’une est un objet – le livre –, les deux autres sont des organisations présentant des missions culturelles – les bibliothèques et les éditeurs. Les spéculations sur ce sujet partent du principe qu’hommes et femmes de par le monde auront toujours l’envie et les moyens de s’exprimer par l’écrit, même s’il est probable que d’autres moyens d’expression comme le film, les images ou la musique, déjà faciles d’accès, connaîtront une utilisation croissante. De nos jours, la grande majorité des « écrivains » utilisent l’ordinateur. Le discours de réception de John Steinbeck à l’occasion de la réception du prix Nobel de littérature en 1962 exprime parfaitement le besoin que nous avons, nous humains, de communiquer par le biais de l’écrit :

« … I am impelled, not to speak like a grateful and apologetic mouse, but to roar like a lion out of pride in my profession and in the great and good men who have practiced it through the ages… Literature was not promulgated by a pale and emasculated critical priesthood singing their litanies in empty churches – nor is it a game for the cloistered elect, the tin-horn mendicants of low-calorie despair… Literature is as old as speech. It grew out of human need for it and it has not changed except to become more needed. The skalds, the bards, the writers are not separate and exclusive. From the beginning, their functions, their duties, their responsibilities have been decreed by our species 4 . »

De même, il faut croire et savoir que les lecteurs sont légion, mais que, si la plupart comprennent couramment leur langue maternelle, peu sont bons lecteurs dans d’autres langues. Les statistiques collectées par l’American Library Association montrent que plus de deux tiers des citoyens américains sont inscrits dans une bibliothèque de proximité, et que plus de la moitié d’entre eux utilisent leur carte de bibliothèque pour emprunter des livres.

De fait, dans les quarante dernières années, le pourcentage de citoyens américains titulaires d’une carte de bibliothèque s’est accru de 25 %, pour atteindre aujourd’hui 72 % d’inscrits. En revanche, une étude du National Endowment for the Arts met en évidence une baisse de 10 % du nombre des lecteurs d’œuvres littéraires entre 1982 et 2002, qui tombent de 57 % à environ 47 %. Pour autant, le nombre de ces lecteurs d’œuvres littéraires, ceux qui lisent des romans, des nouvelles, des pièces, de la poésie, s’établit tout de même à 96 millions environ. Cette étude met explicitement de côté les lecteurs d’œuvres de « non-fiction » de tous ordres. Elle indique par ailleurs que le nombre de personnes écrivant de la fiction augmente, passant de 11 millions à 14 millions environ.

Steve Jobs déclarait, au sujet de la liseuse Kindle de la société Amazon : « Que le produit soit bon ou mauvais n’a aucune importance, le fait est que les gens ne lisent plus. 40 % de la population américaine lit un livre ou moins par an. Le problème de fond est que les gens ne lisent plus  5 . » Il y a abondance de telles jérémiades pointant la mort de la lecture. Dans le même élan, certains analystes, comme Neil Postman dans son livre Se distraire à en mourir 6 , relient la mort de la lecture à la disparition de certaines façons de penser.

En d’autres temps, Goethe a parlé de la capacité de lecture profonde, de l’aptitude à lire entre les lignes : « Le lecteur sagace qui est capable de lire entre ces lignes ce qui n’y est pas écrit explicitement, mais qui y est néanmoins suggéré, pourra dégager une interprétation 7 . »

Francis Bacon met en évidence la sainte trinité de l’intelligentsia, celle des livres, des bibliothèques, des éditeurs. Il écrit : « Certains livres sont faits pour être goûtés, d’autres avalés, et quelques-uns mâchés et digérés ; c’est-à-dire que certains doivent être lus par extraits seulement, et d’autres de bout en bout, avec concentration et application. La lecture fait l’homme, la discussion l’homme préparé, et l’écriture l’homme exact 8 . »

Sans la moindre preuve, un écrivain contemporain, déplorant le sort fait aux lecteurs, se livre à des attaques aussi gratuites que mal informées à l’encontre des bibliothèques et des bibliothécaires. « La plupart des bibliothèques sont devenues des centres d’information, des bastions et des avant-postes du monde des sciences de l’information. Aujourd’hui, le bibliothécaire moyen, comme beaucoup d’autres personnes dans le champ des sciences humaines, est devenu hostile aux livres et à la lecture. Les technocrates attendent avec impatience le jour où il n’y aura plus besoin d’acquérir, de ranger, de réparer, de remplacer les livres, quand tout sera sur microfilm ou disponible sur internet   9. »

Les livres

Histoire de la forme physique des livres

Pour examiner l’avenir des livres, il peut être utile de s’intéresser à leur histoire, ou du moins à celle de leur forme physique. Dans le cahier joint se trouve la photographie de quatre tablettes cunéiformes, toutes issues des collections de Stanford (image 1). Est-ce là l’équivalent de quatre pages d’un livre publié aujourd’hui, 3 500 ans avant Jésus-Christ ?

Illustration
Image 1 • Quatre tablettes cunéiformes issues des collections de l’université de Stanford.

Et que dire de ce rouleau, le livre d’Esther, dans l’Ancien Testament ? (image 2). Quand nous nous référons aux livres de la Bible, la Bible à laquelle vous et moi pensons est un livre habituellement relié de noir, composé de milliers de pages imprimées sur papier bible. Ce rouleau contenant le livre d’Esther, une fois déroulé, peut-il être qualifié de « véritable » livre ? Il remplit indubitablement les fonctions d’un livre, puisqu’il est le support d’une narration sous forme linéaire ou sous forme de ruban, permettant une lecture continue du premier au dernier mot.

Illustration
Image 2 • Rouleau du livre d’Esther dans l’Ancien Testament.

Voici à présent les deux premières pages d’un missel fabriqué à Bologne vers 1360 (image 3). Ce codex prend la forme qui correspond dans notre imaginaire à un livre, depuis l’époque des manuscrits vers le Ier siècle après Jésus-Christ jusqu’à l’époque des livres imprimés, qui débute au milieu du XVe siècle avec la Bible imprimée à Mayence avec des caractères mobiles par Johannes Gutenberg. Avec ses magnifiques enluminures et ses illustrations, on pourrait considérer ce livre comme un hypermédia des premiers temps !

Illustration
Image 3 • Missel de Bologne, vers 1360.

L’illustration suivante provient d’une des premières pages du chapitre de la Genèse dans la magnifique Bible en traduction standard révisée, publiée en 2009 à San Francisco par Andrew Hoyim chez Arion Press (image 4). Ce livre mesure plus de 45 centimètres, et il est de toute évidence destiné à un usage privé plutôt que pour la liturgie chrétienne.

Illustration
Image 4 • Bible en traduction standard révisée, publiée en 2009 à San Francisco par Andrew Hoyim chez Arion Press.

L’image suivante (image 5), encore une page du chapitre de la Genèse de la Bible, cette fois-ci dans une édition King James de 1903, me permettra si vous le voulez bien d’aborder une question quelque peu polémique. Cette édition est disponible sur le site de Google Books. On peut en tourner les pages en utilisant des boutons virtuels, et lire sur son écran autant de pages qu’on le souhaite. Google Books offre aussi d’autres services, dont certains seront décrits plus bas, mais on peut notamment télécharger le livre sur son ordinateur, pour l’imprimer et pour le lire sous forme papier. N’est-ce pas là un livre ? Le fait d’indexer chaque mot de ce livre, et chaque mot dans chaque livre auquel Google Books donne accès implique-t-il que les mots, les phrases, les expressions ont été « atomisés » en simples mots qui, en eux-mêmes, ne signifient plus rien ?

Illustration
Image 5 • Bible dans l’édition King James de 1903.

Examinons à présent ces multiples éditions du livre Rue de la sardine de John Steinbeck. Dans l’image 6, le manuscrit original de Steinbeck ; dans l’image 7, la version dactylographiée envoyée à la composition ; et dans l’image 8, les épreuves avant correction et impression du livre publié en 1945 à New York par Viking Press. Steinbeck prit un copyright pour ce livre en 1937. Dans son esprit, ce roman était donc plus ou moins achevé presque huit ans avant qu’il ne soit mis à la disposition du public. Rue de la sardine n’était-il pas déjà un livre quand Steinbeck en composa de sa main le manuscrit ?

Illustration
Image 6 • Manuscrit original de Rue de la sardine (Cannery Row) de Steinbeck.

Illustration
Image 7 • Version dactylographiée de Rue de la sardine envoyée à la composition.

Illustration
Image 8 • Épreuves avant correction de Rue de la sardine.

Veuillez maintenant regarder cette image de l’écran d’une liseuse vendue en ce moment par Amazon aux États-Unis, le Kindle (voir l’image 9). La page est extraite du livre Freakonomics de Steven Levitt et Stephen Dubner  10 . Les Kindle, Nook et autres liseuses et tablettes ont dans certains contextes très facilement remplacé certains types de livres. Ces appareils utilisent l’encre électronique, c’est-à-dire qu’une source de lumière extérieure est nécessaire à la lecture. Ils ne gèrent pas la couleur ni les illustrations, ou alors avec des résultats très médiocres. Le Kindle permet au lecteur de placer des signets et même d’annoter les pages. À pleine charge, les batteries permettent de tourner 7 500 pages, soit l’équivalent d’environ 8 à 10 livres. Il est possible de régler la taille des polices pour faciliter la lecture pour les myopes. Et surtout, grand avantage pour le voyageur, ces appareils de lecture ont une énorme capacité ; une liseuse standard peut contenir 80 livres et, avec une carte-mémoire supplémentaire de deux giga-octets, on peut aller jusqu’à 300. Les livres sont en vente chez des distributeurs, Amazon ou autre. Les ebooks sont chargés dans l’appareil par un accès sans fil. Leur prix est d’environ la moitié ou les trois quarts de celui d’un « vrai » livre dans une librairie.

Illustration
Image 9 • Le Kindle d’Amazon.

Le nombre de titres en anglais disponibles sur liseuse est désormais très important. Dans les langues autres que l’anglais, il y a moins d’ebooks, mais leur nombre s’accroît lentement mais sûrement en allemand, en français, en italien, et en espagnol. Il y a aussi des livres disponibles en chinois, en japonais, en coréen, mais ils ne sont vendus que localement.

De nouvelles formes de narration et de lecture

Les limites techniques évoquées plus haut ne permettent pas vraiment d’utiliser ces outils pour lire des livres qui comportent des graphiques, des tableaux, et surtout des illustrations en couleurs. Ce serait un désastre que de lire sur une liseuse un ebook sur l’œuvre des Brueghel, mais regardez les images extraites de l’un de ces livres sur écran d’ordinateur (images 10 et 11). Elles sont plutôt bonnes, assez même pour étudier l’histoire de l’art. De nouveaux développements concernant d’autres types de livres sont donc à envisager. Nous avons évoqué précédemment le récit comme des « rubans » de texte, l’expression écrite d’une succession d’idées : cela correspond aux façons traditionnelles d’écrire, et de raconter des histoires. Steinbeck, dans son discours à l’académie Nobel, soulève également cette question. Cette conception de la narration se développe dans de grands cycles, écrits mais aussi musicaux, comme le Ring de Wagner, et dans les livres de certains auteurs qui mettent en scène les mêmes personnages et les mêmes cadres, comme les romans mettant en scène les guerres napoléoniennes au travers des personnages de Jonathan Aubrey et Stephen Maturin, ou les 20 volumes de Patrick O’Brian pour la série Les aventures de Jack Aubrey.

Illustration
Image 10 • Page de couverture du livre Inside Bruegel sur le site d’Amazon.

Illustration
Image 11 • Page intérieure du livre Inside Bruegel sur le site d’Amazon.

Récemment, quelques auteurs ont expérimenté de nouvelles formes de narration en tirant parti des technologies numériques. En substance, certains auteurs, et beaucoup d’universitaires, « brisent » la narration traditionnelle, purement textuelle et linéaire, par des sons, des films, des tableaux, des formules mathématiques, et même des modèles théoriques illustratifs, tout cela dans l’idée de proposer un récit plus riche, plus convaincant, plus fascinant, que s’il n’était basé que sur le texte.

On pourrait considérer que le « modèle chaud » de récit qui n’a recours qu’au texte, sur le modèle de Marshall McLuhan, demande de la part du lecteur une participation intellectuelle active pour que l’histoire prenne vie. Le bagage culturel du lecteur, son imagination, nourrissent et explicitent les allusions, les images, les formes, les fonctions décrites ou sous-entendues par l’auteur.

La narration multimédia, qui combine sur la base d’un récit écrit des éléments empruntés au théâtre, au cinéma, à l’opéra, au laboratoire, à l’atelier, au studio, à la calculatrice, à l’ordinateur, pourrait être qualifiée par une critique à la McLuhan de « froide », car elle demande, de la part du « lecteur », du public, moins d’imagination, moins de jeux intellectuels, pour comprendre l’histoire.

Dès lors, il n’est pas étonnant que les chercheurs et les étudiants qui, normalement, aspirent à la clarté d’expression, utilisent ces possibilités, notamment dans le domaine des sciences, où elles sont déjà très employées. Voici en quelques images des exemples illustrant la façon dont divers médias sont insérés dans des travaux universitaires, et comment, chez HighWire Press  11 , un service de publication sur internet géré par les bibliothèques de l’université de Stanford appelé « Toll Free Linking » améliore la lecture d’articles. Dans la revue de l’American College of Cardiology, l’article « Cardiovascular Imaging » (image 12) écrit par Moss et al. inclut plusieurs vidéoclips expliquant certains points (voir image 13). D’évidence, cet article ne peut être considéré comme complet que sous forme d’e-article, lu sur un ordinateur connecté au réseau. Les autres articles cités par les auteurs en note sont accessibles par les liens hypertextes (voir image 14). Dans l’article de Ionescu et al. dans la revue Heart publiée par le BMJ Publishing Group et la British Cardiac Society, on peut voir dans la colonne de droite plusieurs fonctions implémentées pour faciliter le travail des chercheurs (voir image 15). Cet article est cité dans l’article de Moss et al. évoqué précédemment, et quand on suit le lien vers cet article, on accède, outre à l’article de Ionescu lui-même, à d’autres citations de cet article dans d’autres revues (voir image 16). Ce service fournit donc une sorte d’historique des citations avec des liens actifs, comme une sorte de « halo » de textes connexes à l’article cité, mais aussi à l’article citant. Ce service de liens, proposé par HighWire Press, rend donc plus facile, plus efficace, la recherche de documentation pertinente par les chercheurs et les praticiens.

Illustration
Image 12 • Article « Cardiovascular Imaging » dans la revue de l’American College of Cardiology

Illustration
Image 13 • Liens vidéo dans l’article « Cardiovascular Imaging » dans la revue de l’American College of Cardiology

Illustration
Image 14 • Les autres articles cités par les auteurs en note sont accessibles par les liens hypertextes.

Illustration
Image 15 • Dans cet article de Ionescu et al. dans la revue Heart publiée par le BMJ Publishing Group et la British Cardiac Society, on peut voir dans la colonne de droite plusieurs fonctions implémentées pour faciliter le travail des chercheurs.

Illustration
Image 16 • D’autres citations de l’article ci-dessus dans d’autres revues.

Il est un autre genre nouveau qui fait usage de l’hypertextualité du web, en permettant aux « lecteurs » de passer de la narration à des sites ou à des textes explicatifs, à la définition de mots, à de courtes biographies de personnes, à des localisations sur des cartes, et même à des éléments de récit alternatifs. Cette dernière pratique est l’une des principales caractéristiques d’une nouvelle forme de fiction qualifiée de « fiction hypertextuelle ». Cette forme implique le lecteur dans la construction de l’histoire, et lui permet d’influencer divers aspects du récit proposé par l’auteur.

Certains de ces exemples visent à illustrer les différentes formes qu’a pu prendre l’écriture et qui, à travers les siècles, ont été matérialisées dans les livres. D’autres montrent que les formes physiques de l’écrit, dans les livres ou ailleurs, sont en train d’évoluer. Bien sûr, aucun d’entre nous ne sait plus lire l’écriture cunéiforme, pas plus que nous n’avons habituellement l’occasion de lire dans un codex manuscrit. La grande majorité des lecteurs, même là où l’accès à internet est suffisamment aisé, lisent encore des livres « réels », des volumes imprimés sur du papier et vendus par le libraire local, ou peut-être par un distributeur sur internet. Amazon a été le premier surpris lorsque sa liseuse Kindle a été épuisée quelques jours à peine après sa mise en vente. Malgré tout, par rapport au pourcentage de gens qui lisent des livres, que l’on peut estimer à 50 % des habitants des pays industrialisés, le nombre de lecteurs de ebooks est ridiculement faible, même pas 5 %. Dans toutes les communautés scientifiques américaines en revanche, et tout particulièrement dans les sciences dures, le pourcentage de lecteurs qui ne lisent AUCUN article en ligne est lui aussi très faible. Et, parmi l’élite de l’industrie informatique et de la communauté numérique de la Californie du Nord – les « digerati » –, lire des ebooks est maintenant beaucoup plus répandu que cela ne l’était ne serait-ce qu’il y a deux ans. Pour reprendre une devise à la mode en ce moment aux États-Unis : « Là où va la Californie, là va le pays. » Sur ce point comme sur bien d’autres avancées liées aux nouvelles technologies, l’adage est presque certainement vrai.

Les bibliothèques

Les services des bibliothèques

Si on s’intéresse maintenant au futur des bibliothèques, la métaphore d’une gamme de supports d’information et de services en expansion perpétuelle semble pertinente. Peu après la naissance du web, dans les années 1990, l’idée se répandit que les bibliothèques allaient devenir obsolètes, et, jusqu’à aujourd’hui, cette idée a ses défenseurs. La désintermédiation progresse, particulièrement dans le secteur commercial, entre les éditeurs et les lecteurs, entre les éditeurs et les libraires, mais beaucoup d’études montrent que les bibliothèques, comme lieux physiques et comme collections de livres, de manuscrits, d’archives matérielles, sont encore très utilisées par un grand nombre d’usagers. Il est pour autant vrai également que l’idée même de bibliothèque, comme celle de livre, doit s’étendre pour inclure aussi les collections et les services numériques. Une fois encore, l’éventail de supports s’élargit. On peut décrire ainsi les services que les bibliothécaires assurent, quel que soit le format ou le type du support d’information, papier ou numérique :

  • Ils sélectionnent les documents qui doivent être ajoutés aux collections et mis à disposition des usagers, des lecteurs. C’est la fonction de sélection et d’acquisition.
  • Ils donnent les moyens de prendre connaissance de ce qui figure dans les collections, que ce soit des livres sous forme physique ou sous forme numérique, des journaux électroniques, et le reste. C’est la fonction d’accès intellectuel aux collections.
  • Ils proposent des services d’information, notamment en répondant aux questions des utilisateurs, auxquels ils apprennent à utiliser les collections tout comme à trouver et utiliser l’information disponible dans ce chaos informationnel qu’est internet. C’est la fonction d’interprétation.
  • Ils diffusent les documents issus des collections de la bibliothèque, et ménagent l’accès aux ressources d’information numériques, dans ce dernier cas souvent sans que les usagers en aient véritablement conscience. C’est la fonction de diffusion.
  • Ils préservent les collections, en nettoyant, réparant, désacidifiant, reliant les livres, ou encore en maintenant des archives numériques et des répertoires institutionnels de documents numériques, même si, à la vérité, cette dernière fonction n’en est encore qu’à ses débuts. C’est la fonction de préservation.
  • Enfin, les bibliothécaires aident les lecteurs qui doivent obtenir, analyser, mettre en forme des informations numériques, en utilisant des outils et des méthodes adaptées à ces objectifs.

Toutes les bibliothèques ne proposent pas encore ces services, mais ils sont de plus en plus répandus dans les bibliothèques nationales et celles de l’enseignement supérieur. C’est la fonction d’analyse et de mise en forme.

La bibliothèque comprise comme une collection de livres est toujours d’actualité, mais il pourrait aussi bien s’agir d’une collection d’ebooks, de revues en ligne, de musique imprimée et enregistrée, de films disponibles sur une grande variété de supports, ou même en ligne. L’idée qu’une bibliothèque est un bâtiment conçu pour abriter des collections de livres et d’autres objets avec le personnel destiné à assurer ces fonctions n’est en revanche, pour la grande majorité des bibliothèques des nations industrialisées, que partiellement recevable.

Les bibliothèques sont maintenant aussi des services virtuels, disponibles pour certains 24 heures sur 24 et 7 jours sur 7, qui se soucient des pannes de réseau et d’électricité, mais plus des fuites du toit. De ce fait, la bibliothèque virtuelle ou « cyberbibliothèque », comme on l’appelle parfois, est dans la droite ligne et se superpose en de nombreux points à la bibliothèque traditionnelle.

C’est vrai même dans le domaine des collections spécialisées. Que les documents soient sous forme physique ou disponible en ligne, les mêmes fonctions que pour les collections généralistes doivent être remplies. Depuis quinze ans, les bibliothèques de Stanford collectent des ordinateurs, des disquettes, des bandes, des programmes, des données sur cédérom, des films sur DVD, et, plus récemment, téléchargent depuis le web (en obtenant bien sûr, le cas échéant, les autorisations requises). Puisque les auteurs créent leurs œuvres sur des ordinateurs, la responsabilité nous échoit de collecter les documents préparatoires de leurs œuvres publiées, qui nous sont communiqués sur des disques durs, des disquettes et, par le passé, sur des disques de tailles variées.

À Stanford, comme dans beaucoup d’autres institutions, les bibliothèques reçoivent directement des fichiers numériques des chercheurs et d’autres auteurs, pour une préservation à long terme dans nos archives numériques. Le projet Driver, un acronyme pour « Digital Repository Infrastructure for European Research  12 », basé à Göttingen, et qui implique une grosse douzaine d’institutions de l’Union européenne, est un des nombreux projets d’archives numériques actuellement en cours.

Une bibliothèque sans livres ?

À Stanford, nous venons de constituer une bibliothèque « sans livres » pour les ingénieurs. Sur ses rayonnages, seuls les 20 % de livres issus des collections qui ont été consultés au moins une fois pendant les cinq dernières années sont disponibles. À terme, ils rejoindront les autres dans les magasins de la bibliothèque. Ces dernières années, toute la documentation en sciences de l’ingénieur, en médecine, et presque toute celle qui concerne les sciences dures, est passée au format numérique. Les ingénieurs, les chercheurs en médecine, les praticiens, les informaticiens, les biologistes, les physiciens, les mathématiciens, les géologues, les spécialistes en écologie et autres scientifiques lisent des articles dans des revues en ligne, consultent en ligne des manuels et des ouvrages de référence, enseignent en utilisant des systèmes de cours en ligne, et travaillent avec leurs collègues de par le monde via des environnements de collaboration en ligne. Avec les physiciens et les mathématiciens, ce sont peut-être les hôtes les plus « numérisés » de notre campus, et de la communauté américaine de l’enseignement supérieur.

Toutes les disciplines ont profité de l’augmentation des possibilités de recherche, de l’adoption des techniques des sciences de l’information pour la recherche, l’enseignement et la communication. Les nouveaux bibliothécaires de la bibliothèque d’ingénieurs sélectionnent des ressources en ligne pour les rendre accessibles aux membres de la communauté de Stanford et informent leurs utilisateurs spécialisés des nouvelles ressources directement accessibles sur le web. Plusieurs bibliothécaires spécialistes de certains domaines aident le corps enseignant d’un ou deux des départements de la School of Engineering en acquérant une bonne maîtrise des programmes d’enseignement et de recherche de chaque enseignant, pour créer des publications en ligne et des services web susceptibles de leur fournir des informations pertinentes. Ils apprennent en outre aux étudiants à faire le meilleur usage de ces ressources, comme leurs collègues dans d’autres disciplines. Cet aspect de l’activité de chaque bibliothécaire est parfois nommé « éditorialisation de contenu ciblé ».

La bibliothèque d’ingénieurs « sans livres » de Stanford inclut des espaces destinés au travail en groupe, à la consultation de bibliothécaires, et à l’étude. Les bibliothécaires proposent des services de référence, sur place et à distance, soit par chat, soit par messagerie, et bien sûr par téléphone. Quand on a besoin de livres « physiques », on les fait venir des magasins à la bibliothèque, où les usagers peuvent les récupérer. Il y a aussi des ordinateurs, des écrans, un bar à gadgets, des vitrines et un mobilier propice à l’étude dans le calme. Les usagers de la bibliothèque qui ont besoin de services d’information géographique, par exemple pour les projets d’administration et de management, seront redirigés vers le service GIS (Geographic Information System) disponible à la bibliothèque Sciences de la terre. Les chercheurs qui souhaitent utiliser la puce DX-7, sur la base de laquelle fonctionnent les pianos et autres instruments électroniques, devront travailler conjointement avec les ressources de la bibliothèque des ingénieurs et celles de la bibliothèque musicale. Ceux qui travaillent sur le langage naturel trouveront utiles les bases de données textuelles de la bibliothèque, mais aussi les programmes produits par notre groupe « Données et logiciels en sciences sociales ».

Ce qu’il est important de noter ici, c’est qu’il existe un réseau destiné aux usagers de la bibliothèque de Stanford qui inclut des ressources numériques et physiques et des services. La quasi-totalité des ressources numériques est disponible, pour tous les étudiants et tous les professeurs de Stanford, où qu’ils soient, 24 heures sur 24, 7 jours sur 7. Pour les utilisateurs principaux de la bibliothèque des ingénieurs, les collections numériques rassemblent l’essentiel de la littérature scientifique utile dans ce domaine.

Stanford commence à réfléchir à une nouvelle bibliothèque pour le département d’Art et d’Histoire de l’art. Dans ce cas précis, nous sommes convaincus qu’il faut construire un bâtiment apte à héberger une collection vaste et en constant accroissement de livres, de catalogues d’expositions et de galeries, de portfolios d’estampes, dessins et autres, et de ces revues richement illustrées caractéristiques de ces disciplines. Nous savons que le coût d’une numérisation dans une résolution suffisamment haute des illustrations de ces livres et revues, combiné aux difficultés liées au respect de la propriété intellectuelle, font que des versions numériques utilisables et diffusables sont peu envisageables pour le moment.

Quant aux technologies nécessaires pour obtenir une résolution et un rendu des couleurs satisfaisants, elles sont encore très coûteuses. Et tant que nous n’aurons pas de très grands écrans permettant d’afficher simultanément des images numériques de diverses provenances dans des tailles suffisantes pour permettre des comparaisons, il reste trop d’obstacles pour persuader les chercheurs, étudiants et artistes de ce domaine que le numérique peut répondre à leurs besoins.

Bien sûr, le même genre de problèmes se pose pour les 15 % de livres illustrés relevant d’autres disciplines que possède notre bibliothèque, mais l’exact rendu de la couleur et la très haute définition sont moins indispensables à la plupart des lecteurs de ces autres domaines.

Notre nouvelle bibliothèque d’art aura évidemment abondance de livres et de périodiques numériques, mais ils n’auront pas l’importance écrasante qu’ils prennent en sciences de l’ingénieur. Il faut préciser que nous proposons aussi un « Centre de ressources visuelles » issu de notre ancienne bibliothèque de diapositives, qui ne permettait à l’origine qu’aux membres du département d’Art et d’Histoire de l’art de pouvoir les consulter. Nous les convertissons en collection numérique pour permettre à de nombreuses personnes d’utiliser simultanément la même image (ou tout autre support d’information, à vrai dire), et la possibilité de consulter la collection a été étendue à tout le campus. Des professeurs d’histoire, des étudiants en design, des post-doctorants en psychologie peuvent désormais avoir recours à ces images pour leurs cours et leurs recherches. Le Centre prend en charge non seulement les images numérisées par nos soins, mais aussi des licences avec Amico, ArtStor, Getty et d’autres fournisseurs d’images numériques. Les projets de numérisation des bibliothèques offrent aux chercheurs et aux étudiants de nouvelles possibilités de travail.

Les projets de numérisation

À Stanford, nous avons collaboré avec des collègues du Corpus Christi College de Cambridge pour numériser les manuscrits antiques, médiévaux et modernes de la Matthew Parker Library afin d’étendre les possibilités d’étude pour les médiévistes du monde entier  13 . De semblables projets sont en cours à la Bibliothèque nationale de France et dans d’autres bibliothèques européennes de premier plan.

Les manuscrits de la collection Parker étaient d’un usage difficile, car les risques de dégradation et de vol contraignaient les bibliothécaires à en restreindre l’accès. En numérisant les manuscrits, la plupart des besoins des chercheurs peuvent être satisfaits par une consultation en ligne. La numérisation a été menée de façon à produire des images à très haute résolution permettant de forts grossissements. En plus de cela, les notices des manuscrits ont été à cette occasion mises à jour et étendues, et des bibliographies d’éditions et d’études abondantes ont été créées pour chacun d’entre eux. Il en résulte un remarquable environnement en ligne, propice à la recherche et à l’enseignement s’appuyant sur ces manuscrits.

Un projet est en cours, visant à promouvoir l’utilisation de versions numériques des manuscrits de nombreuses collections en permettant d’annoter et de comparer page à page des feuillets. Beaucoup d’autres collections de manuscrits et d’archives sont actuellement numérisées pour les mêmes raisons : permettre l’accès à distance, et réduire les risques de dégradation des manuscrits originaux par les chercheurs qui n’ont besoin que de lire les textes et de voir les images en détail.

Google Book Search

Le projet Google Book Search   14 a été largement commenté ces dernières années, et fait l’objet de beaucoup de spéculations superficielles et mal informées.

Google numérise les documents imprimés de 28 bibliothèques, dont les principales sont celle de l’université du Michigan et de Stanford, qui ont chacune exprimé l’intention de numériser tous les livres qu’elles possèdent. La Bayerisches Statsbibliothek, la British Library et vingt-cinq autres grandes bibliothèques envoient à Google pour être numérisés et indexés des livres exclusivement du domaine public, c’est-à-dire qui ne sont plus soumis au copyright. L’université du Michigan a annoncé il y a quelques semaines qu’elle avait envoyé plus de trois millions de livres au laboratoire Google d’Ann Arbor. Quant à elle, Stanford a envoyé plus de deux millions de livres.

L’objectif de Google est de numériser le plus grand nombre de livres de bibliothèques possible, mais aussi de proposer aux lecteurs des livres numériques récents par des accords avec les éditeurs. À terme, ce sont peut-être 35 millions de livres qui seraient numérisés dans le cadre de ce projet. Tous les mots de chacun de ces livres seront indexés, pour permettre la recherche par mot clé familière à tous les utilisateurs de Google. Les livres du domaine public sont et seront disponibles en texte intégral sur le site Google Books. Grâce à l’indexation de chaque mot de chaque livre, les lecteurs pourront rechercher dans toutes les langues des mots et des expressions, ce qui ouvrira des perspectives d’utilisation et d’étude bien plus fines et plus précises que par le passé. Les lecteurs qui souhaiteront consulter des livres sous droits pourront déterminer quels livres contiennent les termes de leur recherche. Pour autant, ils ne pourront pas lire en ligne les livres soumis au copyright.

Google a mis en place d’autres services liés aux livres numérisés. Il est par exemple possible de rechercher les livres pertinents dans les bibliothèques des environs, situées près d’une ville ou correspondant à un code postal donné, ce qui permet de faciliter pour les lecteurs les visites dans les bibliothèques proches ou les demandes de prêt entre bibliothèques. De plus, Google identifie les mots et les expressions issus d’un livre qui sont cités dans d’autres livres de sa base de données. Pour chaque livre numérisé, il fournit aux lecteurs des informations catalographiques, et les oriente vers les librairies en ligne au cas où ils souhaiteraient en faire l’acquisition. Google identifie les livres traitant du même sujet ou de sujets connexes, et met parfois en évidence les mots et expressions dominants de chaque ouvrage.

L’indexation de tous les mots de tous les livres est la grande valeur ajoutée du projet. À la traditionnelle chasse au trésor, plus ou moins au petit bonheur, dans les rayonnages de la bibliothèque, une activité que l’on pratique couramment et souvent avec plaisir en Amérique du nord, avec toutefois le risque de passer à côté d’un livre, d’un chapitre, d’une page importante pour la recherche en cours, le projet Google ajoute la possibilité d’identifier les livres potentiellement intéressants dans la collection de sa bibliothèque mais aussi dans bien d’autres collections remarquables, des livres que l’on aurait pu ne jamais rencontrer autrement.

Ce projet est une manne pour la recherche et l’enseignement. Des personnes totalement étrangères aux bibliothèques de recherche, des étudiants de petites villes isolées et bien d’autres vont découvrir des livres, ET pourront les emprunter ou les acheter grâce à cela. Google Books n’a pas seulement ouvert et indexé le contenu d’un grand nombre de livres, il aussi contribué à ouvrir l’imagination de beaucoup de gens. Google et ses partenaires du monde des bibliothèques aux États-Unis se sont lancés dans cette entreprise à la faveur d’une interprétation d’une section – la Fair Use Defense Section – du code du copyright américain qui autorise l’usage transformatif des textes. Stanford a par ailleurs décidé d’y prendre part en vertu d’une prudente réflexion sur l’histoire de l’indexation depuis plus ou moins un siècle, période au cours de laquelle aucune remise en question importante des pratiques d’indexation n’a abouti.

C’est Google, et non pas ses bibliothèques partenaires, qui a été attaqué par cinq éditeurs et par la Guilde des auteurs au motif que le simple fait d’effectuer une copie de chaque livre sous droits pour en faire l’indexation par algorithme est une violation de la loi du copyright et piétine les droits des auteurs et éditeurs qui réservent les droits de copie.

Google et les plaignants s’étaient mis d’accord pour, dans les grandes lignes, permettre à Google de tenir une librairie numérique en ligne dont les profits iraient aux ayants droit et aux éditeurs. Cependant, la crainte d’un monopole de Google et l’espoir d’une loi du Congrès sur les œuvres dites « orphelines » a fait que cet accord a été refusé devant la section sud de la cour du second circuit de la cour fédérale des États-Unis. Les parties tentent depuis de négocier les termes d’un arrangement acceptable par le juge. Il a été suggéré dans plusieurs blogs  15  et dans un article de Jeffrey Toobin dans The New Yorker 16  qu’un accord permettant la libre consultation sur Google Books des œuvres sous copyright serait possible, mais ces spéculations semblent à présent caduques. Entre-temps, la numérisation progresse, l’indexation progresse, et les lecteurs ont à leur disposition une collection sans cesse croissante de livres dans de nombreuses langues, tous indexés. Des œuvres en caractères non latins sont numérisées, mais l’indexation et la recherche n’ont pas encore commencé et attendent des améliorations des logiciels de reconnaissance optique des caractères.

D’autres projets de numérisation

D’autres projets de numérisation de masse sont bien entendu en cours. Microsoft a financé plusieurs projets à la British Library, à Yale et ailleurs, pour numériser des œuvres du domaine public. Pour l’heure, l’interface et le service de recherche Microsoft Book Search n’ont pas été mis en place, mais chacune des institutions subventionnées devait convertir 100 000 livres au format numérique. Le projet Million Books  17  a numérisé plus d’un million et demi de livres, mais ne les propose que page à page et en mode image dans une interface spéciale qui ne permet de faire de recherche que dans les noms d’auteur et les titres. L’Open Content Alliance  18 , un consortium de plus de cinquante bibliothèques avec l’Internet Archive  19  à sa tête, a numérisé plus de 100 000 titres, tous issus du domaine public. Ces œuvres peuvent faire l’objet de recherches seulement sur les champs habituels des catalogues en ligne, et il n’y a pas d’indexation du texte.

Et il y a bien sûr des milliers de petits projets spécialisés de numérisation en cours partout dans le monde, comme par exemple celui de Stanford et du Corpus Christi College autour de la collection Parker déjà évoqué. Tous ces projets vont fournir des livres, des manuscrits et des archives numérisés que l’on pourra d’une façon ou d’une autre découvrir. Ils pourront être lus en ligne par les écoliers, les chercheurs, les citoyens, les gens quelle que soit leur profession ou leur localisation.

Dans cet article, il a été question des divers modes de recherche possibles dans ces bases, et de la façon dont on peut y trouver et y lire, de différentes façons, un livre électronique. L’institution à laquelle j’appartiens fait partie du petit nombre qui développe et met en pratique des fonctions avancées d’indexation, de recherche et de navigation dans leurs bibliothèques numériques, des combinaisons de fonctionnalités que ne propose pas Google, ni aucun autre service d’information du web.

En plus des fonctions traditionnelles, notre intention est de permettre une navigation par des liens hypertexte permettant à partir des notes et autres citations d’accéder aux textes cités dans leur version numérique. Comme on l’a vu, une telle fonction a déjà été mise en place pour les articles proposés par HighWire Press, et les lecteurs de ces quelque 6,7 millions d’articles publiés en ligne par environ 145 éditeurs ont manifesté leur satisfaction, soulignant le temps qu’ils gagnaient grâce à ces liens de citation.

Par ailleurs, nous nous apprêtons à procéder à l’indexation taxonomique des ebooks dont nous avons fait l’acquisition ou qui nous sont versés dans le cadre du projet Google Book Search. Notre choix pour ce faire s’est porté sur l’utilisation d’un extracteur sémantique pour définir les termes taxonomiques. Une autre application se charge ensuite de créer un arbre taxonomique qui indexe les sujets dont il est question dans les textes, plutôt que les mots exprimant des sujets, c’est-à-dire que les sujets traités par les textes seront perceptibles de façon à permettre la comparaison et l’appariement des textes entre eux, et par conséquent une recherche plus efficace et pertinente pour les lecteurs de Stanford.

En collaboration avec nos collègues de l’Institut national d’informatique de Tokyo   20, nous travaillons à soutenir une autre méthode permettant aux lecteurs de faire des recherches par mots, la recherche associative. Par une sorte d’algèbre vectoriel, les mots des textes sont exprimés par des nombres en fonction de leur fréquence, leur position, et bien sûr leur orthographe. Cette méthode de recherche permet une recherche par mots d’une très grande pertinence. Stanford collabore également à des expérimentations portant sur la représentation graphique des mots importants, un autre point d’entrée et de découverte des textes. L’extension de services d’alertes et de recommandations tels que ceux qu’a développés HighWire Press pour ses articles numériques à d’autres types de documents et à d’autres éditeurs sont également envisagés.

Gallica et l’avenir des bibliothèques

Linked Open Data

Un atelier « Linked Open Data  21  » (données ouvertes et liées) qui s’est tenu récemment à Stanford avait pour objectif de définir les besoins et les spécifications utiles aux grandes bibliothèques, et notamment à la Bibliothèque nationale de France, pour leur permettre de produire des triplets RDF  22  dans les « open stores ». Ce besoin participe d’une nouvelle approche visant à donner les moyens de chercher et de découvrir des éléments d’information très pertinents et intéressants sur un sujet donné sur la base des relations et des concordances entre les idées, les personnes, les lieux, les choses, les évènements, les époques et autres. La Bibliothèque nationale de France a été pionnière dans ce domaine, avec un service permettant d’avoir une vue unifiée d’informations issues de sources très diverses concernant les grands auteurs français et leurs œuvres  23. Ce site, sous une apparente simplicité, est un début de démonstration des possibilités offertes par cette méthode de présentation, d’analyse et d’exploration de ressources en nombre. Ce sont les prémices d’un environnement d’exploration plus efficace et fonctionnel, qui permettra de gagner du temps, de s’épargner une peine inutile, et de mettre en évidence des ressources cachées qui seraient sans doute passées inaperçues. Une ou deux douzaines d’autres bibliothèques et quelques musées ailleurs dans le monde vont se joindre aux efforts de la BnF pour mettre librement à disposition les énoncés des relations sous-jacents pour en permettre l’exploitation dans de nouveaux services d’information. À noter que cette méthode du « linked data » agrège des informations issues de nombreux sites – catalogues, résumés – de façon à rendre caduc le recours successif à de nombreux silos d’information, plus connus sous le nom de réservoirs de métadonnées dans le monde des musées et des bibliothèques.

Si on additionne toutes ces évolutions, quelle incidence ont-elles quant à l’avenir des bibliothèques ? Les missions des bibliothèques restent fondamentalement les mêmes : elles sont le foyer des matériaux bruts de la recherche et des commentaires, des témoins de l’histoire et de certains des produits de l’impulsion créatrice, et des traces des tentatives de l’Homme pour comprendre son environnement. Elles sont parmi les rares institutions qui sont les gardiennes de la culture, absorbant souvent les collections de documents, de livres et autres rassemblées par des individus en fonction de leurs intérêts et de leurs plaisirs. De toute évidence, ce qui change est la gamme des formats : les supports des idées exprimées par les mots, les images, les sons, et d’autres genres sont en train de se développer. La communication en réseau et les technologies numériques ont abouti à la mise en relation d’une masse d’individus immense, échangeant sur un éventail ahurissant de sujets d’un intérêt temporaire, voire éphémère. Seule une infime partie de ce brouhaha sera conservée dans les bibliothèques, mais nous commençons à peine à percevoir l’ampleur du principal défi : garder pour les générations futures ce qui est né en format numérique.

Gallica

Certains de ces nouveaux services qu’il est possible de rendre aux chercheurs, aux étudiants et aux citoyens grâce aux ressources d’internet et des collections de livres numérisés, d’ebooks ou autres documents numériques sont mis en œuvre dans Gallica, l’immense bibliothèque numérique de la Bibliothèque nationale de France   24. Gallica contient et met à disposition plus de deux millions de livres, documents, cartes, manuscrits, images, périodiques, partitions ou encore enregistrements audio issus des collections de la BnF, de bibliothèques partenaires et d’e-distributeurs.

Dans Gallica, on peut aussi feuilleter les manuscrits du XVe siècle conservés à la BnF, et lire à son gré les mots écrits il y a des siècles, sans aucune des contraintes horaires ou pratiques de la salle de lecture du département des Manuscrits du site Richelieu de la BnF, et ce mode de lecture sur copie numérique n’endommage en rien le manuscrit. Sauf en ce qui concerne les recherches concernant l’objet manuscrit lui-même, ses pages de papier ou de parchemin, sa reliure, ses encres, et ses marques d’usage, la version numérique propose au lecteur un mode d’accès au texte propre à satisfaire la grande majorité des besoins des chercheurs.

Assurément, les chercheurs voudront et auront besoin de lire plusieurs manuscrits à la fois, de consulter divers dictionnaires et autres ouvrages de référence pendant qu’ils les étudient, de discuter de leur travail avec le personnel de la salle de lecture et avec d’autres chercheurs. L’environnement actuel proposé par Gallica répond à la plupart de ces besoins, mais pas à tous. Dans les années à venir, il sera possible d’utiliser les manuscrits d’autres manières utiles même s’ils proviennent de bibliothèques différentes.

Parmi ces fonctionnalités, il serait possible d’annoter virtuellement des mots, des lignes, des pages, des sections entières afin de partager ses idées et hypothèses. On pourra également bientôt superposer l’écriture de plusieurs manuscrits, et on travaille également à un outil permettant de comparer des pages en les alignant les unes à côté des autres virtuellement.

Gallica est un excellent exemple du genre de services qu’il est aujourd’hui possible de proposer simultanément à une large part des citoyens grâce aux nouvelles technologies. Grâce à internet, Gallica donne accès pour ainsi dire instantanément – en France ou ailleurs – à des documents historiques et culturels de la nation française et de ses précurseurs qui n’étaient auparavant accessibles qu’aux rares lecteurs qui pouvaient se rendre en personne à la BnF. Quel progrès pour les citoyens français et pour ceux qui s’intéressent à la France !

Évaluation des pratiques

Ce qui était une évidence du temps des grandes bibliothèques d’Éphèse et d’Alexandrie, à savoir le rangement des rouleaux et plus tard des livres sur des étagères, à l’abri des intempéries, des parasites, du feu et de l’eau, et qui vaut toujours pour les documents physiques, n’en est pas une pour les documents virtuels, même si eux aussi transmettent des informations, la connaissance et même la sagesse.

Ce n’est qu’au cours des dernières années que sont apparues des tentatives sérieuses pour développer des archives numériques à des fins de conservation. La bibliothèque du futur disposera pour remplir son rôle culturel et scientifique de plusieurs moyens et infrastructures. Pour cela, les bibliothèques développent de nouveaux services sur la base des nouveaux moyens de communication, mais elles inventent ou contribuent à de nouvelles pratiques d’indexation et de recherche dans les textes et, bientôt, dans les images, que chercheurs et étudiants peuvent s’ils le souhaitent utiliser pour trouver et analyser ces dernières plus facilement et plus finement que jamais.

Il est vrai que les chercheurs et les étudiants vont devoir, en conséquence, faire évoluer leurs pratiques, traditionnelles ou numériques, pour ce qui est de la recherche, de la navigation et de la critique des sources. Certaines bibliothèques sont à l’avant-garde de cette évolution. Elles seront bientôt de plus en plus nombreuses à adopter les méthodes et les services développés ailleurs, pour le plus grand bénéfice des lecteurs. Tout comme il est trop tôt pour déplorer la mort du livre, il est trop tôt pour déplorer celle des bibliothèques.

Les éditeurs

Si ces prédictions concernant le livre et la bibliothèque sont justes, les éditeurs devront proposer eux aussi de nouveaux projets numériques. Pour les maisons d’édition, ces évolutions sont indéniablement en marche. Les liseuses qui sont à présent mises sur le marché, et les centaines de milliers de livres proposés par une multitude d’éditeurs en version numérique le prouvent. Les éditeurs proposent aussi des livres imprimés à la demande qui sont stockés et vendus grâce aux technologies et aux réseaux numériques, avant d’être imprimés pour répondre à la commande d’un acquéreur et envoyés directement depuis le lieu d’impression.

Le progrès dans ce domaine ne s’arrête pas là, notamment parce que les éditeurs spécialisés dans certains genres, comme les revues, se sont lancés très tôt dans l’édition électronique et en sont venus à proposer de nouveaux services, de nouvelles fonctionnalités à leurs lecteurs, et même à créer de nouveaux marchés. Beaucoup d’éditeurs scientifiques et médicaux proposent des guides, des ouvrages pratiques et de référence en version numérique qui sont faciles à mettre à jour, faciles à utiliser, et qui offrent à la fois des illustrations, une gestion des citations et des liens bibliographiques utiles aux praticiens. Il ne s’arrête pas là aussi pour d’autres raisons, notamment à cause de la prolifération de nouveaux modèles de publication, en particulier pour les chercheurs et autres intellectuels.

Qu’est-ce qu’un éditeur ?

Auteur et éditeur

Publier consiste à diffuser l’information auprès du public, qu’il s’agisse de littérature, de poésie, de musique ou de cinéma, pour prendre quelques exemples. C’est une activité fondamentale, qui a de lourdes implications légales et culturelles. Les éditeurs, comme les bibliothécaires, sélectionnent leur matière première. Dans leur cas, il s’agit de diffusion publique, souvent dans un but lucratif, souvent pour asseoir une réputation, souvent aussi pour le bien public. Les éditeurs acquéreurs ou travaillant par commande parlent souvent du « développement » d’un livre. Ils aident les auteurs et les compilateurs de diverses manières, proposant parfois des avances sur les droits pour encourager l’écriture et le travail de création. L’identification d’auteurs est liée à cette fonction de sélection. Contrairement aux relations entre lecteurs et bibliothèques ou bibliothécaires, les auteurs ont souvent avec les éditeurs des relations heurtées et turbulentes. Il y a la question de l’argent, mais aussi celle de déterminer qui possède le talent, et qui doit décider en dernier ressort. Chercheurs et professeurs écrivent parfois des articles et des livres pour satisfaire aux exigences éthiques et professionnelles qui leur imposent de faire connaître l’avancée et le résultat de leurs recherches. L’enjeu n’est alors en général pas d’argent, mais plutôt de fierté personnelle quant aux découvertes et à leur publication. Beaucoup d’éditeurs spécialisés dans les écrits académiques se trouvent confrontés à des disputes sur des éléments plus moins importants des manuscrits. Quand il est aussi question d’argent, par exemple dans le cas de manuels ou d’ouvrages de vulgarisation, l’enjeu est plus élevé encore – la rémunération financière aussi.

Laissons pour l’instant de côté la commande et la création de contenu ; une autre fonction importante des éditeurs est l’édition. Voici ce qu’en dit l’écrivain Richard Rhodes, lauréat du prix Pulitzer : « L’édition n’est pas une opération cosmétique. C’est un processus de réflexion. L’expression n’émerge d’ordinaire de l’esprit de l’écrivain que vaguement organisée. Les images affluent en masse ; les souvenirs, les idées et leurs associations déboulent sur la page. La mémoire, chien de chasse envoyé traquer le langage, rapporte la première chose qui lui tombe sous la dent là où on l’a lancée. Parfois, c’est le mot juste, parfois un cousin éloigné, parfois un poisson crevé. Pour ne pas broder sur un mauvais choix, pour ne pas “utiliser la voix active”, ni obéir à quelque autre loi stylistique, mais aller au plus clair pour soi-même et pour son lecteur, ce que l’on “veut dire”, il faut l’éditer   25. »

Mieux encore, lorsqu’un bon écrivain finit d’éditer son propre manuscrit, un bon éditeur le lit et lui suggère des améliorations. Dans beaucoup des meilleures maisons d’édition, des relecteurs vérifient tout une fois de plus et proposent d’autres modifications. En confiant à plusieurs professionnels expérimentés et bien entraînés la tâche de rendre clair ce qui doit l’être, les éditeurs contribuent à un second titre à notre intérêt à nous lecteurs. La créativité de l’auteur sort améliorée et même grandie du savoir-faire de l’éditeur.

Le savoir-faire de l’éditeur

Les éditeurs « ramasse-miettes », les soi-disant auto-éditeurs, éditeurs à compte d’auteur et impécunieux, tentent de faire sans le travail d’édition, ou demandent aux auteurs une prise en charge financière. Les livres qui se vendent le mieux, ceux qui sont mentionnés par les critiques et cités sont en règle générale ceux qui sont passés par les mains d’un éditeur. Le savoir-faire de l’éditeur, qui vient s’ajouter au travail de création des auteurs, est ce qui permettra aux véritables éditeurs de se maintenir face aux nouveaux modèles et à l’auto-édition. La quantité croissante de rebut accroît d’autant la valeur d’une édition de qualité.

Dans certaines publications, le travail de composition et de mise en page est très important, voire constitutif. C’est le cas par exemple des catalogues des grands musées et des galeries célèbres. C’est aussi le cas des hebdomadaires à grands tirages dans tous les pays : quel travail d’édition ! La composition des pages, les graphismes, peuvent être réalisés par des amateurs, mais il est presque toujours profitable d’avoir recours à la patte d’un bon professionnel, même si la mise en page se fait maintenant presque entièrement sur ordinateur.

Les éditeurs se chargent ensuite de l’impression des livres, ou de leur sortie en format numérique. On verra de plus en plus de publications numériques, car les éditeurs de livres commencent à comprendre ce que les éditeurs de revues ont appris il y a bien dix ans : ils peuvent toucher un public plus large par une publicité et une distribution des livres aux lecteurs par le biais d’internet. Certains de ces livres disposeront des fonctionnalités de lecture et de recherche évoquées plus haut au sujet des articles hébergés par HighWire Press. Mais les lecteurs continueront encore longtemps de trouver des éditions papier élégantes et richement illustrées.

Économie et édition

Les éditeurs mettent sur le marché des livres pour les vendre. Souvent, cela implique des intermédiaires : grossistes, détaillants, distributeurs, vendeurs en ligne, et surtout libraires. Les éditeurs encouragent les journaux généralistes et les magazines à faire la critique des livres de vulgarisation, voire de temps à autre d’un ouvrage universitaire. Les éditeurs d’ouvrages universitaires font de même dans les revues scientifiques. Les critiques et le bouche à oreille, ce que l’on appelle désormais le marketing viral, ont une incidence sur le nombre de lecteurs. Les bibliothèques veillent à rendre accessibles les livres sur le temps long, lorsque les éditeurs ont cessé de les produire, mais cela va changer car les livres numériques ne sont jamais épuisés.

Les éditeurs négocient des contrats de traduction et de coédition dans des pays éloignés de celui de l’auteur ou de l’éditeur d’origine. Ils touchent ainsi un lectorat plus vaste et plus varié. Ces activités permettent de répandre information et opinions partout dans le monde, ce qui est en général une bonne chose. Outre le projet Google, les éditeurs traditionnels ont dû faire face à la prolifération de solutions venant faire concurrence à leurs services et à leurs modèles commerciaux. L’auto-édition, par exemple Lulu.com, offre aux auteurs qui ont de l’ambition (mais peut-être pas assez de talent ou d’imagination pour attirer un éditeur majeur) tous les services proposés par un éditeur à l’exception de deux. Par définition, n’importe qui peut s’auto-éditer sur Lulu ou n’importe lequel de ses compétiteurs. Il n’y a par conséquent pas de sélection, pas de commandes, pas d’évolution des auteurs. Ils sont ce qu’ils sont lorsqu’ils arrivent, et ils sont livrés aux lecteurs sans modification aucune. Et Lulu et autres n’éditent en aucune manière, même s’ils permettent d’effectuer des changements sur le texte. Il n’y a là rien de ce qui fait l’intérêt d’avoir un éditeur, une personne extérieure propre à porter un regard neuf sur la prose immortelle de l’auteur, et disposant d’un crayon – pardon, d’un traitement de texte – acéré et d’une maîtrise exemplaire de la langue maternelle de l’auteur pour améliorer un texte, système qui a lui-même des limites évidentes. Certains affirmeront en outre que les savants n’ont pas besoin d’éditeur. Ils ont tort. Les écrits produits par les savants, quel que soit leur genre, y compris la fiction, gagnent à être soumis à un éditeur tout autant qu’à la critique des pairs. Des auteurs prolifiques et cultivés en témoignent constamment.

La validation par les pairs

La validation par les pairs mérite aussi d’être évoquée dans cet article. C’est un des moments de la communication scientifique, entre la phase de recherche et celle de la mise par écrit des résultats, que cette mise par écrit prenne la forme d’un article, d’un livre ou même d’un site internet. C’est une étape essentielle. La validation par les pairs garantit que les méthodes, les résultats, les implications et même l’expression proposés par les éditeurs et auteurs sont dignes d’être soumis au public.

La publication des méthodes et résultats de la recherche n’est qu’un des versants de la validation par les pairs, quelle que soit la discipline, mais c’est l’ensemble de ces critiques qui confirme les résultats, la valeur du travail du chercheur. Parfois, la critique des pairs est un échec. On peut par exemple évoquer la célèbre affaire de la fusion à froid : tous les protagonistes ont passé au mieux pour des idiots   26. Il y a quelques années, il y a aussi eu le cas d’un chercheur coréen qui prétendait avoir cloné des êtres humains  27  : autre exemple d’un échec embarrassant de la validation par les pairs en premier ressort. Malgré tout, dans les deux cas, un examen sérieux a été mené, avec dans le cas de la fusion à froid des tentatives pour reproduire les méthodes et les résultats des expérimentations de l’Utah. Ces tentatives ont échoué, bien entendu, et dans ce cas comme dans l’autre les publications ultérieures et la critique plus ou moins publique par les autres scientifiques ont finalement réfuté les prétentions avancées. On peut donc considérer que, dans un certain sens, c’est un système qui fonctionne bien dans la majorité des cas. Ce sera également vrai de l’e-publication de la recherche.

L’avenir de l’e-publication

Ce jugement par les pairs s’exprime par d’autres biais dans une carrière universitaire réussie. Le chercheur est évalué pour une part sur la base de ses publications par des comités de recherche, de promotion, d’évaluation, de demande de subvention, par des présidents de département et des doyens d’université.

Un autre aspect des évolutions actuelles dans les nations les plus avancées du monde, comme l’Allemagne ou l’Amérique du Nord, est la convergence et la combinaison rapide des disciplines, des sujets et des domaines de recherche. Ce pullulement de connaissances nouvelles, qui repose en grande partie sur les technologies numériques, grâce à une efficacité accrue de la diffusion des résultats de la recherche par l’e-publication, combiné au sentiment d’urgence à résoudre des problèmes nombreux et difficiles, fait que les écrits, numériques dès l’origine assurément, et partant les publications, se multiplient.

L’e-publication, telle qu’elle est actuellement et dans ses potentialités, a trois volets : en premier lieu, elle représente un important gain de temps ; en second lieu, elle est plus économique ; et enfin sa diffusion auprès des lecteurs du monde entier est à la fois plus rapide et plus égalitaire, car elle permet d’éliminer de la chaîne de distribution les aléas des postes internationales. Il est bien sûr possible, et fréquent, que les lecteurs, lorsqu’ils reçoivent les livres et articles numériques, en fassent un tirage sur leurs propres imprimantes.

En ce qui concerne l’avenir de l’édition, même si les éditeurs sont parfois lents à entrer dans le monde du numérique, la plupart y découvriront tôt ou tard de nouveaux supports et de nouveaux marchés pour leurs livres. Les éditeurs traditionnels seront sans doute mis au défi par les nouveaux modèles de diffusion et les auteurs auto-publiés, mais si leur personnel est bien informé et attentif, ils continueront à gagner leur vie en dépit d’inévitables difficultés. Les nouvelles formes de narration, qui utilisent le multimédia et d’autres interpolations pour plus d’expressivité et de dynamisme, la fiction hypertexte, et la floraison de formes et de genres nouveaux seront source d’anxiétés autant que d’opportunités. La diffusion en ligne de ces nouvelles formes finira par être largement acceptée, et même adoptée. Nos enfants et petits-enfants sont l’avant-garde de cette transition qui est déjà en marche.

Envoi

Les auteurs, les libraires et les éditeurs vont devoir apprendre à faire avec les évolutions contemporaines, et même les adopter dans l’intérêt de leurs clients, les lecteurs. Le spectre des types de supports s’élargit. Les amateurs de livres et les lecteurs en tous genres (y compris ces nouveaux lecteurs dont il est ici question), les bibliothécaires et les éditeurs ne cessent et ne cesseront de s’adapter. Ce qui était perçu comme immuable, à l’échelle d’une vie ou même de dix, est désormais aussi transitoire qu’éphémère. L’important, en fin de compte, et comme le suggérait Francis Bacon, est que la lecture est la marque d’une vie bien remplie, la conversation celle d’une vie capable de s’adapter et d’évoluer, et l’écriture celle d’une vie, d’une culture qui s’exprime. L’écrit peut prendre une forme matérielle ou une forme numérique. Ces manifestations de l’écrit peuvent être publiées et conservées dans les bibliothèques. Qu’est-ce qui fait un livre ? C’est nous, et ce que nous en faisons. Qu’est-ce qui fait une bibliothèque ? C’est la collecte, la conservation et la mise à la disposition des générations présentes et à venir par cette institution des livres et autres documents littéraires, quels que soient leur format et leur mode d’utilisation par les lecteurs. Et c’est un champ où émergent mille et mille fleurs. •

* Traduit de l’anglais (États-Unis) par Florence Codine

Archiviste-paléographe, Florence Codine est actuellement élève conservateur à l’Enssib.

Illustration
Vue depuis la Green Library à l’université de Stanford. Photo : HarshLight sur Flickr (licence CC-by 2.0)

Août 2011