De la production à la pérennisation des objets numériques

Expériences internationales

Noëlle Balley

Malgré la richesse du programme, le nombre des inscrits (120 professionnels venant de 14 pays) et les enjeux du sujet, c’est une assemblée clairsemée qui s’est réunie du 25 au 27 avril 2007 au Belvédère de la Bibliothèque nationale de France pour ce symposium international coorganisé par l’Ifla-Pac (programme Preservation and Conservation de l’Ifla), la BnF et l’Institut national du patrimoine sur un thème qui sera de plus en plus prégnant dans la réflexion professionnelle. Les présentations Powerpoint des intervenants sont d’ores et déjà en ligne sur le site de l’Ifla 1. Nous nous contenterons donc de souligner quelques temps forts, forcément subjectifs, qui ont fait l’originalité de ces rencontres.

La conservation dès la production

Le message de la première demi-journée, martelé par Catherine Dhérent, modératrice des débats, était clair : si la conservation n’est pas prise en compte dès la production des données numériques, l’espoir de les préserver sur le long terme est mince. Que ce soit pour la mise en place de procédures administratives dématérialisées au ministère de l’Économie, des Finances et de l’Industrie, d’un portail de revues comme Cairn 2, qui regroupe plusieurs éditeurs de sciences humaines aux pratiques diversifiées, le respect des normes internationales dès la création des données est une condition de la survie de l’information.

L’exemple de l’Université du Michigan est éclairant : la conservation des données numériques confiées à la bibliothèque, qu’elles émanent d’un ancien président pionnier de la micro-informatique ou de services administratifs produisant documents internes et brochures d’information, nécessite une analyse fine, non seulement des formats mais de l’authenticité des documents : quelle est la version officielle, et quel sort réserver aux versions intermédiaires et autres documents de travail ?

Tandis qu’une partie du groupe se rendait à Bry-sur-Marne pour visiter les installations de l’Institut national de l’audiovisuel, l’autre moitié se retrouvait pour une présentation du projet Spar (Système de préservation et d’archivage réparti) de la BnF, dont les habitués des rencontres professionnelles de cette dernière suivent la gestation depuis plusieurs mois. En avril, on en était à l’acquisition des serveurs. Les participants ont peut-être surtout retenu la présentation des techniques d’émulation et de migration mises en œuvre à la BnF pour garantir l’accès à des données numériques qui semblent déjà appartenir à la préhistoire : les démonstrations de jeux éducatifs des années 1980, avec leurs pixels gros comme des timbres postes et leur continuel « bip-bip », ont mis en lumière de façon très parlante les difficultés de la conservation pérenne dans une perspective d’accès : « Comment ça marchait, déjà ? » Pour les plus jeunes d’entre nous, une vraie séance nostalgie !

La collecte de l’information numérique

Le lendemain était consacré à la collecte de l’information numérique et en particulier du web. La comparaison entre les choix de la Bibliothèque royale des Pays-Bas et de la BnF montrait deux approches différentes : la Koninklijke Bibliotheek privilégie une approche sélective de sites historiques, littéraires ou culturels sur les Pays-Bas et leur rayonnement dans le monde, ainsi qu’un partenariat avec Elzevier, tandis que la BnF panache des collectes systématiques du web français (mais qu’est-ce que le « web français » ?), des sélections thématiques (en particulier sur les élections) et quelques dépôts d’éditeurs. Pour mener à bien le moissonnage annuel du web français, elle fait appel au savoir-faire de l’Internet Archive, une association américaine qui œuvre à la conservation des sites web et travaille comme prestataire de services pour des institutions patrimoniales, grâce à des moyens techniques considérables.

La Bibliothèque nationale d’Autriche présentait, dans la perspective de la Bibliothèque numérique européenne, un programme de numérisation plus classique, visant à préserver numériquement la présentation originale de fonds iconographiques dont les éléments matériels ont dû être dissociés pour des raisons de conservation. Le programme chilien de la Dibam (Dirección de Bibliotecas, Archivos y Museos) était présenté par la directrice de la Bibliothèque nationale du Chili. Mais si l’on a beaucoup appris sur les modalités du dépôt légal du web en France, en revanche, ceux qui espéraient révélations fracassantes ou débats polémiques sur le partenariat entre Google et l’université du Michigan ont été déçus : le secret de la technologie Google reste bien gardé, et les questions à l’intervenant ont été d’une grande modération.

Gestion des risques et préservation des données numériques

La dernière journée a surtout été marquée par la remarquable et très riche communication d’Emmanuelle Bermès (BnF, département de la Bibliothèque numérique) sur la gestion des risques pour la conservation des documents numériques. La qualité de son intervention ouvrait de nombreuses perspectives pour l’utilisation d’une méthodologie de gestion des risques en bibliothèque, et pas seulement pour un plan d’urgence. On traitait ensuite des archives ouvertes, à partir de l’exemple du projet Hal du CNRS 3. Ces trois journées étaient émaillées de présentations de normes, protocoles et consortiums autour de la préservation des données numériques : le consortium IIPC (International Internet Preservation Consortium), la norme OAIS (Open Archival Information System), le groupe français PIN (Pérennisation des informations numériques) ont fait l’objet de présentations aussi pédagogiques les unes que les autres. On ne saurait trop conseiller aux personnes intéressées de se reporter aux présentations mises en ligne par l’Ifla-Pac : elles donneront une idée bien plus précise de ces interventions dont chacune mériterait un compte-rendu détaillé.