L'information numérique, de nouveaux territoires à conquérir

i-expo 2006

Juliette Doury-Bonnet

La 23e édition d’i-expo, le salon de l’information numérique professionnelle, s’est tenue au Centre national des industries et techniques (Cnit), à Paris, les 31 mai et 1er juin derniers. L’Allemagne était le pays invité. Les conférences et ateliers ont privilégié cinq axes de réflexion : la veille et l’intelligence économique, les usages professionnels des blogs, fils RSS et wikis, les territoires intelligents, le patrimoine numérique et les nouveaux modèles de production et de diffusion de l’information scientifique et technique (IST) 1.

La conservation du patrimoine numérique

L’atelier consacré à la conservation du patrimoine numérique a donné la parole aux représentants de grandes bibliothèques et institutions. Si ces expériences ne sont pas transposables directement par des établissements plus modestes, elles permettent de comprendre les enjeux, les risques et les coûts, comme le souligna Catherine Dhérent (Bibliothèque nationale de France).

Les principes de la conservation du patrimoine numérique sont établis depuis dix ans grâce au rapport Preserving Digital Information  2, commandé en 1996 par la Commission on Preservation and Access (CPA) et RLG (Research Libraries Group), et grâce au modèle de référence OAIS (Open Archival Information System) 3 de 2002. « On peut désormais avancer de manière solide », affirma Catherine Lupovici. Elle exposa la démarche adoptée à la BnF pour mettre en place un système d’archivage. L’analyse préalable (2004-2005) est une étape essentielle : identification des acteurs de l’environnement de l’archive et des contenus, analyse des flux et des formats. Les éléments fondamentaux de la préservation sont le protocole d’entrée des données dans l’archive, passé entre producteur et gestionnaire, et la gestion de la pérennisation qui va évaluer les risques. « Le vrai défi, c’est l’obsolescence technologique de l’ensemble de la plate-forme de production et de consultation. »

Reinhard Altenhöner (Die Deutsche Nationalbibliothek) présenta le portail Nestor (Network of Expertise in Long-Term Storage of Digital Resources) 4. Ce système d’information et d’archivage partagé, initié par le ministère allemand de l’Éducation, permet aux institutions (bibliothèques, archives, musées) d’établir un réseau dans un pays qui n’a pas de centralisation ni de recommandation nationale, dans un contexte de restrictions budgétaires.

Le numérique, censé sauver les contenus dans une forme manipulable et réinscriptible, était considéré comme la solution vers 1995-2000. Bruno Bachimont (Institut national de l’audiovisuel) montra qu’il est devenu un problème et qu’il risque d’être débordé par la masse qu’il a créée. Dans le domaine de l’audiovisuel (contenu dématérialisé, médiation technique de la projection, etc.), les difficultés sont accentuées : la ressource n’est plus le document ni son référent, les formats changent rapidement, les supports de restitution sont multiples. Cela a des conséquences sur les contenus et on assiste en particulier à la « déconstruction de la notion d’auteur ». Les défis sont liés à l’altération physique des supports, à l’obsolescence des formats et à la décontextualisation des contenus (on archive désormais des programmes de télévision que personne n’a jamais vus ni décrits). Comment dans ces conditions assurer l’intégrité des contenus et leur authenticité, garantir leur accessibilité, restituer leur intelligibilité ? Il s’agit de proposer des politiques patrimoniales à long terme, au-delà de l’urgence de la sauvegarde et du court terme de l’innovation technologique. Plusieurs stratégies sont envisageables : le musée, la migration, l’émulation et la description (à l’image des partitions musicales).

Chaque stratégie est adaptée à un type de données et de documents et peut varier dans le temps, remarquèrent C. Dhérent et C. Lupovici.

L’atelier aborda un autre aspect de l’archivage électronique : depuis le 1er janvier 2005, les collectivités publiques et les organismes de droit privé soumis au Code des marchés publics sont dans l’obligation d’accepter les réponses aux appels d’offres que les entreprises leur transmettent par voie électronique. Comment assurer la sécurité des échanges, valider les signatures, archiver les réponses ? Gaël Chervet (société Forsup) et Charles Du Boullet (CDC Arkhinéo) présentèrent une solution d’archivage électronique pour la dématérialisation des marchés publics, le Coffre-fort électronique® de CDC Arkhinéo.

Lors de la conférence de l’après-midi consacrée aux projets de bibliothèques numériques européennes,  Jean-Noël Jeanneney insista sur la nécessaire organisation réfléchie du savoir humain. Il s’insurgea contre le vrac, le désordre des informations sélectionnées par Google, « fruste rouleau qui se dévide ». Le moteur de recherche américain pourrait reprendre à son compte les paroles de Cyrano lançant des mots d’amour à Roxane : « Je vais vous les jeter en touffes sans les mettre en bouquet. » Le président de la BnF souligna aussi l’absence de garanties concernant la pérennité des données et le respect du droit d’auteur. Il appela de ses vœux un modèle fondé sur un équilibre entre public et privé et définit « trois axes pour ce combat » : l’axe logistique, la réflexion sur les critères de choix et la concertation avec les éditeurs.

La mise en place des archives institutionnelles en IST

L’atelier du 1er juin sur la mise en place des archives institutionnelles en IST montra la dynamique à l’œuvre dans différents domaines scientifiques.

Daniel Charnay (Centre de communication scientifique directe du CNRS) présenta le logiciel HAL (hyper article en ligne) 5 qui fournit une interface permettant aux chercheurs de déposer sur la base du CCSD des manuscrits d’articles scientifiques dans toutes les disciplines. Il insista sur l’idée centralisatrice qui offre des garanties telles que l’accessibilité au texte intégral, un niveau scientifique homogène et cohérent, une bonne visibilité internationale, etc. Il est possible de mettre des portails d’accès institutionnels au-dessus de HAL, comme l’illustrèrent Anne-Marie Vercoustre pour l’Institut national de recherche en informatique et automatique et, pour l’université de Rennes II, Martine Cocaud et Élisabeth Lemau. Toutes trois insistèrent sur l’importance de la présence d’un professionnel de la documentation auprès des chercheurs « pour faire vivre l’archive » grâce à l’indexation. De tels projets doivent s’inscrire dans une politique de valorisation de la recherche des établissements.

Marin Dacos (École des hautes études en sciences sociales) présenta le portail Revues.org qu’il a créé en 1999 et qui regroupe actuellement 55 revues en ligne et 15 000 documents dont la moitié en texte intégral. D’autres services se sont ajoutés : l’agenda en sciences humaines et sociales (Calenda), l’annuaire de sites (Album) et, en juin 2006, un moteur de recherche spécialisé (In-extenso). Martin Dacos mit l’accent sur la valeur ajoutée par l’éditeur.

Présentant la cellule MathDoc 6 créée en 1995, Yves Laurent (Institut Fourier, CNRS) souligna la spécificité des mathématiques et l’effort important consenti depuis toujours par les mathématiciens pour leur documentation.

Lors de la conférence de l’après-midi sur les nouvelles stratégies de production et de diffusion de l’IST, Jean-Pierre Finance, président de la conférence des présidents d’université (CPU) et président de l’université Henri Poincaré-Nancy I, brossa un panorama des évolutions induites par les technologies de l’information et de la communication sur l’IST. Il évoqua la démarche inter-établissements (universités, CNRS, grandes écoles et organismes de recherche) en cours depuis l’automne 2005 en vue d’adopter une approche cohérente et mutualisée à l’échelle nationale pour l’archivage ouvert de la production scientifique. Un protocole d’accord serait en vue avec pour objectif un portail commun de publications scientifiques basé sur la plate-forme HAL et développé par le CCSD.