La pérennisation de l’information numérique

Annie-Claude Bindyk

Le Palais des congrès accueillait du 4 au 6 juin 2002 le salon – 19e du nom – IDT-Net, sous-titré cette année « Information numérique ». Deux conférences ont retenu l’attention de la rédaction : « La gestion collective des droits » et « La pérennisation de l’information numérique », dont le BBF rend compte dans les lignes qui suivent.

L’essor de la documentation numérique impose une double contrainte à tout producteur d’information : poursuivre un devoir de mémoire et faire respecter le droit à l’oubli, tel qu’il a été défini par la loi informatique et libertés, déclara la présidente de la conférence, Catherine Dhérent, chargée de mission à la Direction des Archives de France et à l’Association des archivistes français (AAF). Trois intervenants exposèrent les spécificités de la chaîne documentaire numérique : Didier Courtaud, professeur d’ingénierie documentaire et multimédia et assistant aux nouvelles technologies au Commissariat à l’énergie atomique (CEA), Claude Huc du Centre national d’études spatiales (Cnes) de Toulouse et Catherine Lupovici, directrice de la bibliothèque numérique de la Bibliothèque nationale de France (BnF). Valérie Sédaillan, avocate au barreau de Paris, spécialiste du contentieux lié à Internet et auteur du livre Le Droit à l’Internet, fit l’état de l’art de la législation en matière de conservation de documents numériques.

Un cadre normatif et une législation en pointillé

Claude Huc, président du groupe Pérennisation des informations numériques (Pin 1), introduisit le dispositif normatif actuel, à savoir les recommandations de l’Afnor relatives à la conception et à l’exploitation de systèmes informatiques en vue d’assurer la conservation des documents stockés dans ces systèmes (NF Z42-013) et la norme sur le Records management (Iso 15-489). Il ajouta que les institutions s’appuient essentiellement sur le modèle de référence d’un système d’archivage ouvert (Open Archival Information System, Oais), établi en 1995 par les agences spatiales, bien que celui-ci soit incomplet puisqu’il s’attache plus à la conservation de l’information numérique qu’à son accès.

Valérie Sédaillan présenta le cadre juridique général du droit de la preuve. Les durées de conservation en fonction de la nature des documents sont précisées par l’article 1er de la loi du 3 janvier 1979, mais ce texte est aujourd’hui inadapté aux documents électroniques. La directive européenne du 13 décembre 1999 définit le cadre communautaire pour la signature électronique ; il s’agit d’une « signature informatique », c’est-à-dire une apposition à un écrit électronique d’un supplément sous forme de symboles lisibles par un ordinateur. La loi du 23 mars 2000 redéfinit la preuve littérale (article 1316 du Code civil) et consacre la légitimité de l’écrit électronique (article 1316-1 et 1316-3) grâce à la signature électronique. Celle-ci, conjointe à l’écrit électronique, permet l’identification de l’auteur d’un écrit grâce au certificat électronique (équivalent d’une pièce d’identité) fourni par un prestataire de services de certification électronique qui se porte garant de l’authenticité de la signature. Le décret du 30 mars 2001 précise les conditions de validité des documents électroniques : sous réserve qu’ils puissent être conservés « dans des conditions de nature à en garantir l’intégrité ». L’avocate souligna les incohérences de cette législation : les délais de conservation des documents électroniques ne sont pas prescrits et le décret du 30 mars 2001 n’aborde pas le problème de la conservation des documents électroniques, sa mise en œuvre pratique étant renvoyée à des décrets ultérieurs ; or les migrations de documents sur des systèmes récents risquent d’affecter le document et son processus de vérification, conclut-elle.

Maîtriser la chaîne documentaire numérique

Didier Courtaud, président de l’association Aristote 2, distingua la conservation de la pérennisation, faculté de conserver et de restituer la documentation numérique sans en altérer les données. Les institutions doivent anticiper la pérennité des supports numériques 3 ou, le cas échéant, s’assurer que les données enregistrées pourront être facilement transférables sur un support récent 4. Didier Courtaud résuma l’évolution des techniques d’encodage : depuis l’ASCII, en passant par l’Iso sur 8 bits jusqu’à la représentation universelle des langues grâce à la table universelle de caractère (Universal Character Set, UCS), à laquelle s’associent les algorithmes de transformations UTFs (UCS Transformation Format 5). Claude Huc souligna l’extrême diversité de l’information scientifique (observations issues des instruments, descriptions d’expériences, etc.) et des formats de données qui la contiennent. Ces derniers doivent être convertibles, lisibles sans recours à un logiciel spécialisé, indépendants vis-à-vis de tout groupe de pression et reconnus internationalement, ce qui élimine les formats propriétaires (tels que ceux de Microsoft et d’Adobe) au profit des formats dits ouverts. Il préconisa l’usage d’Xml, encouragé par l’Agence pour les technologies de l’information et de la communication dans l’administration (Atica 6) car ce langage de balisage assure la diffusion de tout type d’information scientifique lorsqu’il est associé à des outils de diffusion ad hoc.

L’expansion de la documentation numérique impose aux établissements l’adoption de stratégies innovantes de conservation. Catherine Lupovici fit remarquer que les « coûts d’espace, de stockage, de description de l’information, ceux liés à une conservation curative ou préventive, soit 7,5 % du budget de fonctionnement général de la BnF, propres à la conservation du papier s’échelonnaient dans le temps tandis que la pérennisation des documents numériques requiert des investissements en amont du processus ». À la BnF, une double politique de conservation fut expérimentée dans le cadre de travaux sur le futur dépôt légal de l’Internet, dans l’attente d’un décret complétant la législation actuelle (loi du 20 juin 1992 et décret d’application du 31 décembre 1993). Des « instantanés » de sites furent conservés à l’aide d’outils automatiques et, parallèlement, des bibliothécaires ont sélectionné des sites Internet destinés à la conservation. Catherine Lupovici démontra que la maîtrise du processus de la conservation des publications scientifiques numériques est conditionnée par l’étendue des droits cédés aux éditeurs. Elle mit en garde l’audience contre le risque de laisser ceux-ci responsables de la conservation, à l’instar d’Elsevier s’exprimant devant des responsables de bibliothèques de recherche américaines en ces termes : « Nous garantissons l’accès à l’information à perpétuité. » Elle ajouta que l’archivage numérique nécessite des compétences ad hoc qui n’existent pas à foison aujourd’hui en bibliothèque (sept universités en Europe offraient une formation spécifique en 2001). Claude Huc rappela que le groupe Pin réunit les réflexions communes aux producteurs d’information, qu’ils soient détenteurs d’archives patrimoniales (BnF, Archives de France) ou de grandes entreprises (Airbus, dont la documentation sur les avions doit pouvoir être consultée sur 58 ans) en attendant que des décisions soient prises au niveau européen.

  1. (retour)↑  http://sads.cnes.fr:8010/pin
  2. (retour)↑  L’association Aristote regroupe des institutions et des entreprises françaises concernées par l’évolution des télécommunications de transmissions de données : http://www.aristote.asso.fr
  3. (retour)↑  Ceci est possible avec les cédéroms de type Write Once Read Many (Worm) grâce aux taux d’erreurs corrigibles (calcul du nombre de blocs de données par seconde contenant une erreur = Bler ou Block error Rate).
  4. (retour)↑  Le Century Disc, par exemple, tend à remplacer les autres supports (cédérom en verre recouvert d’une couche métallique réfléchissante en or, en nitrure de titane, en cupronickel ou en aluminium).
  5. (retour)↑  Dont l’Utf8, Universal Character Set-Transformation Format, 8-bit, qui permet de lire la plupart des symboles.
  6. (retour)↑  http://www.atica.pm.gouv.fr