Longévité de l’information numérique : les données que nous voulons garder vont-elles s’effacer ?
Rapport du groupe PSN (Pérennité des supports numériques) commun à l’Académie des sciences et à l’Académie des technologies
Jean-Charles Hourcade
Franck Laloë
Erich Spitz
ISBN 978-2-7598-0509-9 : 14 €
Ce court rapport, rédigé par le groupe Pérennité des supports numériques (PSN), composé de membres de l’Académie des sciences et de l’Académie des technologies, s’intéresse à la préservation à long terme de l’information numérique, en distinguant « deux notions très différentes », celle de stockage des données (à court terme) et celle d’archivage, pour « des décennies ou un siècle », donc à long terme. Or, si « nos sociétés génèrent des masses toujours plus grandes d’informations… la durée de vie des supports disponibles pour la [sic] conserver n’a jamais été aussi courte ».
Les deux stratégies d’archivage possibles
Présupposant une sélection des données « qui ont réellement besoin d’être préservées à long terme », le rapport s’intéresse aux supports, aux formats, aux logiciels, en insistant sur le fait que « c’est bien le support physique de l’information qui est la clé de tout le processus de conservation ». Sur ce point, les experts constatent que les supports dits « pressés » (CD et DVD notamment) ont une « durée de vie… relativement bonne, sans commune mesure avec celle des disques type CD-R ou DVD-R », alors même que les CD et DVD « ne sont pas adaptés aux usages qui sont l’objet de ce rapport ».
Les auteurs examinent les deux stratégies d’archivage possibles, la « stratégie passive : archive et oublie » et la « stratégie active : migration perpétuelle », cette dernière étant celle des « grands acteurs institutionnels ». Deux autres solutions sont envisagées, la délégation à un prestataire de service, qui n’apporte pas de réponse probante, et même le retour à l’analogique, préconisé par le Science and Technology Council of the Academy of Motion Pictures Arts and Sciences (en gros la commission technique des Oscars du cinéma) pour la conservation à long terme des films de cinéma.
Quatre types de supports sont potentiellement concernés pour ce qui est de l’archivage numérique, les disques optiques numériques enregistrables (DONE), les bandes magnétiques, les disques durs magnétiques et les « mémoires flash », même si, « pour le moment, personne ne considère les mémoires flash comme des supports de stockage à long terme ». En privilégiant la stratégie active, et en se basant sur une estimation du « patrimoine numérique » à conserver pour chaque foyer (conservation pour des raisons objectives ou sentimentales), les auteurs estiment que « rapporté à l’échelle d’un pays comme la France… le coût annuel de préservation de l’information du patrimoine numérique [sic] est donc probablement compris entre 2 et 20 milliards d’euros par an (100 à 1 000 euros par foyer et par an), et 2 ou 3 fois moins dans une hypothèse minimale ne couvrant pas les enregistrements vidéo ».
Dans la perspective d’une stratégie de conservation passive, ils insistent sur le fait que les DONE sont « les mieux placés pour jouer le rôle de support ». Mais les processus physicochimiques mis en jeu, même dans de bonnes conditions de conservation, et malgré les tests de vieillissement artificiel déjà effectués, appellent à « conserver la plus grande prudence concernant les extrapolations et les prédictions de durées de vie en termes d’années, qui sont probablement fausses dans un grand facteur » – observation qui les amène à examiner avec scepticisme les évolutions technologiques à l’œuvre dans ce domaine : « L’avenir dépendra… en bonne partie de la capacité des fabricants à effectuer une reconversion par rapport aux tendances actuelles, et de réaliser une avancée significative dans le domaine de la longévité. »
Des recommandations
En conclusion, le rapport souligne que la « préservation active » semble la solution « pour le moment la plus sûre », mais qu’« elle n’est cependant probablement pas transposable à l’échelle de tous les besoins, y compris familiaux et personnels ». Les auteurs proposent quatre recommandations de bon sens : « débloquer les études sur le sujet », en engageant « rapidement une étude réellement scientifique des phénomènes de vieillissement des supports… visant à dégager des recommandations fiables en matière de standardisation des formats de supports d’archivage longue durée » ; « éviter la perte des compétences dans le privé et le public, en favorisant “des actions conservatoires” pour les dernières équipes de R & D [Recherche et développement] qui sont compétentes dans le domaine » ; « favoriser l’innovation et l’apparition d’une offre industrielle de qualité », pour permettre l’émergence de solutions industrielles visant à « la réalisation de disques optiques numériques enregistrables de très bonne longévité » ; « élaborer une véritable politique d’archivage numérique », en évaluant notamment « l’intérêt d’une mutualisation des moyens, dans la perspective d’une stratégie active à l’échelon national ».
En annexes du rapport, figurent entre autres la « Charte de l’Unesco sur la conservation du patrimoine numérique » d’octobre 2003, la présentation de « quelques projets français », notamment le « Century Disc », le schéma du processus d’enregistrement d’un disque optique numérique, « quelques images illustrant le vieillissement de disques optiques enregistrables », et « quelques idées reçues » parmi lesquelles on pourra retenir, d’une part que « si dans quelques siècles on sait que tel ou tel support ou type de fichier [sic] contient une information importante, on pourra toujours arriver à la lire », d’autre part que « les métadonnées ne sont pas le cœur du problème ».