La numérisation des archives de l’Ina

Marie-Claire Amblard

En 1999, l’Institut national de l’audiovisuel a lancé un Plan de sauvegarde et de numérisation massif de son patrimoine audiovisuel, dont une grande partie est menacée de disparition, en raison de la dégradation des supports et de l’obsolescence des formats et des appareils de lecture. Parallèlement à ce plan, a été mis en place un dispositif de sauvegarde, de numérisation, de stockage et de communication en ligne des images et des sons, qui s’appuie sur un système technique intégré de stockage de masse.

In 1999, the National Audiovisual Institute launched a Plan of preservation and massive digitization of its audiovisual heritage, a large part of which were under threat of extinction, due to the deterioration of their medium and the obsolescence of formats and machines for reading them. In parallel to this plan, a mechanism has been set in place for conservation, digitization, storage and communication on line of pictures and sound, which relies on an integrated technical system for mass storage.

1999 hat das französische Nationalinstitut für audiovisuelle Medien einen umfangreichen Sicherungs- und Digitalisierungsplan für sein audiovisuelles Erbe umgesetzt. Ein großer Teil davon ist von Zerstörung wegen Alterung der Trägermaterialien und Obsoletwerdens der Formate und der Wiedergabegeräte bedroht. Parallel dazu wurde eine Methode zur Sicherung, Digitalisierung, Speicherung und den online Zugriff auf Bild und Ton entwickelt, der auf einem integrierten System für Massenspeicherung beruht.

En 1999, el instituto nacional de lo audiovisual lanzó un Plan de salvaguardia y de digitalización masiva de su patrimonio audiovisual, en la que una gran parte está amenazada de desaparición, en razón de la degradación de los soportes y de la obsolescencia de los formatos y de los aparatos de lectura. Paralelamente a este plan, fue instalado un dispositivo de salvaguardia, de digitalización, de almacenamiento y de comunicación en línea de las imágenes y de sonidos, que se apoyan en un sistema técnico integrado de almacenamiento de masa.

Le patrimoine audiovisuel de l’Institut national de l’audiovisuel (Ina) a deux origines : les fonds d’archives télévision et radio provenant des chaînes publiques – auxquels il faut ajouter un fonds d’actualités cinématographiques et un fonds photographique – et les fonds en provenance du dépôt légal. Les fonds professionnels des archives des chaînes publiques remontent aux années 1940 pour la radio et aux années 1950 pour la télévision. Ceux des actualités françaises couvrent les années 1940. Tous ces documents se trouvent donc sur des supports anciens qui ont été altérés au fil du temps.

Un plan de sauvegarde et de numérisation

L’Ina a pour mission de conserver et de mettre en valeur l’un des fonds d’archives radio et télévision parmi les plus anciens et les plus riches au monde. Cependant, la dégradation de certaines générations de supports menace une partie de ces fonds de disparition. Une course contre la montre est donc engagée pour préserver ce patrimoine. Pour relever ce défi, l’Ina a lancé en 1999 un plan de sauvegarde et de numérisation massif et systématique qui doit permettre de garantir la sauvegarde du fonds ancien, d’en faciliter l’exploitation et d’en améliorer l’accès, et répondre à sa mission de valorisation du patrimoine.

Sur un total de fonds patrimoniaux d’environ 1 300 000 heures, 830 000 heures sont menacées à des titres divers (dégradation du support, obsolescence des équipements de lecture…). La nature des menaces varie selon les supports. Les films, les bandes magnétiques vidéo ou sonores, les disques 78 tours à enregistrement direct de la radio ancienne sont soumis à toutes sortes de dégradations physiques, chimiques ou biologiques liées à la chaleur, l’humidité, les champignons ou les insectes. Des dégradations touchent aussi les films, et les bandes sonores associées, dont le matériau de construction était l’acétate de cellulose. Ils sont victimes d’une réaction chimique appelée « syndrome du vinaigre » pouvant aller jusqu’à la décomposition irréversible du support.

À ces causes s’ajoutent l’obsolescence des formats et des machines de lecture des bandes vidéo 2 pouces, 1 pouce et des cassettes vidéo 3/4 pouce, mais aussi la vulnérabilité des émissions enregistrées sur un support unique : 90 % pour la radio et 60 % pour la télévision.

La durée de vie des supports anciens dépend du niveau de dégradation constaté, de la durée prévisible de maintenance des machines permettant de les lire, liée à la possibilité de trouver des pièces de rechange comme les têtes de lecture des magnétoscopes, et des conditions de stockage : une température basse permet de freiner les processus de dégradation chimique. On a estimé à 2015 l’échéance maximale de traitement des fonds pour minimiser les risques de perte des contenus.

Le premier contrat d’objectifs et de moyens conclu avec l’État pour la période 2000-2004 a permis de définir les préalables nécessaires au processus de sauvegarde : nature des menaces, identification des volumes, stabilisation des normes et des technologies de traitement de masse. Entre 1999 et 2004, dans le cadre de ce premier contrat d’objectifs et de moyens, l’Ina a consacré sur ses fonds propres 36 millions d’euros à la sauvegarde des fonds. En 2005, en partie grâce à une augmentation de la dotation provenant de la redevance, 5 millions d’euros supplémentaires ont pu être consacrés à cette sauvegarde. Le volume d’heures traitées a ainsi augmenté de 60 % par rapport à la moyenne des trois années précédentes.

Toutefois, malgré ce saut quantitatif important, la projection jusqu’en 2015 du rythme de traitement effectué en 2005 ne permettait pas de garantir la sauvegarde de la totalité des fonds. Sur cette base, 75 % des collections seraient protégées, soit 100 % de la filière vidéo, 70 % de la filière film et 65 % de la filière radio.

Le nouveau contrat d’objectifs et de moyens, signé le 17 novembre 2005, a prolongé et consolidé les résultats acquis. La pérennisation de la dotation de redevance ouverte en 2005 et les compléments prévus les années suivantes impulsent, dès 2006, une nouvelle accélération de la sauvegarde et de la numérisation des fonds pour les porter à un niveau qui permettra la sauvegarde intégrale des collections à l’horizon de 2015.

Un système technique intégré de stockage de masse

En parallèle du plan de sauvegarde et de numérisation massif, l’Ina a mis en place, en 2001, un système technique intégré de stockage de masse d’images et de sons numérisés et un processus de travail qui permet :

  • de sauvegarder les fonds de l’Ina « à la volée ». Pour toute commande d’images, avant communication au client, le support correspondant est sauvegardé et numérisé. Le système utilise les mêmes formats de sauvegarde et de numérisation que ceux utilisés pour le plan pluriannuel de sauvegarde et de numérisation systématique. Ces formats sont le Betacam numérique comme master de sauvegarde, le MPEG2 à 8 Mb/s comme format d’exploitation broadcast pour les usages courants et le MPEG1 à 1,2 Mb/s pour la consultation en réseau ;
  • de stocker dans des bibliothèques numériques (disques durs et bandes informatiques) l’ensemble des programmes de télévision et de radio numérisés par l’Institut et/ou ses prestataires (soit, fin 2006, 295 000 heures de télévision et 68 000 heures de radio) ;
  • de visionner en ligne les documents numérisés pour l’ensemble des utilisateurs d’archives, qu’ils soient internes (documentalistes, commerciaux, juristes…) ou externes à l’Ina (clients, diffuseurs, producteurs..) sur le service Internet inamedia.com ou sur le service ina.fr destiné au grand public ;
  • de préparer la livraison des documents commandés au format souhaité par le client.

Ce dispositif répond ainsi aux deux missions des archives : la conservation et la communication.

Le processus est constitué de chaînes de sauvegarde, de chaînes de numérisation MPEG1 et 2, de serveurs de médias on line sur disques durs et, en robotique, de stockage near on line (d’accès plus lent) sur bandes informatiques – c’est le cœur du système –, de postes « client » de visionnage et, enfin, de stations de restitution pour la livraison des images au client.

Les fichiers MPEG1 et MPEG2 des images sont générés de manière synchrone par des chaînes automatisées à partir de robots Flexicarts. Les programmes sont lus avec lecteurs Betanum et IMX, qui permettent la lecture du Beta SP, du Beta SX et du Betacam (numérique) et encodés grâce à des cartes Optibase.

Les fichiers MPEG1 sont stockés de manière permanente sur serveurs « disque dur » et sont donc accessibles quasi instantanément. Les fichiers MPEG2 sont stockés sur bandes LTO 2 et 3 en robotique Adic. Ils sont accessibles en near on line, car le programme sélectionné doit d’abord être transféré sur serveur disque dur pour être utilisé. La gestion du stockage de masse est assurée par un logiciel appelé HSM (Hierarchical Storage Management). Une cassette LTO a une capacité de 400 Go et permet le stockage d’environ 107 heures de vidéo en format MPEG2.

L’histoire des formats et supports montre qu’il n’existe pas de format pérenne, tout au plus des formats qui durent plus que d’autres, et ceci aussi bien en analogique qu’en numérique. Le monde de l’informatique voit ses supports et ses formats évoluer très rapidement, beaucoup plus que dans le monde de la vidéo traditionnelle. Il est donc mieux préparé à gérer la migration de données d’un support à l’autre. Migrer de numérique en numérique sera de plus en plus rapide et toujours plus rapide que de passer de l’analogique au numérique. C’est aussi à la rapidité de ces évolutions que l’Ina devra faire face à l’avenir. En 2006, l’Ina a procédé avec succès à sa première migration numérique/numérique : 6 ans de travail de sauvegarde d’analogique vers le numérique ont pu être migrés de numérique en numérique en 5 mois.

Outre son action de collecte, de sauvegarde, de restauration et de commercialisation des archives audiovisuelles, l’Ina est également un laboratoire de recherche et le premier centre européen de formation (professionnelle et initiale) aux métiers de l’audiovisuel et du multimédia. Depuis février 2004, l’Ina propose aux professionnels un service unique au monde sur inamedia.com, première banque mondiale d’archives audio-visuelles numérisées et accessibles en ligne.

Enfin, depuis avril 2006, le grand public a un accès direct, en simple consultation ou en téléchargement, à plus de 100 000 émissions de télévision et de radio (voir l’article de Roei Amit « Ina.fr : archives pour tous », ci-après).

L’enjeu des années à venir, dans ce contexte numérique, sera bien la capacité à s’adapter et à répondre aux différents usages qui émergent quotidiennement dans le paysage audio-visuel français et international.

Janvier 2007