Mémoire numérique : publics, ressources et bibliothèques en mutation
Journée d’étude Médiadix – 10 octobre 2014
La journée d’étude co-organisée par Médiadix et l’URFIST de Paris traitait de la problématique des données (personnelles, patrimoniales et académiques) et de la place des professionnels de l’information face aux questions posées par celles-ci.
Les données personnelles :
traces captées, traces éditorialisées
Le premier éclairage a été proposé par Louise Merzeau enseignante-chercheuse en sciences de l’information et de la communication (université Paris Ouest Nanterre La Défense). Aujourd’hui, on observe que les offres de contenus proposent à chacun une information de plus en plus personnalisée. Les schémas de communication et de pertinence sont alors bouleversés : l’utilisation n’est plus le point d’arrivée de la communication, mais elle est intégrée dans le processus de communication car elle contribue à restructurer l’information (par exemple Twitter sert d’outil de communication mais aussi d’outil de veille). L’information est donc de plus en plus fragmentée afin d’être utilisée dans des environnements différents. La notion d’éditorialisation intervient à ce moment-là car elle permet de produire de nouveaux contenus et d’avoir des espaces de mémoire communs.
La personnalisation de l’information équivaut à un passage des « signes » aux « traces ». En effet, tous les objets quotidiens sont devenus des objets qui traitent de l’information mais qui laissent aussi des traces (titre de transport, carte bleue…) à différents niveaux : comportements, réputations, documentations.
On est dans un univers où chaque fragment d’information contient des métadonnées. Avec toutes les traces récoltées, il est aisé de savoir par avance comment les individus vont se comporter.
Les réseaux sociaux et outils 2.0 peuvent-ils assurer
la pérennité des données des chercheurs ?
Odile Contat (CNRS) a abordé le fait que le numérique est un outil de communication important pour les chercheurs. Il existe différents réseaux sociaux (généraliste, professionnel, académique et académique thématique). Deux réseaux sociaux ont été mis en évidence lors de la présentation : Research-Gate et Academia.edu, actuellement les plus utilisés par la communauté académique. L’intérêt de ces réseaux est de permettre aux chercheurs de communiquer, de faire de la veille, d’être présents. Toutefois, ils ont des limites. En effet, ils cèdent les données à des entreprises privées qui peuvent alors les diffuser sans le consentement des chercheurs. En outre, la pérennité des données n’est pas garantie car ce n’est pas un système d’archives ouvertes.
Pour les professionnels de l’information, il est donc important de promouvoir les outils institutionnels répondant à des critères de pérennité des données sans toutefois négliger, pour une question de visibilité, ces réseaux.
Quid des collections audiovisuelles
à l’heure du numérique ?
Dominique Théron, qui travaille au département Audiovisuel de la BnF, rappelle que les collections audiovisuelles ont été d’abord basées sur des supports analogiques puis sur des supports numériques.
L’avantage du numérique est d’être reproductible et portable, d’avoir une (relative) homogénéité des supports, mais aussi de permettre une identification et des tris plus aisés grâce aux métadonnées.
La diversité des supports rend urgente les actions de sauvegarde. Celles-ci sont enclenchées dès que les supports se dégradent ou lorsque le matériel devient obsolète. Les supports, physiques ou non, peuvent alors être remplacés par des fichiers numériques qui seront convertis si nécessaire dans un format plus répandu afin de garantir la pérennité des données. L’objectif est de conserver pour continuer à communiquer.
C’est dans cette optique que la BnF s’est dotée d’un outil pour préserver l’archivage numérique : SPAR (système de préservation et d’archivage réparti). Il anticipe les recopies avant la perte définitive des données.
Collecte, conservation
et communication des archives du web
Sophie Derrot (BnF) a abordé la collecte et la conservation des données provenant du web.
Dans le cadre du dépôt légal du web à la BnF, des robots parcourent l’internet français à partir d’URL de départ pour capturer, enregistrer le code source du site web. Il existe deux modes de collecte qui se complètent : larges et ciblées. Toutefois, ces collectes ont des limites. En effet, la masse des contenus, les contenus accessibles seulement sur identification, les erreurs, ne permettent pas de tout collecter.
La BnF stocke les données sur des disques durs mais aussi dans le système d’archivage de la BnF : SPAR, pour une conservation pérenne.
Toutes ces archives peuvent être consultées mais de manière restreinte (accréditation dans les espaces de niveau recherche…). Outre leurs utilisations pour la recherche, l’objectif de ces archives du web est de valoriser le patrimoine, d’organiser des actions pédagogiques ou encore de proposer des parcours guidés.
Les données numériques de la recherche
Esther Dzalé Yeumo Kaboré (INRA) rappelle que les données numériques ont un cycle de vie : création, traitement, analyse, conservation, mise à disposition et réutilisation de celles-ci. Le but étant de pouvoir les récupérer, d’éviter leur perte et ainsi de ne pas répéter les expérimentations.
Mais les chercheurs émettent quelques réserves. Ils ne sont pas formés pour la gestion de données et sont parfois sceptiques quant à l’utilité de celles-ci dans le temps.
Il existe aussi un frein organisationnel et technique au niveau des pratiques de gestion et de préservation des données, souvent très différentes, et à cause d’un manque d’incitation assez répandu.
La transformation numérique, un facteur de convergence des professionnels de l’information
Florence Gicquel (École de bibliothécaires documentalistes – EBD) a abordé la transformation numérique. Cette notion, apparue en 2010, interroge les mutations et les modifications qu’apporte la technologie numérique pour ouvrir de nouvelles voies à des manières différentes de travailler.
Elle a présenté les résultats d’une enquête réalisée par Knowledge Consult et l’EBD sur la manière dont les données et contenus sont pris en compte dans les organisations à l’heure de la transformation numérique. Il s’avère qu’il existe une multitude et une hétérogénéité de dispositifs de gestion de données et de contenus. Par exemple, l’information est encore souvent produite sans envisager son devenir. Pour modifier cela, il est important que des formations soient proposées pour renforcer les compétences des professionnels de l’information, tant sur le cœur de métier que sur les éléments périphériques (management, accompagnement…).