Colloque ADBU-AEF
« Quelle(s) stratégie(s) de recherche face à la nouvelle massification des données ? » – Paris, auditorium de la Bulac, 2 décembre 2014
Afin de questionner et d’analyser les enjeux pour la recherche et les stratégies d’innovation face à la massification des données, l’ADBU et l’AEF ont organisé un colloque le mardi 2 décembre 2014 à Paris. Cette rencontre a été divisée en quatre sessions. La première session posait la problématique, à la fois technique et juridique, de la massification des données. La deuxième session abordait l’Open Science. La troisième session portait sur la politique des éditeurs face aux stratégies de recherche. Enfin, la quatrième session discutait des stratégies de la recherche face à la massification des données.
Problématiques technique et juridique
de la massification des données
Les aspects techniques de la massification des données ont été abordés par Christophe Pérales (président de l’ADBU) et Gildas Illien (directeur de l’information bibliographique et numérique à la BNF), avec les témoignages des chercheurs Françoise Genova (directrice du centre de données astronomiques de Strasbourg) et Jérôme Weinbach (directeur scientifique et opérationnel du programme national cohortes maladies rares RaDiCo).
Ils ont identifié trois enjeux posés par les données numériques. Le premier concerne la conservation des données. À la différence de la conservation des livres en version papier, celle des livres numériques demande l’anticipation de l’ensemble du cycle de vie numérique, en termes de dispositifs de lecture et de logiciels. Cela permettra d’assurer le stockage et son utilisation à long terme. Le deuxième enjeu porte sur la documentation et la structuration des données. On est passé des catalogues reliés qui étaient des livres sur les livres, à l’informatisation des catalogues. Ce qui bascule avec la numérisation, c’est la gestion de l’information des catalogues, qui servait à l’organisation de la gestion interne pour donner ensuite accès au public. Cette information peut aujourd’hui être automatisée et utilisée pour fabriquer des liens sur le web. Le troisième enjeu est le partage des données. Hier, on dupliquait pour partager : aujourd’hui, on peut lier les données grâce au web sémantique. Il est donc possible de mettre en relation des données construites dans des contextes différents, à condition d’avoir des identifiants communs et des données sources de qualité.
Venant de disciplines différentes mais étant confrontés à des problématiques qui se rejoignent, les chercheurs ont constaté qu’il s’agit également d’un enjeu scientifique. Dans le cas de l’astronomie, on dispose de grands instruments qui produisent des données assez homogènes, mais il est nécessaire de les décrire et de créer une infrastructure de données. Dans le domaine biomédical, on a de nouvelles sources qui se multiplient (la recherche thérapeutique, les dossiers informatisés des patients, les images médicales, entre autres) mais on éprouve une difficulté à appliquer les outils modernes qui se confrontent aux méthodes traditionnelles de gestion des données. Ces chercheurs soulignent la nécessité d’un travail interdisciplinaire qui intègre des professionnels d’autres domaines : des informaticiens, des spécialistes des bibliothèques, mais aussi des juristes, afin de pouvoir travailler sur les données dans un climat de confiance et en accord avec la législation en vigueur.
Les aspects juridiques de la massification des données ont été abordés par Lionel Maurel (juriste et bibliothécaire à la BDIC – Bibliothèque de documentation internationale contemporaine –, animateur du blog S.I.Lex) et par Sarah Jones (Senior Institutional Support Officer, DCC du JISC, université de Glasgow). L. Maurel a souligné qu’avant l’arrivée du numérique, les données et les informations n’étaient pas un objet du droit en tant que tel, car il n’y avait pas de restrictions juridiques de leur usage. Le numérique a été l’occasion de développer l’usage de données et de l’information informatisée, et au niveau juridique, de revenir sur cet état initial. Ainsi, les juristes considèrent que les idées, les faits et les données restent de « libre parcours », mais dès qu’ils deviennent une création, ils sont protégés. Cela n’empêche pas que les idées et les informations contenues dans cette création restent, elles, de libre parcours. On peut ainsi construire à partir de données et de l’information, et cela est fondamental pour la liberté de la recherche. L. Maurel observe qu’avec l’arrivée du numérique tout a changé. Les opérations d’extraction mentale des données peuvent être augmentées par des moyens technologiques, en permettant de faire des traitements de données à grande échelle à travers la copie de l’information obtenue dans les bases. Pourtant, cette information est protégée par le droit d’auteur. Les éditeurs scientifiques font ainsi valoir leur droit en créant des licences pour encadrer les usages.
Cependant, il existe certaines ouvertures à ces objections juridiques. Aux États-Unis, l’exploration des données est considérée comme un usage transformatif couvert par l’usage équitable, y compris dans le cadre commercial. Jones a présenté le cas de l’Angleterre, où l’exception de copyright permet aux chercheurs de faire des copies de matériel protégé sans avoir besoin d’obtenir d’autorisation de droit d’auteur. L. Maurel s’interroge : faut-il attendre que les cadres juridiques et législatifs au niveau européen changent pour pouvoir agir ? Il répond qu’une piste exploitable est d’ouvrir les données à la base, ce qui dans le cadre de la recherche se traduit par le développement de l’Open Science.
Open Science : une exigence scientifique et démocratique
Renaud Fabre (directeur de l’IST du CNRS) et Jean Chambaz (président de l’UPMC – université Pierre-et-Marie-Curie Paris 6) ont déclaré que l’Open Science est une exigence scientifique et démocratique. Ils ont reconnu que les disciplines travaillent à des rythmes différents quant à l’avancement du partage des connaissances, et que la France et le CNRS en particulier sont en retard sur cette question. Des contraintes budgétaires et juridiques expliquant ce ralentissement. Cependant, ils considèrent que l’accès à l’Open Science est un processus irréversible.
Ils ont distingué trois éléments essentiels pour mettre en place l’Open Science. Tout d’abord, il faut mobiliser les chercheurs pour partager les connaissances. Ensuite, il faut articuler l’interdisciplinarité et l’interopérabilité avec l’intégration de nouveaux métiers (tels que l’analyse de données) et la création de plateformes. Enfin, les solutions doivent être saisies de manière collective, non seulement au niveau national, mais également au niveau européen.
Les éditeurs face aux stratégies de recherche
Cette session a débuté avec une série de remarques de Marie Farge (physicienne, directrice de recherche, CNRS) sur les éditeurs. Marie Farge a expliqué que les chercheurs assurent à titre gracieux l’évaluation des articles de leurs pairs. Une fois l’article accepté, il passe aux mains des éditeurs. Marie Farge critique le fait que les auteurs des articles sélectionnés cèdent leur copyright gratuitement, alors que la revue appartient aux éditeurs et que ce sont eux qui la vendent la revue aux institutions. Elle a souligné que les chercheurs souhaiteraient garder leur copyright et disposer de leurs articles en accès ouvert. Ils voudraient également que les revues appartiennent aux comités éditoriaux, en gardant le caractère bénévole des chercheurs impliqués. Dans cette perspective, l’argent public devrait financer les plateformes éditoriales, développées en logiciel ouvert et libre. Sur ce point, il est nécessaire de compter sur l’apport des bibliothécaires pour aider à publier et à diffuser la connaissance, et des éditeurs en tant qu’experts de la publication.
Valérie Thiel Mba (Regional Solution Sales Director Europe, Research Intelligence, Elsevier) et Mondane Marchand (Sales Manager Europe TR Scientifique & Scholarly Research, Thomson Reuters) observent que la France n’est pas assez visible au niveau de la recherche internationale. V. Thiel Mba a constaté que le monde de la recherche évolue et les éditeurs s’adaptent à ces changements : tout en maintenant leur rôle éditorial, ils développent également des outils pour être au pilotage de la recherche et pour que les chercheurs soient en contact. Dans cette nouvelle approche, l’utilisateur est ainsi au centre, et l’objectif est d’aider les chercheurs à gérer leurs réseaux et leurs ressources, ce qui aura un impact sur la qualité de la recherche. Pour sa part, M. Marchand a insisté sur le fait qu’il faut travailler ensemble pour valoriser la signature des articles, et que les éditeurs doivent être des intermédiaires pour valoriser les contenus, les chercheurs et les institutions.
Les stratégies de recherche à l’heure des mutations
La dernière session a été prise en charge par des responsables d’institutions de recherche : Alain Beretz (président de l’université de Strasbourg – Unistra – et de LERU – League of European Research Universities), Jean-Pierre Finance (délégué permanent pour la Conférence des présidents d’université, CPU, à Bruxelles) et Francis Jutand (directeur scientifique de l’Institut Mines Télécom, membre du Conseil national du numérique et coordinateur de l’ouvrage collectif La métamorphose numérique). Avec des points de vue différents et des préoccupations diverses, ces responsables ont affirmé que l’accès ouvert aux données est un phénomène complexe. Il entraîne un changement d’attitude et un nouveau mode de recherche. En outre, la science devient plus transparente et plus ouverte vers la société.
A. Beretz a présenté l’expérience de la création d’Archives Ouvertes de la Connaissance. Il s’agit d’un projet piloté par l’université de Strasbourg qui permettra la valorisation et la visibilité de la recherche produite en Alsace. F. Jutand a affirmé qu’une bonne idée doit être mise à l’expérimentation avant d’être multipliée : il faut observer comment l’accès aux données permettra de faire avancer la science. Selon lui, même si l’accès aux données peut être très positif pour la recherche, il faut aussi se méfier des conséquences qu’il peut y avoir là où on ne s’y attend pas. Pour sa part, J.-P. Finance a insisté sur le fait que l’accès aux libres données fait partie d’un changement majeur dans les pratiques des chercheurs et des bibliothécaires, et que cette ouverture permettra de comparer des informations, de les croiser, et d’enrichir ainsi la recherche.
Pour clôturer le colloque, Alain Abécassis (MENESR) est intervenu en observant que si la France est en retard dans le domaine de l’accès aux données, le décalage n’est pas énorme. Dans ce contexte évolutif, les incertitudes sont partagées par tous les acteurs nationaux, internationaux, privés et publics. Les premiers acteurs et bénéficiaires concernés sont les chercheurs. Le deuxième groupe d’acteurs est constitué par l’ensemble des métiers d’accompagnement et de soutien à la recherche, c’est-à-dire les professionnels de la documentation, des archives et des bibliothèques. Le troisième groupe d’acteurs, ce sont les institutions, notamment les laboratoires et les organismes auxquels ils appartiennent. Parmi les institutions, il ne faut pas oublier le rôle de l’État, mais A. Abécassis reconnaît que c’est un rôle plutôt modeste face aux incertitudes juridiques que pose l’ouverture des données.