« Renforcer les compétences, partager les expériences… même à distance ! »

Journées CasuHAL – 7 au 11 juin 2021

Marie Arbelot

Florence Barré

Elizabeth Bernardo

Gaëlle Chancerel

Maëlle Maltaire

Pascale Solon

Du 7 au 11 juin 2021, la Maison des sciences de l’Homme SUD de Montpellier accueillait les journées CasuHAL en distanciel 1

. Olivier Tinland, son directeur, a ouvert l’événement en rappelant les valeurs partagées avec l’association : la promotion de l’interdisciplinarité, une recherche qui intègre les moyens et les fins sans les opposer, la nécessaire vigilance face aux opportunismes et enfin l’abolition des frontières entre science et société pour une coconstruction des savoirs.

Marin Dacos, conseiller science ouverte (SO) du directeur général de la recherche et de l’innovation au ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation (MESRI), a ensuite retracé la dynamique à l’œuvre depuis la promulgation du Plan national pour la science ouverte (PNSO) en 2018 au travers des trois axes : l’accès ouvert aux publications, aux données de la recherche et la transformation profonde des pratiques scientifiques. Près de 16 millions d’euros ont été dégagés pour soutenir les actions du plan et le Fonds national pour la science ouverte (FNSO) joue un rôle structurant tout comme les infrastructures de recherche françaises. Le contexte mondial en faveur de la SO est également favorable et l’on citera les recommandations de l’Unesco, le European Open Science Cloud (EOSC) et les appels à projets Horizon Europe. À l’échelle nationale, les labels IDEX et I-SITE sont également des leviers de poids. En matière de publications, le baromètre de la SO a bondi de 17 points entre 2017 et 2021 (58 % de libre accès des publications comportant un DOI et au moins un auteur français affilié). Marin Dacos a rappelé que le but n’est pas de mettre en danger le processus éditorial avec révision par les pairs, mais d’élargir l’écosystème de publication et de renforcer la bibliodiversité dans un contexte de compétition internationale qui tend vers un renforcement des logiques de verrouillage par un petit nombre d’acteurs commerciaux monopolistiques.

Nathalie Fargier, directrice du Centre pour la communication scientifique directe (CCSD) a clos cette introduction en rappelant le rôle pivot de l’archive ouverte nationale HAL et son rôle moteur des politiques SO. Avec près de 180 portails et 9 000 collections, HAL représente aujourd’hui 900 000 documents en texte intégral, 74 000 utilisateurs actifs et 60 millions de téléchargements. La nouvelle gouvernance et son modèle de financement s’orientent vers des objectifs ciblés pour donner au CCSD une vision pluriannuelle.

Actu-HAL-ités du CCSD

Bruno Marmol et Bénédicte Kuntziger du CCSD ont passé en revue les activités courantes de l’année passée, comme la modération des dépôts et la fonction support (réponse aux tickets et développements d’une offre de formations) pour ensuite faire le point sur les chantiers achevés, comme l’intégration des références et fichiers des archives ouvertes ProdINRA (Institut national de la recherche agronomique [INRA]) et CemOA (Institut national de recherche en sciences et technologies pour l’environnement et l’agriculture [IRSTEA]) dans HAL. Pour les projets en cours, on retiendra la refonte de plusieurs référentiels, l’évolution de l’interface utilisateur de HAL qui a donné lieu à une étude ergonomique après consultation des représentants des utilisateurs, la prise en compte de la nouvelle version de Sherpa Romeo qui recense les politiques libre accès des éditeurs et des revues ainsi que le travail avec Software Heritage sur le dépôt de logiciels.

Identifiants et référentiels

S’appuyer sur des référentiels fiables et interconnectés pour garantir la qualité des dépôts et leur enrichissement mutuel est essentiel. La question de l’identification des auteurs, des documents et des structures est donc l’un des grands enjeux des archives ouvertes. Les administrateurs de portail HAL, gestionnaires de collections et référents structures sont fortement impliqués dans la fiabilisation des données auteurs, structures et revues. Les interventions sur le nouveau référentiel auteur de HAL, sur les liens entre IdRef et AURéHAL et sur ORCID ont naturellement été très suivies.

Permettre une gestion facile et efficace des formes auteurs dans AURéHAL est l’objectif principal de la refonte profonde du référentiel auteur de HAL. Bruno Marmol et Léa Pérez (CCSD) ont ouvert la phase test du référentiel avant son déploiement prévu fin 2021-début 2022. Le but est de créer un réservoir de formes auteurs uniques afin de gérer plus simplement les problématiques d’homonymies et d’assurer une identification forte de tous les auteurs (même non-utilisateurs et sans IdHAL). Cela passe notamment par l’alignement avec des identifiants externes, comme ORCID et IdRef.

Positionnant IdRef comme un identifiant pivot de la recherche française, l’Agence bibliographique de l’enseignement supérieur (Abes) est engagée depuis plusieurs années dans l’intégration des données de HAL dans IdRef grâce à l’alignement des identifiants auteurs. Depuis mars 2021, data.idref.fr est progressivement alimenté de triplets associant des publications HAL à leurs auteurs décrits dans IdRef. François Mistral et Aline Le Provost (Abes) ont exposé cette démarche collaborative (Abes - établissements dotés d’un portail HAL) valorisant l’enrichissement et la qualité des métadonnées auteurs. Le prototype PaprikHAL, développé à partir de l’outil Paprika, assure le contrôle qualité des autorités de personnes. L’application, alliant traitement automatisé et manuel, permet de travailler sur les alignements d’AURéHAL et d’IdRef, notamment sur des formes auteurs sans IdHAL.

Le rapprochement avec ORCID s’inscrit dans une stratégie plus globale sur les identifiants. Isabelle Mauger Pérez (Abes), André Dazy (Couperin), Luc Bellier et Henri Bretel (université Paris-Saclay) ont présenté le consortium ORCID-France et ses enjeux. ORCID, association internationale à but non lucratif, propose un identifiant répondant aux critères SO aux chercheurs, et une gamme de services (Application Programming Interface [API] gratuites ou payantes) aux institutions. ORCID-France vise à faciliter les échanges entre l’organisation et les établissements français et à renforcer la visibilité de la recherche française à l’international.

Politiques SO : outils et promotion

Dès 2022, dans le cadre du Plan S, il sera obligatoire de déposer sur HAL, sans embargo, le texte intégral d’un article issu d’un projet de recherche financé par l’Agence nationale de la recherche (ANR), membre de la cOAlition S. Les dispositions ambitieuses du plan pourraient amener de profonds changements dans le domaine de l’édition scientifique et de la recherche. L’atelier « Plan S, implications pour les chercheur.es et les professionnel.les IST » de Noémie Musnik (Sciences Po) et Isabelle Gras (Aix-Marseille université) a été l’occasion de discuter des dix principes de base de ce plan et de lancer des pistes de réflexion pour accompagner les chercheurs. Les nombreux échanges ont témoigné des questionnements autour des politiques SO et du rôle déterminant des professionnels information scientifique et technique (IST) dans leur mise en œuvre et la réussite de ce plan.

Le baromètre de la science ouverte (BSO) permet cet accompagnement. Créé en 2019 par le MESRI, il fournit le pourcentage de publications en accès ouvert chez les éditeurs ou sur une archive ouverte, globalement et par discipline. Pierre Diaz (École des Mines Albi), Marie-Emilia Herbet (université Lyon 1), et Gemma Davies (université Bretagne Occidentale) ont partagé leurs expériences de mise en place d’un BSO mobilisant compétences documentaires et informatiques.

Ces indicateurs pour le pilotage de la recherche sont essentiels à la communication concernant l’activité de l’Université et de ses chercheurs et permettent de se positionner par rapport au BSO national.

L’atelier « Valorisation du logiciel open source via HAL et Software Heritage » a rappelé que la SO ne se réduit pas au libre accès des publications mais que tous les produits de la recherche sont concernés. Grâce à une collaboration CCSD - INRIA - Software Heritage, les codes source de logiciels peuvent être déposés sur HAL depuis 2018. Jozéfina Sadowska, Estelle Nivault (INRIA) et Morane Gruenpeter (Software Heritage) ont présenté les étapes d’un dépôt permettant ainsi de comprendre les enjeux autour de l’identification et de la citation de ces fichiers.

La plateforme Sherpa Romeo recense et analyse les politiques libre accès de près de 5 000 revues. Le réseau Mir@bel signale les revues accessibles en ligne à partir des données de Sherpa Romeo. Mir@bel recense également les politiques libre accès des revues françaises et leur versement dans Sherpa Romeo est prévu à l’automne 2021. Bernard Teissier (ENTPE Lyon), Pierre Gravier (Sciences Po Lyon) et Armelle Thomas (MSH Dijon) ont présenté des cas pratiques pour mieux comprendre la lecture des informations dans Mir@bel et dans Sherpa Romeo.

La promotion de la SO passe aussi par des moments conviviaux où professionnels de l’IST, doctorants, chercheurs, grand public… se retrouvent le temps d’un jeu. Les volontaires ont participé à l’atelier « à l’asSO » avec Caroline-Sophie Donati et Isabelle Gras (Aix-Marseille université) et lors de l’atelier « Former à la science ouverte par le jeu », Cécile Boussou (Centre de coopération internationale en recherche [CIRAD]), Nicolas Alarcon (université de La Réunion), Cyril Heude (Sciences Po Paris) ont présenté « Libérez la science » et l’escape game « Science à cœur ouvert ». D’autres exemples de pédagogie active et ludique autour des enjeux SO existent : quizz, escape game, jeu de plateau, autant de moments qui stimulent des situations de communications nouvelles. Beaucoup sont sous licence CC-BY sur la plateforme Zenodo. Alors à vos pions !

Les outils techniques de HAL : un écosystème riche

Afin de faciliter les missions des gestionnaires de HAL, des collègues de différents établissements ont mis au point des outils ou pratiques permettant la curation des données, l’extraction ou encore les statistiques. Petit tour d’horizon des différents ateliers présentés : Alain Monteil (Institut national de recherche en sciences et technologies du numérique [INRIA]) a développé X2HAL dont il a fait la démonstration lors de l’atelier « X2HAL : bibtex et XML-TEI ». L’outil sert à importer massivement des données et des fichiers lors de migrations ou de rétro-dépôts dans HAL.

OCdHAL développé par Patricia Reynier et Pascal Bellemain (CNRS), est une application web présentée sous la forme d’un tableur dynamique, qui permet de gérer efficacement les données, de produire des statistiques ou encore de réaliser des extractions de listes. La documentation régulièrement mise à jour est disponible en ligne. Sur OCDHAL, Mélanie Karli et Anthony Herrada (université de Montpellier) ont fait un focus sur « Gérer les doublons et les IdHAL de sa collection avec OCDHAL ». À noter, les droits afférents sont identiques à ceux de HAL.

Pour traiter un souci récurrent, Manon Le Guénnec (université Paris Nanterre) a établi une procédure, qui permet de « Veiller sur les dépôts non affiliés à sa structure dans HAL », grâce à des tableurs, requêtes API et un portail Netvibes.

Pour « Extraire des listes de publications pour les évaluations HCERES », plusieurs étapes préparatoires sont nécessaires. Les retours d’expérience de Julien Baudry (université Bordeaux Montaigne) et Gaëlle Chancerel (université de Pau et des Pays de l’Adour) ont balayé les enjeux du rétro planning, du nettoyage des données, les passerelles entre OCdHAL et ExtrHAL… afin d’arriver aux attendus de l’annexe 4 du rapport HCERES.

Avec « Kibana et autres outils d’extraction », Nicolas Alarcon (université de La Réunion) et Brigitte Bidegaray-Fesquet (université Grenoble-Alpes) ont présenté comment, grâce à des tableaux de bord prédéfinis, on peut extraire statistiques, graphiques et cartographies afin d’établir des rapports annuels et répondre à des enquêtes. Son utilisation doit être faite avec prudence, chaque modification entraînant un effet domino sur les autres tableaux.

Identifier et personnaliser sa collection et son portail est également essentiel pour la visibilité de la recherche. C’est ce que permet le travail sur les feuilles de style, avec le langage informatique CSS. Grâce au travail de Caroline Bauer (Paris School of Economics), « Améliorer le rendu visuel de sa collection/portail en modifiant simplement le CSS », celui-ci est bien plus accessible et des trames sont à la disposition de chacun.

Limites et astuces sont à découvrir en consultant les enregistrements et documents mis à disposition de tous suite aux journées CasuHal.

En quoi la science ouverte change-t-elle les pratiques des chercheur.es ?

Deux tables rondes réunissant des acteurs politiques 2

X

Martine Garnier-Rizet (responsable du département Numérique et Mathématiques de l'ANR), Anne Laurent (vice-présidente déléguée à la science ouverte et aux données de la recherche à l'université de Montpellier), Lionel Maurel (directeur adjoint scientifique à l’Institut des sciences sociales du CNRS), Michel Pohl (Directeur IST de l'Inserm), Sylvie Rousset (directrice des données ouvertes de la recherche-CNRS).

et des chercheurs de différentes disciplines 3
X

Pierre Bonnet (CIRAD), Denis Bourguet (Institut national de recherche pour l'agriculture, l'alimentation et l'environnement [INRAE]), Kenneth Maussang (université de Montpellier), Maurine Montagnat (université Grenoble Alpes), Didier Plassard et Paul Robert (université Paul Valéry Montpellier).

ont débattu de ces enjeux. Dépôt obligatoire du texte intégral ou mesures incitatives, les politiques diffèrent en fonction des établissements et la sensibilisation accrue des chercheurs aux enjeux de la SO par les politiques et les professionnels de l’IST est déterminante pour accompagner la transition en cours.

Sur l’ouverture des publications, les intervenants plaident pour la bibliodiversité : archives ouvertes, revues en accès ouvert sans frais, modèles « Diamant » contrôlés par la communauté académique. Le FNSO soutient les modèles éditoriaux alternatifs. Mais la concurrence dans certaines disciplines reste un frein avec un consentement à payer des Articles processing charges (APC, frais de publication) élevés aux journaux à forte notoriété.

Toutefois, des pratiques alternatives de publication sont en plein essor, comme les épi-revues ou les preprints de Peer Community In (PCI), avec un changement de paradigme en matière d’évaluation de la recherche basé sur le Publish-Review-Curate. Si la Declaration on Research Assessment (DORA) de San Francisco reste un pilier et que le critère de qualité tend à pondérer la quantité dans les évaluations en France, le chercheur se heurte encore à la réalité du système et au facteur d’impact des grands éditeurs.

Ceux-ci ont également des visées économiques sur les données de la recherche, incitant donc à la vigilance. Sur la question de l’intégrité scientifique et de la nécessaire publication des données négatives, des plateformes comme DATACC ont été citées comme initiatives à soutenir.

Parallèlement aux questions encore en suspens (stockage de grands volumes, choix des données à conserver), le rôle des infrastructures a été rappelé : Doranum, Opidor, HumaNum et le futur entrepôt national, mais également le nécessaire triptyque projet-publication-données garantissant les principes FAIR avec les data papers et l’exemple du projet PuppetPlays, sur les théâtres de marionnettes.

Ce projet et celui de Pl@ntNet sur la biodiversité végétale clôturaient cette journée sur le thème de l’articulation entre sciences et société. La coconstruction des savoirs et le copartage de données d’intérêt public offrent aussi à la SO une dimension participative et citoyenne.

Alors que HAL va fêter ses 20 ans, le chemin parcouru est remarquable avec, entre autres, jalons forts, la loi pour une République numérique (2016), le Plan national Science ouverte (2018) suivi par le Plan S. Le mouvement de la SO est devenu une politique incarnée dans les actions des institutions publiques. Elle est en même temps revendiquée par des chercheurs qui reprennent le contrôle de leurs recherches en inventant un écosystème alternatif. Ces journées sont le reflet de la dynamique à l’œuvre et de la motivation de tous les acteurs quel que soit leur rôle. Avec près de 600 participants, 48 intervenants, une trentaine de visioconférences (plénières et ateliers), ces rencontres ont été riches d’informations et de partages. Le CasuHALathon (marathon de dépôt du texte intégral dans HAL) en est la preuve avec 12 361 fichiers déposés. Parce que la science ouverte est une lame de fond mondiale et que les projets ne manquent pas, les journées CasuHAL ont encore de belles années devant elles. En attendant, rendez-vous sur la liste !

Tous les contenus publiés sur le site du Bulletin des bibliothèques de France sont placés sous licence libre CC BY-NC-ND 2.0 : Attribution – Pas d’utilisation commerciale – Pas de modification 2.0 France.