3es journées CasuHal

Rouen, 17 et 18 juin 2019

Julien Baudry

Gaëlle Chancerel

Maxence Larrieu

Colette Orange

Pascale Nalon

L’association CasuHAL a vu le jour en septembre 2016. Son rôle est multiple : passeur d’information entre les institutions utilisant l’archive ouverte HAL, force de proposition pour ses demandes de développement auprès du Centre pour la communication scientifique directe (CCSD) 1, acteur dans les décisions stratégiques… Depuis trois ans, c’est aussi une extraordinaire fédération des utilisateurs de l’archive ouverte nationale autour des journées organisées par l’association.

Après la Maison des Sciences de l’homme de Dijon l’année passée, c’est la ComUE Normandie Université qui a accueilli ces 3es Journées. Si celles tenues dans la capitale bourguignonne s’articulaient autour de la science ouverte dans le contexte de la loi pour une République numérique, les journées normandes faisaient la part belle à la pratique. Les quelque 140 participants auront eu (non sans cas de conscience) à choisir entre les douze ateliers proposés : fonctionnalités de l’archive, actions de médiation, outils connexes développés par la communauté… Les sessions s’adressaient aussi bien aux utilisateurs débutants qu’aux plus aguerris.

Illustration
Sketchnote de synthèse des ateliers CasuHal.

Débuter dans HAL

Il est parfois difficile de se lancer dans son nouveau portail ou sa nouvelle collection. Malgré une aide pourtant bien fournie, entre les formations d’initiation du CCSD, la documentation en ligne de HAL et le wiki des membres de CasuHal, les questions qui se posent au démarrage peuvent être nombreuses. Deux ateliers pouvaient ainsi s’adresser particulièrement aux « nouveaux » de la communauté.

L’atelier « DémHALrrer sur HAL et AureHAL » s’intéressait à un sujet bien connu de la profession : les affiliations ou autorités « structures ». L’enjeu pour chaque administrateur est, en effet, de s’assurer que les auteurs soient correctement affiliés à leur structure de recherche, en évitant l’écueil du doublon. Aussi, sous la forme d’un jeu de cartes, il s’agissait de regrouper chaque structure selon la typologie de HAL : institution, laboratoire ou équipe de recherche. Cyril Heude, Valérie Ricoux (université Paris Descartes) et Héloïse Marill (université Paris Diderot) présentaient le résultat de leur réflexion ayant donné lieu à un vade-mecum pour accorder des usages parfois distincts.

L’atelier « Habillez votre portail/collection avec HTML/CSS » offrait une perspective plus technique mais bien utile pour qui veut donner du cachet au design de son portail HAL ! Simple et fonctionnel, l’habillage par défaut est à la portée de tous. L’atelier, mené par Amandine Lustrement (CentraleSupélec), montrait qu’il est possible d’aller beaucoup plus loin en personnalisant le style. Couleur, police, bordure, widgets : les modifications sont nombreuses… Après une (nécessaire) initiation au langage CSS qui permet de définir le style et la mise en forme (tout un monde de balises, d’attributs et de HTML), les participants sont passés à la pratique à l’aide de tutoriels et d’exercices que l’on peut retrouver en grande partie en ligne.

Promotion, sensibilisation et modération

Les administrateurs le savent : un portail d’archives ouvertes n’est rien sans ce travail de fond auprès des laboratoires et de leurs membres. Il restera sinon, pour toujours, une coquille vide. Lors des journées CasuHAL, les anecdotes sur les difficultés surmontées (ou non) pour faire adhérer sa communauté de chercheurs circulent dans les couloirs et pendant les pauses.

L’atelier « Promouvoir l’Open Access » délivrait un message essentiel : HAL est un outil au service de la science ouverte et de la diffusion la plus libre possible des produits de la recherche. L’objectif est de montrer aux chercheurs que s’engager dans la voie du libre accès n’est pas une perte de temps ou une lubie administrative. Mais comment les convaincre ? En mettant les outils de la communication au service de la cause… Les animateurs de l’atelier, Marie Garambois (Sorbonne Université) et François Gibier (université de Montpellier), ont apporté aux participants quelques conseils : faire des fiches pratiques, distribuer des goodies lors des ateliers, réaliser des vidéos d’interviews de chercheurs, ajouter son propre CV Hal dans sa signature de mail… Et surtout, surtout, ne jamais cesser de répéter « DébHALlez vos publis » avec enthousiasme. Les participants ont ainsi eu l’occasion de créer et de voter pour des slogans, en partant de l’idée que les accroches trop institutionnelles ne rencontrent pas forcément de succès. Des exemples ? « Je publie, je partage », « Libérez, délivrez… vos papiers et vos données ! », « Ramène ta science ». Pour trouver le meilleur slogan ? Ne pas réfléchir !

Isabelle Gras (Aix-Marseille Université) et Céline Chuitton (université du Havre) animaient un atelier participatif très utile de partage d’expériences et de questionnements : « Former les chercheurs à HAL pour le meilleur et pour le pire ». Les témoignages ont permis de pointer les obstacles à surmonter : la complexité à parler des critères juridiques, les déplacements dans les laboratoires, coûteux en temps mais nécessaires, l’impératif de convaincre le chercheur. L’objectif de varier les plaisirs du formateur est aussi essentiel. Il existe plusieurs options à la traditionnelle formation en présentiel. Citons par exemple la « HAL party » ou « Halathon » (faire déposer le plus de références aux chercheurs présents pendant une après-midi), le « Café HAL » (un échange plus informel autour d’un café) ou la permanence physique dans les laboratoires. Et pourquoi pas des jeux et du fun… Les présentations se « préparent » de moins en moins, pour faire la part belle à une démonstration en direct, bonne alternative à un diaporama statique. À terme, une « boîte à outils » du formateur HAL pourra permettre d’avoir des déroulés de formation clé en main et des conseils à disposition.

Après la formation vient le temps de la modération. Si elle est encore aujourd’hui en grande partie gérée par l’Institut de l’information scientifique et technique (Inist) et le CCSD, certains établissements assurent, en accord avec ce dernier, la modération des dépôts de texte intégral dans leurs portails. Les échanges ont été fructueux au cours de la session « Partager et harmoniser les (bonnes) pratiques » qu’animait Nicolas Alarcon (président de CasuHal). Cet atelier était riche des témoignages des participants issus de tout horizon, modérateurs ou non : Inra (plateforme d’archives ouvertes Prodinra), IRD (plateforme Horizon), Science Po (plateforme Spire). Au travers de trois questionnements (Qu’est-ce qu’un bon dépôt ? Jusqu’où va le modérateur ? Comment améliorer la modération ?), il ressort qu’assurer ce rôle permet de servir au plus près sa communauté de chercheurs en contrôlant l’ensemble de la chaîne de dépôts. Une modération locale sera une alternative aux services nationaux parfois saturés et le message au chercheur – plus personnalisé – portera sans doute davantage. S’engager dans un processus de modération dans HAL nécessite de souscrire à la charte du CCSD, en adéquation avec le contexte local de son établissement : mandat de dépôt ou non, pluridisciplinarité, volume de dépôts annuels… Les retours d’expérience ont montré tous les avantages notamment en termes de médiation auprès des chercheurs.

Des outils techniques pour HAL

Au côté d’ateliers qui faisaient la part belle à l’activité quotidienne dans HAL, d’autres étaient plus orientés technique et outils. C’est avec beaucoup d’intérêt que les utilisateurs de HAL ont assisté aux sessions API, OVERHAL, X2hal, OCdHAL, EXTRHAL.

Deux ateliers ont permis d’explorer le monde des API et d’apprécier les facettes de ces interfaces de programmation.

Hélène Jouguet (université d’Orléans) a brossé un panorama très complet de toute la chaîne de travail autour des « API de HAL » : modalités d’interrogation, critères de recherche et filtres pour grouper les résultats et outils permettant leur exploitation. Chaque étape exploratoire était l’occasion d’une mise en pratique immédiate pour les participants. La rubrique API du wiki de l’association CasuHal permet de s’y référer à tout moment.

Romain Boistel et Frédérique Bordignon (École des Ponts ParisTech) nous ont montré, quant à eux, la potentialité de ces interfaces de programmation. Le rêve de tout formateur HAL est bien sûr le dépôt du texte intégral… mais ce rêve n’est pas toujours facile à atteindre. L’atelier « API Hour ! Des outils à consommer sans modération pour augmenter le taux de full-texts dans HAL » décrivait comment elles peuvent se mettre au service de la promotion d’une science plus ouverte auprès des chercheurs. Le pôle IST et la direction de la recherche de l’École des Ponts ont conçu un processus visant le dépôt du PDF dans un contexte où les biais liés à la production de rapports et de listes de publications favorisent plutôt la création de notices seules. En partant d’un corpus constitué, par un export des bases bibliométriques Web of Science ou Scopus, des traitements successifs permettent l’identification de documents en libre accès sur les bases Unpaywall et sur le Directory of Open Access Journal (DOAJ). Une campagne de mailing est ensuite lancée pour inciter les chercheurs à déposer leurs articles sur l’archive ouverte. Le bilan est satisfaisant puisque, un mois après le début de l’opération, le taux de texte intégral atteignait les 65 %. Au-delà des chiffres, c’est la montée en compétences des agents sur de nombreux outils et l’acculturation à l’Open Access des chercheurs qui constituent des bienfaits incontestables.

Laurent Jonchère (université Rennes I) présentait comment « Construire sa bibliographie avec ExtrHAL ». L’atelier sur cet outil d’extraction de listes bibliographiques était résolument tourné vers une problématique de saison : « les cas pratiques pour l’Hcéres ». Après avoir rappelé tout l’intérêt d’installer l’application sur son serveur d’établissement, les diverses fonctionnalités ont été passées en revue, de la mise en forme de la liste, en passant par la production de bilans quantitatifs ou la promotion des 20 % de publications les plus significatives. Ce fut l’occasion de (ré-) affirmer qu’ExtrHal n’est pas un outil de bibliométrie et que l’essentiel est ailleurs : valoriser les produits de la recherche déposés dans HAL.

Ce fut également l’occasion d’exposer sa complémentarité avec « OCDHAL ». Patricia Reynier (université Grenoble Alpes) nous a montré en quoi cet outil est, comme son nom l’indique, l’Outil de Contrôle des Données issues de HAL. Grâce à cette application, les utilisateurs de HAL (administrateurs, référents et gestionnaires) peuvent contrôler les publications, les auteurs ou les affiliations en passant par la mise à jour de données et l’export dans un tableur.

Autre outil, autre fonctionnalité : l’import automatique de données via X2Hal était représenté par Manon Le Guennec et Aurélien Moisan (université Paris Nanterre) ainsi que Laurent Jonchère et Alain Monteil (Inria).

Si les deux ateliers « Importer par lot dans HAL avec Zotero et X2HAL » et « Importer par lot dans HAL à partir de Pubmed, Web of Science ou Scopus avec OverHAL et X2HAL » avaient le même objectif, les méthodes employées étaient différentes. Les collègues de Nanterre ont montré comment le logiciel open source Zotero permet de récupérer les métadonnées bibliographiques à partir de la page web d’une ressource (Sudoc, sites éditeurs…). En comparaison, l’atelier autour des bases internationales Wos, Scopus et Pubmed était plus classique puisque reposant sur un réservoir connu et défini de données bibliographiques. De fait, avec Zotero, l’atelier intéressait davantage les sciences humaines et sociales (SHS), tandis que l’autre ciblait surtout les sciences, techniques et médecine (STM).

Les participants ont ainsi pu suivre pas à pas les différentes étapes permettant d’importer des listes de références de différents formats dans HAL, mais aussi d’assurer le contrôle qualité des données.

Toujours soucieuse d’améliorer les outils développés, l’équipe du CCSD, en la présence de Bruno Marmol et de Bénédicte Kuntziger, a fait le point sur le nouveau module de statistiques « Kibana ». Ce choix allie à la fois efficacité et fiabilité des données, notamment en ne tenant plus compte des accès générés par les robots qui faussaient les chiffres de consultation. L’outil de visualisation sous licence libre s’appuie sur le serveur de recherche Elasticsearch qui permet de visualiser les données sous forme de graphiques. L’ergonomie de l’interface d’utilisation et l’exploitation des résultats s’en trouvent considérablement améliorées. Deux tableaux de bord sont réalisables : statistiques sur les documents présents dans le portail (évolution des dépôts) et statistiques sur les données de consultation (nombre de téléchargements, provenance géographique). Sur ce sujet, le CCSD est en attente de retours afin de répondre au mieux aux besoins de la communauté.

Actu-Hal-ités…

Les journées CasuHAL sont aussi l’occasion de donner la parole au CCSD. Les sujets étaient nombreux et en voici un florilège : la mise à jour de Grobid pour des traitements analytiques de corpus scientifiques dans HAL, l’ouverture du portail HAL Hcéres, la refonte du module de statistiques de HAL sont opérationnels. La migration de l’archive ouverte Prodinra vers HAL est en cours, tout comme l’étude pour une évolution de l’interface de dépôt. Dans les projets à venir, on notera la refonte des référentiels auteurs et structures (AuréHAL) ainsi que la collecte ciblée d’autres archives ouvertes.

CasuHal aujourd’hui…

C’est 388 adhérents, une liste de diffusion, un site web et un compte Twitter. L’association a fêté ses trois ans d’existence le 20 septembre 2019 et le nombre d’adhérents augmente chaque année, consolidant toujours plus la position de CasuHal comme un acteur essentiel dans l’écosystème des archives ouvertes françaises.

Au prochain rendez-vous à Montpellier ?

  1. (retour)↑  CCSD : centre pour la communication scientifique directe – UMS3668 du CNRS ; créateur, développeur et administrateur de l’archive ouverte HAL.