Journée d’étude « Qualifier l’interdisciplinarité : vocabulaires, réseaux, outils et indicateurs »

Paris, Sorbonne Université, campus Pierre-et-Marie-Curie – 1er juin 2023

Loïc Bertrand

Caroline Corbières

Sophie David

Juliette Ollivier

La journée d’étude 1

X

Pour voir les affiliations, consulter le programme de la journée : https://journee-obispa.sciencesconf.org/resource/page/id/7.

« Qualifier l’interdisciplinarité : vocabulaires, réseaux, outils et indicateurs », organisée dans le cadre du DIM PAMIR (pour Domaine de recherche et d’innovation majeurs, Patrimoines matériels – innovation, expérimentation, résilience) le 1er juin 2023, a réuni près de 100 participants, scientifiques, bibliothécaires ou personnels d’appui à la recherche.

Partant de préoccupations émanant du terrain, cette journée s’est donné pour objectif de discuter collectivement des méthodes, outils et indicateurs de référence pour la mesure de l’interdisciplinarité, et de réfléchir à leur reproductibilité et applicabilité dans différents domaines scientifiques. Les échanges se sont appuyés en particulier sur des approches bibliométriques, de sociologie et d’analyse des réseaux, d’analyse textuelle, d’histoire et d’épistémologie ; et ont montré l’apport des méthodes et outils numériques tant pour interroger, analyser que visualiser l’interdisciplinarité.

L’idée de cet événement est partie d’un besoin : celui pour le DIM PAMIR de qualifier son réseau en sciences du patrimoine. Un groupe de travail – qui se réunit régulièrement depuis octobre 2021 – a alors été constitué pour analyser les données bibliographiques de ce réseau scientifiques selon différentes approches. Les questions qu’il avait à traiter ont porté sur la cartographie des collaborations scientifiques, et sur l’analyse du vocabulaire de ce champ, qui fait dialoguer les sciences expérimentales, les sciences humaines et les sciences des données.

Cette journée a été organisée en partenariat avec le Centre national de la recherche scientifique (CNRS), la Région Île-de-France, l’Université Paris-Saclay, l’École normale supérieure Paris-Saclay, Sorbonne Université, le Museum national d’histoire naturelle, l’Université de Versailles Saint-Quentin-en-Yvelines, le DIM PAMIR, et avec le soutien de la délégation du Québec à Paris et de la Maison des sciences de l’homme (MSH) Paris-Saclay. Lors des mots d’introduction, la nécessité d’une prise en charge de ces questions par les institutions de recherche a été manifestée de manière unanime.

L’interdisciplinarité à travers le vocabulaire

Définir l’interdisciplinarité

La question de la définition de l’interdisciplinarité a été soulevée à plusieurs moments de la journée. Constatant la multiplicité des termes existant pour évoquer les relations entre disciplines, les participants ont posé le problème de l’ambiguïté de ces termes dont la définition n’est pas stabilisée. À cela s’ajoute un problème de jugement moral, soulevé par Yves Gingras : l’interdisciplinarité serait, pour certains, jugée supérieure à la multidisciplinarité.

Le problème de la définition se pose également en des termes plus politiques, à travers notamment la distance entre la manière dont les institutions parlent de l’interdisciplinarité, et la manière dont, dans les faits, elle est évaluée. Diego Jarak a ainsi relevé ce contraste entre la croyance en une interdisciplinarité porteuse d’innovation et de progrès, tout en notant la difficulté à faire reconnaître les travaux entrant dans ce cadre par les instances évaluatrices, ainsi qu’à les faire publier en l’absence de revues adaptées.

Qualifier l’interdisciplinarité par le vocabulaire

Lors de l’atelier portant sur les vocabulaires, référentiels et thésaurus, la discussion s’est ouverte sur les marqueurs linguistiques des sciences du patrimoine, et, plus largement, des champs interdisciplinaires. Nolwenn Pamart et Kristell Roser ont exposé les diverses méthodes auxquelles elles ont eu recours afin de qualifier le corpus constitué par le groupe de travail Observatoire de la bibliométrie et interdisciplinarité en sciences du patrimoine (OBISPA) animé par le DIM PAMIR : allant de l’analyse de fréquence, au clustering, en passant par l’extraction d’entités nommées, l’analyse de cooccurrences et l’analyse des mots-clés auteur et éditeur. Ces méthodes ont produit des résultats assez similaires : les mots-clés extraits se regroupent autour de thématiques associées à des noms de lieux, de périodes et de méthodes.

La variété des méthodes évoquées par les participants dans la salle témoigne ainsi des difficultés à traiter des corpus interdisciplinaires : les bases bibliographiques sont partielles, les métadonnées parfois incomplètes, et le sens des termes diffère en fonction de la discipline, mais aussi de l’institution considérée ; la difficulté à faire émerger un vocabulaire contrôlé qualifiant ces disciplines est alors manifeste. Elle s’exprime notamment dans l’absence de méthodes et outils pour réaliser ce type de travail : le travail manuel, passant par le dédoublonnage et le nettoyage des métadonnées, travail laborieux s’il en est, reste la norme pour les professionnels s’étant exprimés.

Pour résoudre le problème de l’équivocité de certains termes, Morgann Sabatier propose l’utilisation d’extracteurs de mots-clés prenant en compte le contexte d’occurrences, tels que YAKE, BERT ou keyBERT, ainsi que l’application de filtres morphosyntaxiques permettant d’extraire des expressions figées.

De son côté, Claire Nédellec, également partisane de l’utilisation de méthodes d’apprentissage automatique et de traitement de la langue, met en avant le problème de la fusion de données hétérogènes, nécessitant l’implication des experts. L’enjeu est alors d’avoir à disposition des interfaces et des outils qui sont aussi des moyens d’entente disciplinaire. L’intérêt de tels outils est particulièrement visible pour l’annotation de textes : par l’ajout d’étiquettes sémantiques, les scientifiques de disciplines variées peuvent exprimer ce qu’ils comprennent et modéliser des textes, permettant, via des méthodes de word embeddings (« plongement lexical »), d’entraîner des intelligences artificielles.

La question du travail d’extraction en texte intégral se pose alors. Ses implications techniques, c’est-à-dire avoir accès au texte complet des articles, dans un format structuré et analysable par une machine, font surgir une première barrière. La seconde est le bruit qu’une telle extraction pourrait générer : à ce sujet, Claire Nédellec indique qu’une recherche de mots-clés dans des zones ciblées des articles pourrait constituer une solution, et propose, pour les sciences du patrimoine, de focaliser l’analyse sur la section matériaux et méthodes.

L’interdisciplinarité vue à travers les publications

Études bibliométriques

Les études bibliométriques se fondent sur des données issues des publications, en particulier les affiliations des auteurs, les revues, et les citations. Vincent Larivière précise que pour mesurer l’interdisciplinarité, les classifications en disciplines et sous-disciplines sont fondamentales : leur niveau de précision doit être suffisant pour faire apparaître des échanges. Cela est d’autant plus important que l’interdisciplinarité peut être intradisciplinaire, notamment dans le cas des disciplines comportant un grand nombre de sous-disciplines.

La question se pose alors de la classification, ou du référentiel à adopter pour analyser les publications. Les discussions ayant eu lieu lors de l’atelier modéré par Nolwenn Pamart et Kristell Roser ont fait poindre les limites des classifications existantes : celles du Web of Science ou de Scopus comportent un biais anglo-américain, ignorent des disciplines, telle que la taxonomie, et ont un niveau de précision variable selon les domaines de la science ; d’autres, telles que celle de l’European Research Council ont vocation à qualifier des laboratoires, et non des publications.

Donnant des exemples de résultats de ce type d’études, Vincent Larivière indique que l’interdisciplinarité est en augmentation depuis 1990, et est associée à un plus fort impact scientifique des publications concernées – cet impact étant mesuré par le taux de citation. Cela explique les forts intérêts qu’elle suscite auprès des institutions de recherche. Pour autant, les pratiques de co-citation ne correspondent pas forcément à des collaborations réelles, et peuvent parfois montrer des relations instrumentales à des disciplines citées. Les études bibliométriques montrent ainsi l’existence de relations asymétriques entre certaines disciplines : certains domaines sont « importateurs de connaissance », alors que d’autres sont « exportateurs ». C’est notamment le cas pour l’économie, qui cite des travaux de sa discipline et du management, alors qu’elle est elle-même citée par de nombreuses autres disciplines.

Analyse de réseaux

Henri Bretel et Michel de Moura ont présenté les résultats de l’application de l’analyse des réseaux au corpus réalisé par le groupe de travail OBISPA. Leur méthode se fonde principalement sur l’étude des affiliations, mais celles-ci, souvent mal renseignées sur les bases de données, constituent un point faible à cette approche.

Les discussions ont fait apparaître de nouvelles perspectives : la prise en compte de la dimension temporelle, en réalisant plusieurs graphes à intervalles de temps réguliers, permettrait de percevoir l’évolution du réseau et suivre les communautés.

C’est l’approche adoptée par Fabien Tarissan, dans son étude de corpus juridiques. Il montre ainsi que plus qu’une simple approche quantitative appliquée au droit, l’analyse des réseaux, utilisée comme méthode dans une perspective interdisciplinaire, permet de faire émerger des caractéristiques de fonctionnement du droit. Il met ainsi en valeur, pour des affaires citées dans les jugements, plusieurs manières d’être influentes : en étant citées souvent, en étant citées longtemps, et en étant citées dans des contextes radicalement différents du contexte d’énonciation initial. Il montre également, grâce à une variation dans le mode de citation des affaires juridiques, que la manière d’appliquer le droit a changé dans les années 1970.

La discussion avec les participants a fait ressortir l’intérêt d’utiliser l’analyse des réseaux pour étudier un champ disciplinaire dans une perspective de sciences sociales : ces graphes donnent une image de l’histoire du champ, et font apparaître les créations de laboratoires, ou encore l’apparition de modes de financement. Si Gephy et VosViewer, outils habituellement utilisés en analyse des réseaux, pouvaient aboutir à ce type de travaux en reproduisant l’analyse dans le temps, le projet Citation Graph, présenté par Darshan Sathiyanarayanan, permet à la fois la représentation des liens et de la profondeur temporelle. En prenant en compte les clusters secondaires, il serait également possible de voir des disciplines en constitution. Suivant le même objectif d’étude sur un temps long, l’étude d’autres types de documents, tels que les carnets de laboratoires, serait une perspective intéressante pour étudier la science en train de se faire.

Prenant un point de vue plus individuel, Béatrice Milard a proposé une méthode d’analyse égocentrée, en construisant des réseaux de co-citation à partir d’une sélection d’auteurs. À travers une étude par entretiens, elle a mis en évidence l’existence de différents liens entre auteurs citant et auteurs cités, lui permettant de conclure que le capital social d’un auteur est lié à l’existence de chaînes de relations dans le réseau de co-citations. De cette manière, elle valorise l’importance de prendre en compte la question des relations sociales entre chercheurs, car d’elles dépend la manière de citer. Par exemple, la dynamique d’atomisation implique la citation de références anciennes ainsi que pluridisciplinaires, conduisant à un gain de modularité, c’est-à-dire à la structuration du réseau en sous-communautés. Dans cette dynamique, l’auteur est peu central dans sa communauté, contrairement aux scientifiques qui citent peu en dehors de leur domaine, relevant alors d’une dynamique de polarisation qui suit une logique de capitalisation. Choisir qui citer relève ainsi de stratégies – dont l’interdisciplinarité fait partie – ayant une influence sur la diffusion des publications.

Les difficultés dans l’étude de l’interdisciplinarité

Les pratiques multidisciplinaires sont variables, et ne vont pas toutes jusqu’à l’interdisciplinarité. Marion Maisonobe, par son étude sur les terrains de recherche, a montré que la proximité physique liée à un objet d’étude commun n’aboutissait pas toujours à des collaborations. De la même manière, la co-citation ne correspond pas systématiquement à des pratiques de collaboration. Cela rejoint les propos de Vincent Larivière à propos des pratiques de co-citations asymétriques.

Qu’elle passe par l’étude des publications ou du vocabulaire, l’analyse de l’interdisciplinarité requiert l’accès à des bases de données, le plus souvent propriétaires et payantes, et dont la couverture disciplinaire est variable. La question se pose alors de n’en choisir qu’une, ou de combiner les sources, malgré le travail sur les données que cela implique. Clément Levallois a également exposé les problèmes de reproductibilité liés à l’usage des bases commerciales qui ne permettent pas des extractions, empêchant la reproduction de cartographies ou de données. Il propose alors de se tourner vers Open Alex, une base libre encore mal structurée, mais dont l’usage pourrait faire évoluer les pratiques en raison de la masse de données moissonnée et de son ouverture.

Étienne Anheim a, quant à lui, mis en garde contre une instrumentalisation des travaux interdisciplinaires, dès lors qu’une posture intellectuelle positiviste est adoptée par certaines institutions de la recherche, notamment les revues. La vision que ces institutions ont de l’interdisciplinarité, est conditionnée par les objectifs auxquels elle devrait aboutir, fortement associés à une rhétorique de l’innovation. Dans ce contexte, toute divergence par rapport à ces objectifs suscite des réticences.

La difficulté à publier des travaux interdisciplinaires en est un exemple ; pour Claire Nédellec, il est alors nécessaire de trouver d’autres moyens de communiquer les résultats de recherches de ce type : cela pourrait passer par des congrès, des colloques, ou en publiant dans les rares revues ouvertement interdisciplinaires. Publier dans ce type de revue relève alors de l’engagement, dans la mesure où elles sont soit payantes, soit faiblement reconnues.

Perspectives

À l’issue des présentations de cette journée, Étienne Anheim propose de préciser trois dimensions de l’interdisciplinarité. Elle peut en premier lieu concerner les objets d’étude. Cette remarque s’inscrit dans l’essor des studies, consistant en une redéfinition des questions scientifiques non pas en fonction de disciplines, mais de terrains ou d’objets. Elle peut également concerner des méthodes au sens large, qu’elles soient intellectuelles ou matérielles, sous la forme de l’instrumentation. Enfin, l’interdisciplinarité peut se réaliser au niveau des cadres théoriques. Cette définition tridimensionnelle constitue des axes qui peuvent ordonner les partages et échanges interdisciplinaires.