Des outils de recherche pour les sciences humaines et sociales

Véronique Ginouvès

Depuis 1999, Revues.org 1 a pour volonté d’offrir un espace de connaissance, de débat et d’information scientifique dans le domaine des sciences humaines et sociales (SHS). Ainsi, au fil du temps, cette fédération à laquelle 80 revues ont adhéré, a développé un portail au plus près des besoins des chercheurs en SHS, toujours en lien avec les nouveautés technologiques. Trois outils étaient présentés jeudi 16 novembre 2006 à l’École des hautes études en sciences sociales (EHESS, Paris) : Calenda, un calendrier des événements ; L’Album des sciences sociales, un annuaire de liens ; In-extenso, un moteur de recherche.

C’est Marin Dacos, inventeur de Revues.org, qui a présenté la matinée. Les 80 revues du portail de Revues.org forment aujourd’hui 16 000 documents en ligne dont la moitié en texte intégral.

Marin Dacos a insisté sur la volonté de la fédération de développer l’appropriation, par les étudiants et les chercheurs, des instruments présentés au cours de cette matinée. Il a démontré la convergence et la complémentarité de ces outils qui aboutissent à la constitution d’un nouveau moteur spécialisé dans les SHS : In-extenso.

Calenda

Corinne Cassé, rédactrice adjointe de Calenda, a ouvert ensuite la séance en présentant le calendrier des sciences sociales. Depuis sa création en 2000, Calenda propose plus de 6 000 annonces. Il reçoit aujourd’hui quelque 100 annonces par mois et 120 000 visites d’internautes, répertorie les séminaires, les colloques, les journées d’étude, les appels à contribution et les parutions de numéros spéciaux de revues. Toutes les informations sont validées d’abord par les internautes puis par les rédacteurs de Calenda, qui interviennent pour clarifier les données, les vérifier et ajouter éventuellement des catégories. Ethnologue de formation, Corinne Cassé a su analyser avec finesse les attitudes des chercheurs face à la publication électronique de leur propre information et les difficultés de l’appropriation de cet outil, qui a pourtant déjà quelques années derrière lui.

L’Album des sciences sociales

Jean-Christophe Peyssard, rédacteur en chef de L’Album des sciences sociales, a présenté ensuite cet outil créé dès 1999 par Sylvain Piron, maître de conférences à l’EHESS. Il s’était alors inspiré du projet de la Virtual Library (Vlib) 2, initié par Tim Berners-Lee 3, l’inventeur du web. L’Album est un annuaire de liens, validés par un groupe de rédacteurs tous membres de la communauté des SHS : jusqu’ici 2 311 notices ont été publiées, il reçoit 35 000 visites par mois et son arbre thématique est constitué de 190 rubriques. Pourquoi créer un annuaire sur le web alors qu’aujourd’hui il suffit de taper un ou deux mots sur un moteur généraliste pour (penser) trouver ce que l’on cherche ? Jean-Christophe Peyssard a ainsi souligné l’intérêt des répertoires de ressources qui, non seulement viennent apporter leur singularité au milieu d’une information foisonnante, mais permettent également d’accompagner les usages des internautes souvent désorientés et réussissent à créer des réseaux de compétences et d’expertises solides et efficaces. Le public peut enfin accéder à des ressources validées. L’intérêt immédiat de ces trois facteurs est de converger dans In-extenso, car, lorsqu’une notice est créée, le rédacteur peut régler finement la profondeur de l’indexation dans le moteur. C’est ce qui a été développé en dernière partie dans la présentation de Pierre Mounier.

In-extenso

Pierre Mounier est membre du comité de rédaction de Revues.org et responsable de la cellule d’édition en ligne de l’École normale supérieure lettres et sciences humaines de Lyon. Il a choisi de présenter le moteur de Revues.org en adoptant le point de vue de l’utilisateur. Face aux huit milliards de pages revendiqués par Google, In-extenso peut sans doute apparaître sur Internet comme infinitésimal… Mais il n’y a pas de rivalité entre de tels outils et peu importe lequel aura le plus gros index ou le meilleur algorithme de recherche… l’intérêt est la pertinence des résultats qui découle de la sélection des sites indexés par les moteurs. La recherche effectuée sur le terme « Football » est éloquente : Google fournit les résultats des matchs, In-extenso des articles de sociologie ou d’histoire sur ce sport. Certes, il existe d’autres moteurs plus spécialisés mais les résultats n’en sont pas pour autant plus probants. Dans Google Scholar 4, les résultats proposent plutôt des articles sur les maladies professionnelles des joueurs de football car les sites indexés dans le domaine des sciences humaines sont limités ; Scirus 5, le moteur d’Elsevier, nous donne les résultats des matchs des équipes de football des universités américaines et des articles des sciences dures. In-extenso a su également s’adapter aux nouveaux usages en proposant deux niveaux de recherche sur son formulaire de recherche. Le premier niveau interroge l’ensemble des sites repérés dans L’Album, indexés plus ou moins profondément suivant le niveau d’indexation proposé par ses rédacteurs. Le second uniquement les documents moissonnés dans des dépôts OAI (HAL-SHS, Gallica, Persée, Cairn… et de nombreux autres). C’est donc bien la sélection des sites sur lesquels interroge In-extenso qui est ici stratégique. Nous voilà ainsi invités à sortir de la « pensée magique » induite par les moteurs généralistes qui nous semblent avoir réponse à tout : ici la pertinence des résultats dépend de la pertinence des sites indexés par la communauté.

Tous ces outils sont convergents et complémentaires et l’ensemble constitue un éco-système documentaire. Par exemple, tous utilisent la syndication 6. Il est possible de s’abonner à un flux thématique des annonces de Calenda comme aux nouveautés des revues, ou encore au flux d’une recherche spécifique. Autre fonction intéressante : les laboratoires peuvent récupérer sur le site de leur laboratoire un formulaire de recherche pour lancer directement des requêtes dans In-extenso… Lors du débat, les questions du public ont sans doute montré que les technologies comme la syndication ou les outils de travail collaboratif sont encore loin d’être ancrés dans les usages… mais peu importe, une matinée comme celle-là montre que le web bouge aussi dans le monde des sciences humaines et sociales, et c’est tant mieux.