La diffusion et la valorisation des thèses scientifiques

François Lapèlerie

Depuis huit ans, les bibliothèques universitaires scientifiques sont submergées par un flot toujours croissant de microfiches de thèses. Les raisons en sont connues. En 1988, en effet, le ministère décida d’organiser la diffusion desdites thèses. Elles sont supposées être un gisement documentaire extraordinaire malheureusement inexploité ou sous-exploité, même en France, pour ne pas parler de l’étranger. Il s’agissait donc de valoriser cette branche de la recherche universitaire française. Constatation d’une réalité ou idée préconçue, c’est ce qu’il aurait fallu savoir avant de décider des moyens à mettre en œuvre. C’est peut-être ce que l’expérience de huit années permettra de décider.

L’ancien système de diffusion des thèses était certes devenu inapplicable et inappliqué. Successivement, les règles puis les pratiques prévues cessèrent d’être appliquées : dépôt des thèses imprimées en grand nombre d’exemplaires, puis envoi de ces thèses à toutes les bibliothèques universitaires ; envoi de fiches seules ou de listes de thèses soutenues dans chaque faculté, dans l’attente de la parution – un jour... – de catalogues imprimés par la Bibliothèque nationale. On en était presque arrivé au point où l’on ne recevait plus ni thèse, ni fiche, ni catalogue national. La réforme d’un système archaïque était nécessaire.

Le système actuel

La réforme adoptée était-elle la meilleure possible, ou, plutôt, était-elle conforme aux besoins d’information des chercheurs ? L’idée est simple, voire simpliste dans son maximalisme. Il faut que chaque bibliothèque scientifique reçoive un exemplaire de toute thèse soutenue devant une université française. La diffusion sous forme papier étant définitivement exclue, les concepteurs du système ont décidé de reproduire les thèses sous forme de microfiche dans un atelier spécialisé et de diffuser un exemplaire de chaque thèse dans chaque bibliothèque.

Je ne parlerai pas du microfichage qui se fait dans un atelier de reproduction : on peut imaginer le travail que représente non seulement le microfichage proprement dit, mais aussi toute l’administration du système.

Quant au travail dans chaque bibliothèque, point n’est besoin d’imagination : la constatation de la réalité suffit. C’est une cascade d’opérations et de tâches répétitives, coûteuses en temps, donc en personnel, et éventuellement en argent.

En début de chaîne, le travail de chaque bibliothèque commence par l’envoi des bordereaux et des thèses. Travail qui peut être très lourd dans les universités où les soutenances sont très nombreuses, par exemple Paris XI Orsay, comme l’indique le rapport Laissus (1). En retour, chaque bibliothèque reçoit, par petits paquets, un exemplaire microfiché de toutes les thèses soutenues en France. Combien une bibliothèque scientifique en reçoit-elle par an ? Certainement un très grand nombre, cela est sûr et confirmé par le rapport Laissus : au moins 5 000 thèses par an, nombre qui devrait être le même dans toutes les bibliothèques scientifiques. Mais, paradoxalement, on s’aperçoit en consultant le même rapport qu’il n’en est rien. Les huit bibliothèques scientifiques qui ont fait l’objet du rapport déclarent des accroissements annuels de thèses « sur support autre que le papier » très différents, avec des amplitudes de variation pouvant aller jusqu’à 2 ou 3 000 thèses. Ce qui peut s’interpréter de plusieurs façons, s’il est vrai que chaque bibliothèque reçoit le même nombre de thèses. Soit certains envois s’égarent sans que personne s’en aperçoive. Soit les comptages sont mal faits. Soit le retard à l’intégration des thèses est très long. Quoi qu’il en soit, ces chiffres donnent une idée du travail qui attend les bibliothèques.

Signalement et stockage

Après les vérifications nécessaires, chaque bibliothèque peut choisir des solutions différentes aux problèmes qui se posent : le signalement et le stockage des thèses.

Pour le signalement, faut-il enregistrer ces documents et les cataloguer ? Ou peut-on s’en dispenser ?

Dans le premier cas, le travail est gigantesque et très coûteux en personnel. Peut-on même sérieusement envisager de cataloguer 5 000 thèses microfichées par an et d’intercaler le nombre de fiches nécessaires (20 à 30 000) ? Peut-on le faire même si l’on a recours à l’informatique ? On a vu, en effet, une société proposer aux bibliothèques un logiciel spécifique destiné à créer un OPAC de ces microfiches de thèses. Au coût en personnel s’ajouterait le coût financier du matériel informatique et de ce logiciel. Il est peu vraisemblable qu’une bibliothèque choisisse cette solution.

Si l’on se dispense de ce travail d’enregistrement et de catalogage, on doit utiliser les outils existants, c’est-à-dire avoir recours au catalogue informatisé des thèses. Il se présente sous deux formes : Téléthèses et son sous-produit CD-Thèses 1. Encore faut-il que ces services fonctionnent correctement. Le premier a ses humeurs parfois fantaisistes et le second a un comportement étrange. Si l’on veut bien passer sur ces difficultés techniques, on peut remarquer le retard à l’intégration des notices. La dernière édition du CD-Rom, outre son ancienneté (1992) 2, ne recense que 3 509 thèses de 1991 et 289 de 1992. L’interrogation du CD-Rom seul ne peut donc suffire à une recherche systématique. Téléthèses, qui devrait être à jour, a un retard certain à l’enregistrement, comme on l’a vu : seulement 1 638 thèses de 1994 sont présentes aujourd’hui 3.

Dans ces deux cas, CD-Rom ou système en ligne, la rapidité du signalement, pourtant essentielle en documentation, laisse à désirer. Cependant, on peut considérer que les outils de signalement disponibles, même imparfaits, permettent à un lecteur type de trouver ou retrouver ce dont il aurait besoin, au moyen de recherches soit par auteur soit par sujet.

La seconde difficulté, le stockage des microfiches, n’est pas moindre. Que faire ? Une solution consiste à acheter des armoires spéciales à cet effet. Solution coûteuse, ruineuse même étant donné le nombre de thèses à classer. Une autre solution, artisanale, consisterait à classer dans de banales boîtes les microfiches, année par année et par ordre alphabétique d’auteur. Ce système est peu coûteux financièrement, il ne coûte que le temps (important) du personnel qui intercale les microfiches. Il permet de retrouver une thèse rapidement, que l’on ait ou que l’on n’ait pas de catalogue local, à la condition que le demandeur connaisse l’auteur et l’année de la thèse demandée. Par contre, en l’absence de catalogue matière, informatisé ou pas, il ne permet aucune recherche locale.

Une demande stagnante

On le constate, ce système demande, ou demanderait si l’on était perfectionniste, beaucoup de temps, d’énergie et d’argent. Et pour quel résultat ? C’est là la question fondamentale. On s’aperçoit, après huit années d’expérience, malgré l’existence d’outils bibliographiques imparfaits mais utilisables et malgré les dizaines de milliers de thèses en stock, que la demande de thèses est toujours stagnante, c’est-à-dire très faible. On aurait pu penser qu’une meilleure et plus rapide signalisation par l’informatique allait accroître la demande de thèses : cela n’est pas confirmé. Une meilleure signalisation n’a pas entraîné une meilleure diffusion parmi le public supposé potentiel (2).

Par exemple, dans la bibliothèque de Luminy, où CD-Thèses est accessible en réseau et où Téléthèses peut être consulté gratuitement, on ne demande pas plus de thèses aujourd’hui qu’il y a 10 ans 4. Ce qui semble le cas dans toutes les bibliothèques qui ont participé au rapport Laissus.

Ce qui signifierait, abstraction faite des problèmes matériels évoqués, que le système élaboré ne correspond pas aux besoins des utilisateurs. En effet pourquoi si peu de thèses sont-elles demandées et quelles sont celles exceptionnellement demandées ?

Cela tient sans doute à plusieurs raisons. Au premier rang desquelles la nature même de la « nouvelle » thèse. La thèse est un exercice national 5 très particulier et très académique, destiné désormais pour partie à vérifier l’aptitude du candidat au doctorat à faire de la recherche, au travers d’un travail scientifique qu’il expose selon un rite – la forme matérielle de la thèse – et d’un rituel – la soutenance – bien établis. La publication qui s’ensuit ne correspond donc pas au médium habituel de diffusion de la découverte ou de la connaissance en sciences exactes, qui est l’article de périodique, en général de langue anglaise.

Une preuve en est donnée par le nombre extrêmement faible de références bibliographiques faites à des thèses dans les articles scientifiques : en pourcentage de citations, les thèses voisinent le zéro absolu. Cela est vrai aussi, mais à un moindre degré, de tout document autre que le périodique : le périodique est jusqu’à 95 % le médium essentiel (3). Ce phénomène, qui est international et non pas typiquement français, démontre encore une fois le caractère particulier de la thèse et son rôle, supplémentaire et fondamental de précurseur d’articles.

La science et les articles

On en vient ainsi à la seconde raison qui explique la maigre demande de thèses. A condition que sa recherche soit de bon niveau, chaque doctorant ou docteur publie – ou devrait publier – pendant sa recherche ou peu après sa soutenance, un ou plusieurs articles dans des revues scientifiques. Ces articles ne conservent que l’essentiel des résultats de la recherche, dépouillé de la rhétorique de la thèse pour passer à la rhétorique de l’article, et le diffusent sous la forme la mieux à même de lui donner une notoriété 6. La vraie diffusion et la vraie valorisation nationales et internationales sont atteintes par les articles concomitants ou immédiatement postérieurs à la thèse 7.

Cela est d’autant plus évident que, depuis plusieurs années, il est possible de soutenir une thèse de doctorat sur un ensemble de travaux déjà publiés sous forme d’articles de revues. Dans ce cas, le processus est simplement inversé : la publication internationale et peut-être même la consécration sous forme de citations précèdent la thèse qui n’est qu’un simple recueil d’articles photocopiés. Dans un cas, celui du doctorat de mathématiques, il peut arriver que thèse et article (ou article et thèse) soient confondus : la thèse est soutenue sur le texte d’un article soumis à une revue pour publication ; et que l’article ne paraisse qu’une ou deux années après la soutenance.

Quelles sont – a contrario – les thèses qui font exception, c’est-à-dire qui sont demandées ? D’abord les thèses dont l’auteur est devenu célèbre, cela arrive 8. Autre cas : certaines thèses dans des domaines précis où les illustrations abondent, la biologie par exemple. Mais là, paradoxe, le lecteur ne peut pas se contenter de la microfiche : il est obligé de demander l’original à la bibliothèque de l’université de soutenance…, rendant le microfichage inutile. En effet, la qualité incertaine de la reproduction des illustrations contenues dans les microfiches les rend souvent inexploitables. Si les illustrations au trait peuvent être reproduites de façon utilisable à partir des microfiches, la simple lecture – sans parler de la reproduction – de toute autre illustration laisse souvent à désirer. Les photos en noir et blanc même les plus simples, par exemple les chromatographies sont souvent inutilisables ; des séquences d’acide nucléique sont illisibles, pour ne pas parler des illustrations et photos en couleurs, de plus en plus fréquentes 9.

Ces exemples inclineraient à penser qu’il n’est pas nécessaire de s’acharner à trouver un système qui diffuse systématiquement toutes les thèses à toutes les bibliothèques : la quintessence des thèses trouve déjà sa diffusion et sa valorisation naturelle sous forme d’articles de périodiques.

D’autres solutions

Que faut-il donc faire en matière de signalisation et de diffusion des thèses ? Pour la signalisation, une base de données de thèses est indispensable : elle pourrait continuer à se faire à partir des seuls bordereaux. Pour la diffusion, toute solution systématique, on l’a vu, semble inutile, sous quelque forme que ce soit. On peut imaginer deux types de solutions.

D’abord une solution locale. On pourrait se contenter du système de dépôt dans la bibliothèque de l’université de soutenance, qui prêterait l’original des thèses. Ce système simple et peu original, qu’on pourrait même qualifier de rétrograde, aurait l’avantage de ne pas coûter très cher.

Ensuite une solution où les thèses seraient toujours centralisées nationalement, comme aujourd’hui 10. On pourrait se contenter de centraliser les thèses sous leur forme papier et un service de reproduction pourrait assurer, comme University Microfilm International aux États-Unis, une reproduction payante, à la demande, sous la forme désirée par le client (papier, microforme ou autre support).

On pourrait également demander à tous les doctorants de déposer aussi leur thèse sous forme de disquette(s) contenant texte et illustration saisis sous un format normalisé 11. Cela permettrait toutes les applications possibles, sans avoir à retraiter ou ressaisir les thèses. Par exemple, il serait possible de les stocker en texte intégral sur un serveur, d’où toute personne intéressée pourrait les télédécharger en totalité ou en partie. Ou bien de les reproduire à la demande sous la forme choisie par l’utilisateur (papier, disquette, CD-Rom).

  1. (retour)↑  On peut aussi utiliser Pascal, soit en ligne soit en CD-Rom sans que cela change grand-chose.
  2. (retour)↑  Cette édition n’a donc qu’une utilité limitée. Une nouvelle édition trimestrielle devait voir le jour depuis près d’un an…
  3. (retour)↑  Ce retard n’est pas forcément imputable au service chargé d’enregistrer les thèses. Les responsabilités peuvent relever des bibliothèques et aussi des services de la scolarité qui souvent mettent très longtemps avant de transmettre à la bibliothèque les exemplaires de thèses et les bordereaux en leur possession.
  4. (retour)↑  Au contraire, on s’aperçoit que l’existence du Pancatalogue, malgré son manque d’ergonomie, a entraîné une croissance exceptionnelle de demandes d’ouvrages à la bibliothèque par l’intermédiaire du PEB. Preuve, s’il en était besoin, de l’utilité de ce type de catalogue.
  5. (retour)↑  Il ne faut pas y voir une critique : national ne signifie pas nationaliste. C’est un exercice national, c’est-à-dire à usage interne, non seulement en France, mais dans tous les pays où l’on soutient des thèses sous des formes différentes, mais souvent désormais très voisines.
  6. (retour)↑  Ce phénomène montre aussi que « la durée de vie » d’une thèse en sciences est en général assez courte, plus courte que celle d’un article, à l’exception de certaines disciplines où le savoir est plus cumulatif.
  7. (retour)↑  Pour une université ou une faculté scientifique, le ratio du nombre d’articles publiés par les « docteurs » sur le nombre de thèses soutenues est un indicateur utile. S’il est trop faible (voisin ou en dessous de 1, c’est-à-dire s’il y a peu (ou pas) d’articles publiés par les doctorants lors de leur travail de recherche ou immédiatement après la soutenance), il peut démontrer deux choses. Ou que la recherche n’est pas d’un excellent niveau, ce qui n’est pas le cas, ou que les directeurs de thèse n’encouragent pas suffisamment leurs étudiants à publier, ce qui est une faute puisqu’ils ne favorisent pas la diffusion, donc la valorisation des recherches dont ils ont la responsabilité. Si par contre, il est élevé (jusqu’à 3 ou même plus), il est le signe d’une bonne valorisation du contenu des thèses. Ce ratio général peut être affiné selon les disciplines pour tenir compte des us et coutumes et des rythmes de publication par discipline, qui sont connus au plan international. Une étude à plus long terme permettrait de vérifier si la loi de Lotka trouve ici une application.
  8. (retour)↑  A la bibliothèque de Luminy, la thèse d’Alain Colmerauer sur le langage Prolog a fait partie de ce cas. Fondateur de ce langage, qui est devenu, avec Lisp, un langage universel de l’intelligence artificielle, Alain Colmerauer vient d’en développer la troisième version. Sa thèse n’est donc déjà plus demandée, d’autant que de nombreux livres ont été publiés sur le sujet par A. Colmerauer et par d’autres. Dans ce cas, la thèse a été l’inducteur de nombreux livres.
  9. (retour)↑  Une autre catégorie de thèses pourrait sans doute être plus demandée, mais ces thèses sont interdites de communication pour des raisons de secret industriel. En effet des laboratoires de l’université ou du CNRS travaillent de plus en plus, sur contrat, avec des subsides provenant de l’industrie. Les industriels, à juste titre, ne souhaitent pas que les résultats ainsi obtenus et utilisés par eux soient divulgués. Le secret est donc de règle pendant un certain temps. Ce qui limite encore la diffusion des thèses.
  10. (retour)↑  Les thèses scientifiques sont loin d'être un « Ktèma es aeï » comme Thucydide l'écrivait de son oeuvre : on instituerait ainsi un vaste cimetière national, qui, cependant, dans quelques siècles ou millénaires, pourrait faire le bonheur d'historiens des sciences. On ne regrette que trop la disparition d'une immense partie des oeuvres (y compris scientifiques) de l'Antiquité pour ne pas souhaiter conserver précieusement cette production contemporaine pour l'éternité.
  11. (retour)↑  UMI vient de rendre accessible une partie de ses fichiers sur Internet (notices des thèses de philosophie, religion et théologie depuis 1980 et catalogue de ses services) : les données sont disponibles dans plusieurs formats courants et en ASCII (gopher.umi.com et bientôt en WWW : http://www.umi.com).