Rapport sur la diffusion électronique des thèses

par Ghislaine Chartron
établi par un groupe de travail et rédigé par Claude Jolly, chargé de la Sous-direction des bibliothèques et de la documentation. Paris : Ministère de l’Éducation nationale–SDBD, 2000. Document électronique : http://195.83.249.62/bib/acti/These/jolly/entete.htm

Le 26 novembre 1999, le cabinet du ministre de l’Éducation nationale, de la Recherche et de la Technologie formulait la demande de constitution d’un groupe de travail sur la numérisation des thèses et leur diffusion par voie électronique.

Le présent rapport, rendu en juin 2000, dresse les conclusions de ce groupe dirigé par Claude Jolly, chargé de la Sous-direction des bibliothèques et de la documentation (SDBD). Il intègre le rapport lui-même, rédigé par Claude Jolly, les prescriptions techniques rédigées par Christian Lupovici, directeur du Service commun de la documentation de l’université de Marne-la-Vallée, et les annexes relatives aux différents travaux du groupe, établies par Christine Okret, conservateur au bureau de la modernisation des bibliothèques de la SDBD.

Contexte

Cette réflexion concerne plus largement l’évolution des dispositifs de production, d’édition, de valorisation et de conservation des publications scientifiques dans l’environnement actuel des technologies numériques en réseau. Avec l’opportunité de ces technologies, l’objectif poursuivi est de redéfinir un cadre organisationnel et technique du cycle de vie de ces documents le plus efficace possible par rapport aux exigences des auteurs, des lecteurs et des professionnels du document.

Les premiers projets de thèses en ligne sur Internet sont nés dans certaines universités américaines, et notamment à l’université de Virginia Tech en 1987 ; les dynamiques se sont ensuite fédérées par la constitution d’un réseau : Networked Digital Library of Theses and Dissertations 1. En septembre 1999, le Workshop organisé par l’Unesco à Paris, visait à formuler une stratégie internationale pour la production et la diffusion électronique des thèses 2. En France, pour donner un ordre de grandeur, 11 000 thèses sont soutenues par an, et très peu sont éditées à des fins de valorisation plus large que l’université de soutenance.

On ne peut donc que se réjouir d’une réflexion nationale sur ce dossier inscrivant la France dans ces projets internationaux, dont la finalité majeure est celle d’une valorisation et d’une circulation plus grande de certains résultats de la recherche scientifique.

Statut juridique des thèses de doctorat

Le rapport commence par rappeler les dispositions législatives et réglementaires se rapportant à la diffusion et à l’accès aux thèses. La thèse est un document relevant avant tout de la législation sur la propriété intellectuelle (droits d’auteur), mais aussi de la législation des documents administratifs définissant des règles d’accès auxdits documents. Selon l’arrêté du 25 septembre 1985, il revient au président ou au directeur de l’établissement de soutenance d’autoriser ou non, sur avis du président du jury, la reproduction d’une thèse. Afin de simplifier les procédures, le rapport préconise l’établissement d’un nouveau formulaire accompagnant le dépôt incluant l’accord (et les restrictions éventuelles formulées) de l’auteur et du chef d’établissement pour la diffusion électronique.

Le rapport préconise une diffusion par voie électronique la plus large possible, ainsi que la mise en ligne complète du texte intégral si possible. Le souci d’un archivage numérique pérenne de ces documents est au cœur des choix techniques préconisés. La durée de mise en ligne, quant à elle, n’est pas réglée d’avance et devra être pensée selon les spécialités scientifiques, en fonction de la demande. L’édition papier est considérée dans cette logique comme secondaire par rapport à la version électronique, elle n’est pas pour autant abandonnée, mais sera mise en œuvre à la demande.

Le rapport formule une proposition du nouveau schéma envisagé, précisant à la fois les rôles partagés du doctorant, de l’établissement de soutenance et de l’État en tant qu’opérateur national. Globalement, l’État veille à la cohérence du dispositif en fixant un cadre général associé à certaines prescriptions, il fournit des outils techniques nécessaires et joue un rôle d’assistance et de conseil. Les établissements de soutenance doivent assurer le signalement, la valorisation et la diffusion de leurs thèses. C’est donc une organisation décentralisée, mais contrôlée par un État régulateur, qui est proposée.

Le rapport donne un premier inventaire des moyens nécessaires à la mise en œuvre de ce dispositif, moyens propres aux établissements et moyens de l’opérateur national pour les fonctions qui lui seront dévolues, l’Abes (Agence bibliographique de l’enseignement supérieur) et le Cines (Centre informatique national de l’enseignement supérieur) sont alors cités.

Dans ce schéma, la restructuration des ateliers nationaux de reproduction des thèses est en réflexion, la reproduction sur microfiches disparaissant au profit d’un archivage numérique local en XML et d’un archivage centralisé de secours probablement hébergé sur le Cines.

Les prescriptions techniques

C’est en prenant en compte les expériences étrangères et les travaux menés par les organismes internationaux de normalisation que sont proposées des prescriptions techniques pour le dépôt des thèses en format électronique. Il est distingué : le format de production, le format d’archivage et le format de diffusion. Le format d’archivage électronique choisi est XML (eXtensible Markup Language) avec une référence explicite aux trois DTD (Définition de Type de Document) normalisées dans le secteur de la documentation : ISO 12083 (livres et articles scientifiques), TEI (textes en lettres et sciences humaines et sociales), EAD (documents de type archive). Ce format impose une logique de structuration qui devra être prise en compte dès la création du document par l’auteur, donc dans le format de production.

Ces structurations, ainsi que le renseignement de « métadonnées », permettront par la suite d’envisager différents traitements de ces documents (recherche documentaire, création de notices de catalogues et autres produits dérivés…). On introduit ainsi la notion de « modèle de saisie » à respecter par l’auteur à travers l’utilisation de feuilles de style dans son traitement de texte. Conformément aux exigences de cohérence auxquelles doit veiller l’opérateur national, le rapport propose une liste minimale d’éléments à prévoir dans cette structure (appelés « éléments de données »). En s’appuyant sur la référence internationale du Dublin Core, il précise aussi un ensemble de métadonnées utiles pour les thèses.

Les formats de diffusion de la thèse au lecteur seront choisis par l’établissement en conformité avec les outils de lecture disponibles (PDF, HTML) et les demandes des usagers. Dans ce cadre, l’impression papier ne disparaît pas, elle peut être assurée directement par les établissements ou par des acteurs-partenaires de ces établissements.

On peut souligner que la formation initiale des doctorants au respect de ces feuilles de style est un facteur déterminant dans la performance du dispositif. Or, sur ce point, nous formulerons quelques réserves pour connaître un peu les nombreux « bricolages » que constitue l’édition d’un travail de thèse… Il faut encourager ces méthodologies associées au travail éditorial tout en sachant qu’il sera nécessaire dans bien des cas d’apporter les correctifs d’un professionnel de l’édition électronique.

Le rôle des SCD dans le nouveau dispositif

Une question intéressant en premier lieu les professionnels des bibliothèques est d’identifier leur rôle dans cette nouvelle chaîne de traitement des thèses. Jusqu’à présent, le rôle de chaque SCD concernait le dépôt et la transmission de bordereaux à trois pôles de signalement nationaux qui assuraient la saisie et l’enregistrement dans la base Téléthèses. L’architecture distribuée du nouveau dispositif donnera à chaque SCD la responsabilité du signalement des thèses de son université, à savoir le catalogage local, le catalogage collectif en relation avec le Sudoc (système universitaire de documentation) et le catalogage dans les bases spécialisées.

D’autres fonctions pour la chaîne électronique sont pointées : formation et assistance technique des étudiants, gestion des fichiers informatiques, contrôles techniques et édition papier à la demande. Pour prendre en charge ces fonctions, sont alors citées les écoles doctorales, un opérateur technique local restant souvent à identifier, mais dont le rôle est évidemment majeur dans cette organisation.

Une question pourrait là aussi être alors soulevée : n’appartient-il pas aussi aux bibliothèques de se positionner sur la formation et sur les techniques d’édition électronique, au lieu de se limiter aux traditionnelles fonctions de catalogage ? Au risque, nous semble-t-il, de voir leur rôle diminué, alors qu’il pourrait être élargi dans les reconfigurations actuelles de la documentation scientifique.

Les prochaines étapes

Plusieurs étapes ont été formulées dans ce rapport pour continuer la réflexion et amorcer progressivement la construction du dispositif : consultation des établissements pour vérifier l’adhésion au schéma proposé et mise en œuvre rapidement d’un nouvel arrêté relatif aux modalités de production, dépôt, signalement, conservation et diffusion des thèses. Depuis la publication de ce rapport, les orientations ont été officiellement confirmées par la circulaire du 28 septembre 2000 3, envoyée aux présidentes/présidents d’universités et aux directrices/directeurs d’établissements d’enseignement supérieur.

Dans ce cadre, les premières expérimentations françaises de thèses en ligne (université de Lyon 2, Institut national des sciences appliquées-Insa de Lyon, université de Marne-la-Vallée) devraient certainement être suivies d’autres projets. Les savoir-faire développés devraient alors réactualiser plus globalement la question de la maîtrise éditoriale des universités dans le contexte de l’édition électronique.

Nous encourageons vivement la lecture de ce rapport officiel clair et précis pour comprendre les réorganisations actuelles et l’évolution des pratiques professionnelles qui s’y trouve associée.