Cyberthèses en Europe

Viviane Boulétreau

Jean-Paul Ducasse

Marie-Pierre Gilliéron-Graber

Le programme Cyberthèses 1 est consacré à l’édition électronique des thèses académiques à des fins d’archivage et de diffusion libre et ouverte, en respectant les normes en vigueur : SGML, XML, qui favorisent l’accès libre à l’information savante. Ce programme veut permettre à tout établissement universitaire d’acquérir son autonomie en matière de publication électronique, tout en s’intégrant dans un réseau qui mutualise les travaux universitaires de recherche et les compétences indispensables à l’élargissement et au développement de ce programme. Il fonctionne en réseau d’abord francophone, mais dépasse aussi les limites de notre propre espace linguistique et s’ouvre sur les aires voisines : hispanophone et lusophone. Ce programme est soutenu depuis l’origine par l’Agence intergouvernementale de la francophonie-Fonds francophone des inforoutes.

Le cadre de la coopération

C’est dans un cadre peu fréquent, l’Europe francophone, que se développe une coopération entre deux institutions universitaires suisse et française : l’université de Genève 2 et l’université Lumière Lyon 2 3. Cette coopération est née de la rencontre d’acteurs, membres de ces deux universités, conscients des enjeux de l’édition électronique savante, avec l’appui des décideurs de leurs établissements, et favorables au développement des relations interuniversitaires entre deux régions voisines. Elle s’appuie sur une philosophie commune de développement et de partage des compétences en direction de la communauté universitaire internationale. Logique de réseau, intelligence répartie, sont appliquées au monde de la documentation et des bibliothèques et fournissent un exemple des nouvelles perspectives que le traitement numérique de l’information ouvre au monde des bibliothèques à travers l’exemple de deux universités dont les champs scientifiques, disciplinaires et linguistiques se complètent.

L’université de Genève, francophone, est multidisciplinaire et couvre les sciences humaines et sociales et les sciences « exactes ». Un certain nombre de thèses est soutenu en français et en anglais ou entièrement en anglais, et plus rarement en allemand, italien ou espagnol ; l’université Lumière Lyon 2, purement francophone, ne traite, quant à elle, que des sciences humaines et sociales.

Avec environ 13 000 étudiants répartis dans 9 facultés et quelques instituts, l’université de Genève produit entre 250 et 300 thèses par an, la faculté de médecine comptant pour environ la moitié de cette production. Il y a une moyenne de 335 pages par thèses en sciences humaines et d’environ 100 pages pour les sciences exactes.

Université de sciences sociales et humaines, Lumière Lyon 2 compte 28 000 étudiants répartis en douze facultés et instituts. 1 500 étudiants sont inscrits en doctorat et 150 à 180 thèses y sont produites chaque année. Le volume des thèses en sciences sociales et humaines est important : plus de 400 pages en moyenne.

Le contexte d’origine et les évolutions nécessaires

Depuis la fin 1998, l’université Lumière Lyon 2 coopère avec l’université de Montréal à la mise au point d’une chaîne de traitement automatique de documents structurés, avec le soutien de l’Agence intergouvernementale de la francophonie, dans le cadre des actions du Fonds francophone des inforoutes.

Les outils de traitement développés s’appliquent essentiellement aux documents issus de traitements de texte génériques ; ils intègrent, en plus du texte, les images, le son, les images animées et la vidéo, et permettent de produire un format d’archivage en SGML structurant la thèse à partir de la DTD TEI-Lite 4. Le programme exporte automatiquement les documents SGML vers d’autres formats plus communément utilisés pour la diffusion (HTML et XML). La réalisation de cette plate-forme logicielle et sa mise à disposition de la communauté universitaire francophone et internationale sont les raisons d’être du programme Cyberthèses 5.

La mise en place d’un programme de publication électronique des thèses met en évidence deux problèmes cruciaux, auxquels les créateurs de Cyberthèses ont été confrontés :

– la formation des doctorants, qui sont les producteurs de documents, pour leur enseigner les règles essentielles de production et de structuration de documents ;

– l’administration, la prise en main de la plate-forme éditoriale par des professionnels, non pas de l’informatique, mais de la conservation, de l’archivage et de la diffusion des documents.

Le didacticiel

En relation avec la chaîne éditoriale, la formation des étudiants a été développée de manière significative à Lyon 2. Seuls 30 % des étudiants utilisent correctement leur traitement de texte (principalement MS Word). Les autres ne savent pas générer une table des matières, un index, des notes de bas de page, des ancres ou des liens. Les doctorants actuels constituent une génération intermédiaire : n’ayant jamais eu de formation bureautique, ils utilisent encore leur ordinateur comme une machine à écrire électronique. Cette situation est temporaire, mais le besoin de formation est crucial et urgent !

Des documents de formation ont été préparés et diffusés, des ateliers organisés régulièrement permettent ainsi une meilleure adaptation de la formation aux besoins des doctorants. Durant l’année académique 1999-2000, environ 300 étudiants ont été formés à l’utilisation de la feuille de style permettant la structuration de leur travail et l’effet sur la qualité du document final a été immédiat.

Cette formation doit dépasser le simple aspect « technique » de l’utilisation d’un modèle de document (la feuille de style), et devenir une véritable sensibilisation aux enjeux de la conservation et de la publication électronique des résultats de la recherche scientifique. Pour cela, il faut imaginer un cadre pédagogique et des outils qui permettent une diffusion la plus large possible de supports didacticiels en profitant des possibilités offertes par le web.

Le groupe multimédia de l’université de Genève a mis ses compétences en ingénierie éducative à la disposition du programme Cyberthèses. Ses expériences (diffusion de films avec la technique streamline pour les médiathèques de l’université, diffusion sur le web de leçons thématiques, démonstrations en ligne, et très récemment la possibilité de suivre à distance et en temps réel des cours en informatique) et ses compétences sont précieuses pour aller de l’avant à un niveau conceptuel et technique dans la réalisation d’un didacticiel. Lyon apporte son expérience pédagogique de cours pour étudiants, tandis que les réalisations techniques seront faites à Genève.

Plusieurs unités de formation ont été définies et dédiées chacune à des aspects ou des publics différents, typiques de toute diffusion électronique de documents structurés :

– une unité « politique » présentera les différents aspects des programmes d’édition de thèses électronique : buts, signification, enjeux, etc. ;

– une unité pratique pour les étudiants traitera de la gestion des documents multimédias, de l’usage approprié des traitements de texte en présentant comment des modèles de documents peuvent constituer à la fois une aide bienvenue à la gestion du document et un premier pas vers sa structuration ;

– une unité pour les universités sera aussi réalisée, présentant divers points tels que le circuit administratif des thèses électroniques, les services nécessaires au développement d’un programme de documents scientifiques électroniques (ressources pour la digitalisation et la reprographie) et les aspects légaux (plagiat, droits d’auteur).

Ces unités ont été définies à travers une intense collaboration entre les deux universités partageant leur expérience dans la pédagogie à distance et la formation des étudiants. Le didacticiel sera disponible sur le web sous la forme de présentations de diapositives animées et sonores et de pages HTML classiques. Ces outils pédagogiques seront associés à des modules pour l’aide en ligne qui seront intégrés, telles des boîtes aux lettres où les auteurs auront la possibilité de poster des questions et des extraits de texte pour une vérification de l’utilisation du modèle de document. Un tutorat à distance pourra aussi être développé pour l’aide locale aux étudiants et l’assistance aux utilisateurs de la chaîne éditoriale.

Le didacticiel en ligne doit être absolument simple et souple dans la perspective de compétences partagées avec d’autres partenaires et prêt à répondre aux besoins de formation de participants très divers de Cyberthèses. Une édition sous forme de cédérom facilitera l’utilisation du didacticiel tout en s’affranchissant des problèmes techniques et financiers de connexion.

La chaîne éditoriale

L’autre axe de cette coopération concerne l’administration et l’utilisation de la chaîne éditoriale.

La version initiale mise au point par Montréal et Lyon – une machine serveur, des programmes, un administrateur – nécessitait des compétences que ne possèdent pas toutes les universités du Nord ni du Sud. Afin de permettre à des non-informaticiens d’utiliser la plate-forme logicielle éditoriale, le service informatique de l’université de Genève a proposé la mise en place d’une interface web de la chaîne éditoriale, rendant ainsi les différentes opérations de traitement des documents maîtrisables par tous ; cette interface permet d’utiliser à distance la chaîne de traitement. Celle-ci est alors implantée sur un serveur auquel plusieurs utilisateurs d’universités différentes peuvent avoir accès. Chaque université dispose sur le serveur distant de son propre espace pour traiter les thèses. Ensuite, les documents électroniques destinés à l’archivage ou à la diffusion sont rapatriés sur le site de chaque établissement.

Ce traitement à distance est :

sécurisé : les utilisateurs doivent s’authentifier avant d’accéder au serveur ;

simple : il dispense l’utilisateur de la gestion des mises à jour des programmes de traitement ;

souple : l’utilisateur peut travailler à partir de son poste habituel ;

économique : il permet de mutualiser les postes de traitement et les ressources humaines nécessaires à leur gestion ;

pratique : l’utilisateur ayant une configuration standard de la chaîne, l’assistance sera plus efficace en cas de besoin.

L’environnement d’aide à destination des utilisateurs a été amélioré. Des messages permettent à l’opérateur de comprendre les problèmes rencontrés et de les résoudre. Chaque erreur est répertoriée, expliquée dans des fichiers d’aide qui permettent à l’opérateur de corriger l’origine de l’erreur en intervenant directement sur le fichier source pour reprendre ensuite le traitement.

C’est à partir d’un dialogue entre les informaticiens et les professionnels de la documentation qui utilisent la chaîne éditoriale que ces résultats ont été obtenus. L’administration, la gestion, l’utilisation de cette chaîne éditoriale sont assouplies et la diffusion de ce procédé d’édition électronique en est facilitée. Cette nouvelle architecture de la chaîne d’édition, permettant une séparation géographique entre l’aspect matériel, technique et l’utilisateur, sera particulièrement utile au projet initial afin d’aider plus efficacement les participants à mettre en place leur projet local. Ils auront les outils nécessaires pour assurer ensuite, eux-mêmes, la formation et le soutien à leurs voisins. La possibilité pour le système d’être partagé par plusieurs institutions et des outils pédagogiques communs vont entraîner la collaboration d’un plus grand nombre de participants et faciliteront un développement cohérent.

Conclusion

Chaque nouvel utilisateur de la chaîne éditoriale l’enrichit en apportant sa propre brique au projet global, tel que l’a déjà fait l’université du Chili en traduisant tous les outils en espagnol, comme le feront certainement, par des contributions diverses, les universités de Fribourg et de Neuchâtel en Suisse, intéressées par Cyberthèses.

Le but de Cyberthèses reste le partage de la connaissance et des compétences avec les pays en voie de développement. En 2001, toujours avec l’aide de la francophonie, des groupes de travail seront organisés pour former le personnel en charge des chaînes d’édition dans quelques institutions réparties dans différentes aires géographiques.

En privilégiant des ressources ouvertes et libres, l’autonomie des utilisateurs, le développement du programme vers d’autres régions linguistiques et en collaborant avec d’autres institutions, ce projet devient un exemple d’utilisation des compétences réparties qui ne demande qu’à se généraliser en Europe et ailleurs. C’est la contribution européenne à l’extension en francophonie du programme Cyberthèses. En même temps, il renforce la notion de réseau puisque c’est l’expérience et les compétences de chacun des membres qui permettent l’amélioration des processus au bénéfice de tous. D’autres pistes de développement existent : intégration de TeX-LateX, prise en compte des formules mathématiques (MathML)…

C’est en s’appuyant sur la communauté et les réseaux de partenaires du Nord comme du Sud que le programme Cyberthèses avance.

  1. (retour)↑  http://mirror-fr.cybertheses.org/index.html
  2. (retour)↑  Les thèses à l’université de Genève : http://www.unige.ch/cyberdocuments/
  3. (retour)↑  Les thèses à l’université Lumière Lyon 2 : http://theses.univ-lyon2.fr/index.html
  4. (retour)↑  Définition de Type de Document : grammaire qui définit quels sont les éléments qu’on peut utiliser dans un certain type de documents pour les structurer, comment on a le droit de les utiliser et quelles sont leurs relations (ordre d’apparition, fréquence, imbrication). Un document est valide s’il correspond à sa DTD. La DTD TEI (Text Encoding Initiative) Lite fournit un jeu d’éléments de données de base utilisables pour les cas génériques et notamment pour les sciences humaines et les études sur les textes littéraires, mais d’autres types de données comme les images et les sons sont également pris en compte.
  5. (retour)↑  Pour une description plus complète des origines de Cyberthèses : Documentaliste-Sciences de l’information, 1999, vol. 36, n° 6, p. 337-344 ; et pour une explication technique : Cahiers Gutenberg, mai 2000, n° 35-36, p. 25-36.