La publication scientifique électronique
Gestion et conservation
Isabelle Masse
Le 24 mars dernier, et pour la troisième année consécutive, Ile de Science organisait, à l’Institut national agronomique-Paris Grignon (INA-PG), une journée d’information et de réflexion sur la documentation scientifique électronique, journée présidée, présentée et animée par Jean-Claude Guédon, de l’université de Montréal, responsable de la revue électronique Surfaces.
C’est à une analyse générale de la publication scientifique électronique en science que s’est livré Howard J. Moore, de l’Unesco et de l’ICSU Press (International Council of Scientific Unions). Tout en soulignant la complexité des multiples aspects de l’édition électronique, il a insisté sur le fait que les journaux électroniques transforment la gestion et la communication de l’information scientifique et la manière dont la recherche est menée.
La situation en Amérique du Nord
Jean-Claude Guédon a décrit la situation sur le continent nord-américain, où les premières publications électroniques datent des années 1989-1990. Là-bas, les chercheurs sont aujourd’hui conscients que les fonctions de la revue papier – communication, archivage, validation – doivent être conservées dans la version électronique.
L’archivage, et donc le problème de la pérennité, est actuellement en cours de résolution, sur deux bases : d’un côté, l’adoption de plus en plus courante de la norme SGML (Standard Generalized Markup Language), de l’autre, la mise en place d’un support réellement standard et fiable qui permette de lire dans cinquante ans et plus les documents électroniques créés aujourd’hui.
Quant à la validation, elle dépend du comité d’évaluation de l’institution qui contrôle. Le problème est maintenant résolu : au Canada, par exemple, si le comité de rédaction d’une revue est reconnu comme sérieux, sa publication électronique est autorisée ; les demandes de subvention sont traitées de la même manière.
Formats et normes du document électronique
Catherine Lupovici, de la société Jouve, a décrit les formats et normes du document électronique pour la création d’une publication et sa conservation. Seule l’application de normes internationales ou de standards très répandus peut garantir la pérennité des documents. Ces normes, qui codent la structure logique de familles de documents, appartiennent à l’ensemble SGML, et permettent de créer des documents révisables.
SGML. Cette norme a été définie par le monde de l’édition pour normaliser les pratiques de balisage des documents dans les traitements des chaînes d’édition. Elle permet de gérer tous les documents en cours de publications dans une base de données.
HTML (Hypertext Markup Language). C’est une application particulière de SGML. Outil de création et de diffusion sur le Web, elle permet une structure simple de documents et donne la syntaxe pour la notation des liens hypertextes permettant la navigation sur le Web.
XML (Extended Markup Language). C’est une norme en cours de finalisation par le W3 Consortium, un SGML allégé et un outil plus puissant que HTML pour la distribution de documents plus complexes sur le Web. Elle donne la possibilité de gérer isolément des portions de documents, le balisage de la structure étant autosuffisant, et de mettre en œuvre des liens autodescriptifs qui permettent de typer la ou les cible(s).
PDF (Portable Document Format) est, quant à lui, un format propriétaire développé par la société Adobe, un langage de description de page qui ne concerne que les documents non révisables. L’outil Acrobat offert par Adobe pour la création et l’utilisation des documents en format PDF permet d’associer à l’image de la page une recherche en texte intégral et des liens hypertexte.
Le point de vue d’un chercheur
Jean-Paul Allouche est chercheur au CNRS et responsable d’une revue, le Journal de théorie des nombres de Bordeaux, qui existe toujours dans sa version papier. Sa mise en réseau n’a donc pas signifié la création d’une nouvelle revue. La version électronique actuelle est simple 1, en langages HTML, et TeX pour les formules mathématiques.
Deux questions importantes se sont posées : le coût et l’archivage. Pour le coût, la version papier bénéficie d’une subvention du CNRS et certains frais ne sont pas à la charge de la revue. Le démarrage de la version électronique a été rendu possible par un projet ministériel spécifique 2, mais les subventions correspondantes ne seront pas reconduites au-delà de la durée du projet. Tant que cela sera possible, la consultation électronique sera gratuite, même pour le lecteur non abonné à la revue papier. Pour ne pas « tuer » la forme papier, les articles ne sont mis en ligne que huit à dix mois après leur publication sous forme traditionnelle.
L’existence d’une revue traditionnelle, de sites-miroirs et d’archives papier (un exemplaire est déposé à la Bibliothèque nationale de France) rend moins cruciale la question de l’archivage.
Plus généralement parlant, les éditeurs privés ne prévoient qu’un accès à durée limitée à leurs archives électroniques, mais ils n’assurent pas la disponibilité des archives papier non plus (c’est le rôle de la BnF). Pour ce dernier support, il faut certes prévoir usure, accidents, dégradation, etc., mais ces problèmes sont sans commune mesure avec ceux qui se posent pour l’édition « virtuelle » : évolution et obsolescence rapides des logiciels et des matériels, des supports et des formats…