Le document numérique
Il est peu de dire que le document numérique suscite de l’intérêt dans le monde de la recherche en sciences de l’information : on ne compte plus les articles, réflexions et écrits divers sur ce sujet. La revue Information-Interaction-Intelligence rassemble dans ce numéro thématique Le document numérique une dizaine de contributions de chercheurs en sciences de l’information. Avec pour sous-titre « Une revue en sciences du traitement de l’information », elle se veut transversale et multidisciplinaire et souhaite rapprocher des domaines de recherche tels que bases de données, intelligence artificielle ou les interactions homme-machine.
Dans leur introduction, les coordonnateurs de ce numéro, J.-M. Salaün et J. Charlet, expliquent leur démarche : avec les nouveaux formats de mise à disposition de l’information sur les réseaux, le document traditionnel (imprimé, papier) subit de nombreuses transformations et modélisations. L’objectif de ce numéro est de les rassembler, de les expliquer dans la mesure où ils induisent pour l’avenir de nombreux changements.
La modélisation des documents
V. Lux-Pogodolla (Atilf-CNRS) et J.-Y. Vion-Dury (Inria) nous offrent leurs réflexions sur la modélisation des documents. Qu’est-ce que le document aujourd’hui par rapport à l’environnement technologique ? Une (des) modélisation(s) s’avère(nt) nécessaire(s). Les auteurs notent une abstraction croissante vis-à-vis du médium physique : le document numérique intègre l’image ou le son grâce à des formats spécifiques, le traitement peut être complexe avec le recours à des logiciels spécialisés ; sa structure est différente. Format et traitement sont interdépendants par rapport à l’édition du document, et une classification des modèles connus est proposée : TeX et Metafont pour la typographie ; modèles Wysiwig pour le processus d’édition ; modèles Grif et XML séparant le contenu de la présentation ; HTML et HyTime pour la navigation dans les documents comportant des hyperliens ; PostScript pour l’impression ; PDF et DjVu pour la publication en ligne. Une « véritable ingénierie du document » se met ainsi en place. Pour illustrer leur propos sur les transformations et les usages actuels du document numérique, les auteurs prennent trois exemples : la réutilisation par copier-coller ; les transformations avec des formats tels XML, HTML, GIF et autres ; et enfin, la navigation. Les modèles actuels, hétérogènes, doivent tendre à un modèle unifié du document.
Pour O. Beaudoux (Éséo ; Inria), les interactions possibles sur un document sont rarement évoquées. Il propose un modèle de composants centré sur les documents et les instruments, le modèle DPI (Document, Présentation, Instrument). L’implantation d’un tel modèle dans une boîte OpenDPI permet de s’affranchir de la notion même d’application. La perspective de l’auteur est de valider ce modèle en construisant une suite logicielle : un espace de travail collaboratif pourra alors être défini.
S. Crozat (Université de technologie de Compiègne) et B. Bachimont (Ina) abordent le document numérique selon trois niveaux de structure – organisation, contrôle et interaction – implantés dans une chaîne éditoriale, Scenari. Le document n’est plus un, il est plusieurs, suite à la manipulation opérée. Il peut être déconstruit, formalisé, reconstruit. Selon N. Aussenac-Gilles (Université Lille III) et A. Condemines (Université Toulouse II), document électronique, ressources terminologiques et ontologiques, usages présentent des liens étroits qu’il convient d’approfondir et de développer. Dans une seconde contribution qui poursuit la première, S. Crozat et B. Bachimont avancent que le numérique déconstruit le document, le contenu perd en objectivité ou est dilué.
Les caractéristiques du document électronique
S. Lainé-Cluzel (Ersicom-Université Lyon III) approfondit la notion de document électronique en présentant ses caractéristiques par rapport au document traditionnel. La réflexion est élargie à l’information numérique différenciée en données, ressources et documents. S. Leleu-Merviel (Université de Valenciennes) complète la réflexion précédente et propose plusieurs dimensions du document numérique : sémiotique ; technique ; médiatique. Elle s’interroge sur les « changements que draine la numérisation », sur la difficulté de contrôler le sens avec les nouveaux dispositifs et enfin sur le web en tant qu’espace de création. M.-A. Chabin (Archive 17) questionne la notion de document vu comme une « trace » d’activité humaine et une « source d’information ».
D. Cotte (UMR Lalicc, Université Paris IV) et M. Després-Lonnet (UMR Cersates, Université Lille III) prennent l’exemple de la mise en ligne de la presse et contestent le fait qu’un journal électronique puisse être composé à partir de « briques de textes ». Une réécriture apparaît forcément comme nécessaire. D. Boulier et F. Ghitalla (Costech, Université de technologie de Compiègne) abordent la question de la lecture sur le web, à partir d’une enquête réalisée auprès d’internautes. Ils s’attachent au rôle des formats techniques, au fait de s’approprier pour l’usager ce que les auteurs appellent le « web chewing-gum ». Celui-ci doit, en lisant sur Internet, interpréter de manière simultanée le corpus, le document et le signe. Dans un dernier article, S. Bringay, C. Barry (CNRS-FRE) et J. Charlet (AP-HP Paris) montrent l’intérêt des annotations numériques sur le dossier du patient hospitalisé.
Cet ouvrage est très riche d’enseignements, seuls certains ont été pris en compte dans ce résumé, ce que les auteurs voudront bien excuser. Un des points importants est leur réflexion commune pour caractériser le document numérique par rapport au document traditionnel, afin d’approfondir le concept et d’apporter des éléments de réflexion. Même si certaines applications du numérique apparaissent comme des avancées positives, une incertitude demeure quant au web lui-même, son devenir et son contenu. La proposition d’unifier les formats existants serait cependant une avancée importante par rapport au document numérique et à son approche par l’utilisateur.