La gestion électronique de documents

Annie Le Saux

La gestion électronique de documents et la documentation, vaste programme encore peu exploré, si ce n'est par le monde des documentalistes, du moins par celui des bibliothécaires. Le fait que, pour la première fois, le groupe EIT 1 de l'Association des documentalistes et bibliothécaires spécialisés ait décidé d'y consacrer une journée entière d'étude, le 9 avril 1992, au ministère de la Recherche et de la Technologie, répond à une demande de la part des entreprises et de leurs centres de documentation.

Qui dit gestion électronique de documents dit système de gestion électronique de documents (SGED), dont l'objet est de stocker des documents ou des informations sur des supports optiques, essentiellement des disques optiques numériques, et de faciliter, grâce à des outils informatiques, la gestion des flux de documents, leur diffusion et leur conservation. Ces systèmes remplacent le papier, document de base dans 95 % des cas, et visent à améliorer les fonctions d'archivage, de classement, de recherche et de diffusion de l'information : gain de place, facilité pour retrouver les documents avec possibilité d'y accéder à plusieurs, gain de temps.

Trois étapes préparent à l'installation d'un SGED : une étude de faisabilité, qui s'intéresse à l'existant et aux besoins ; la détermination des modes opératoires pour définir les tâches du personnel du service de documentation ; le choix des matériels et des logiciels.

Les choix techniques

Mettre en place un SGED demande une connaissance des configurations techniques, matérielles et logicielles envisageables, qu'il est difficile d'acquérir avec précision, car, ces systèmes étant en constante évolution, il n'existe pas de modèle infaillible et durable.

De quoi se compose un SGED ?
- d'une base de données, dans laquelle sont indexés les documents ;
- d'une base images, où sont stockées les images des documents primaires ;
- d'un matériel puissant de gestion et de traitement informatique : mainframe 2, station de travail, micro-ordinateur sous MS-DOS ;
- d'une imprimante pour reproduire les documents primaires ;
- d'un scanner 3 pour numériser les documents primaires ;
- d'un écran de consultation des documents (l'idéal étant d'avoir un écran large, 2xA4 ou 19", permettant de visualiser en parallèle le document primaire et le document secondaire, la meilleure définition est de 300 BPI 4 horizontalement et 150 BPI verticalement ;
- de réseaux standardisés de type Ethernet ;
- d'un disque magnétique ou d'un disque optique (disque dur, DON ou DAT 5) pour le stockage des documents .

En complément de cet investissement matériel, des logiciels d'acquisition et de traitement d'images, des logiciels de gestion et de recherche documentaire et des logiciels d'archivage des documents primaires.

Une étude approfondie de l'existant et du potentiel, de l'objectif recherché, de l'utilisateur final guidera les choix entre les différentes techniques. Prenons comme exemple le passage d'un document papier à un document électronique ou sur support électronique. Il peut se faire de plusieurs façons :
- en mode caractère, pour du texte interprétable par la machine, en format ASCII par exemple ;
- en mode image ou format bitmap ou raster 6, et, dans ce cas, le contenu du document n'est pas interprétable par la machine ;
- en mode graphique, pour les plans et les dessins.

Le choix de l'un de ces formats dépend du type et du volume des documents. Selon que l'on désire stocker des documents textuels, des documents contenant du texte et des graphiques, ou encore des documents multimédias, on préférera l'une ou l'autre de ces techniques, la première ne permettant pas, par exemple, de stocker les graphiques.

Le choix intervient également au niveau de la saisie du texte qui se fait soit à la main soit par numérisation. Il intervient aussi selon les volumes : le mode image prend beaucoup plus de place que le mode ASCII et nécessite un recours à des techniques de compression si l'on veut limiter la taille du document pour le stockage et la transmission. Enfin, ce choix dépend de l'accès, le mode caractère offrant un accès direct à l'information, et le mode image un accès indirect.

Normes et standards

Pour permettre la réutilisation des informations sans remettre en cause les investissements antérieurs, ces différents matériels et logiciels doivent être compatibles. L'extension des SGED en dépend et s'imposera d'autant mieux qu'il y aura normalisation.

La normalisation en effet offre des garanties au transfert et à la lecture des informations par le plus grand nombre de systèmes, sans limite dans le temps ou dans l'espace. Normes et standards - normes de fait, non officialisées - doivent permettre non seulement la communication mais encore la réutilisation des données en cas de défaillance du support.

Citons par exemple la norme de stockage et d'échange d'images, de dessins ou de documents numérisés TIFF 7.

Citons encore les formats normalisés SGML et ODA, destinés à favoriser l'échange des documents.

SGML ou Standard Generalised Markup Language est un métalangage, qui permet de construire des langages normalisés pour baliser la structure logique d'un document. Ce langage a pour objectif de favoriser l'échange de documents, mais la communication entre deux systèmes SGML nécessite un accord préalable.

Le SGML est appliqué entre autres dans l'édition d'encyclopédies et de dictionnaires afin de normaliser les échanges et de faciliter la diffusion d'une même source vers plusieurs supports : papier, CD-ROM, ... SGML n'est pas un système complet, car il ne décrit que la structure logique des documents. Il faut donc se référer à d'autres normes pour la structure physique.

Le contenu d'un document SGML est le suivant :
- la déclaration SGML, c'est-à-dire des généralités comme le jeu de caractères utilisés, la capacité mémoire nécessaire au traitement du document, ... ;
- la définition de type de document (DTD), qui spécifie la structure formelle logique du type de document ;
- le texte balisé selon la DTD.

ODA, Office Document Architecture, définit une architecture ouverte de documents bureautiques, structure physique et structure logique. On a ainsi un document retraitable indépendamment du support. ODA est un système qui, à la différence de SGML, ne nécessite pas d'accord préalable pour échanger un document. C'est un système où les correspondants ne se connaissent pas, ce qui est fréquent dans les échanges télématiques. Les documents peuvent être sous trois formes :
- formatée, dans ce cas, le document n'est pas modifiable par l'utilisateur final ;
- retraitable, le document est modifiable mais n'a pas été formaté pour l'impression ;
- formatée et retraitable.

Aucune de ces normes n'est autosuffisante, car chacune d'elle se limite à une partie du processus d'élaboration du document. Choisir une de ces normes fait partie d'une stratégie, dans laquelle on doit tenir compte de la cohérence de l'ensemble du processus de gestion des documents.

En ce qui concerne l'information multimédia et hypermédia, des groupes de travail, créés au sein de l'ISO 8 préparent actuellement l'élaboration de quatre séries de normes :
- JBIG : Joint Binary Level Image Group, norme de codage de l'image fixe monochrome ;
- JPEG : Joint Photographic Experts Group, norme pour la compression de l'image photo haute définition couleur de qualité diapositive. La sortie de cette norme est prévue pour le 2 juillet 1992 ;
- MPEG : Moving Picture and Associated Audio Experts Group, norme pour la compression de l'image animée et du son associé. Cette norme doit résoudre le problème de stockage de la vidéo sur CD-ROM et va devenir une norme de radio et télédiffusion ;
- MHEG : Multi and Hypermedia Information Coding Experts Group, norme de représentation et de codage des objets multimédias et hypermédias.

Aucune d'entre elles n'est pour l'instant sortie et cela confirme le reproche de lenteur dans l'élaboration des normes au niveau international.

Des implantations de systèmes

Ce qui manque le plus dans le domaine de la gestion électronique de documents ce sont des réalisations concrètes. C'est pourquoi les présentations d'études de cas, l'après-midi, ont été accueillies avec intérêt. Et si les expériences sont encore rares, on a pu percevoir, à travers les questions du public, que des projets d'installation de SGED sont en cours dans un certain nombre d'entreprises.

Le système Taurus, choisi par Thomson à Boulogne, a été présenté par Véronique Lamblain, qui a vanté la facilité de sa mise en place. Les avantages d'un tel système : la suppression de la partie tirage et de la partie diffusion pour la revue de presse (environ 3 000 notices nouvelles par an). La plus grosse difficulté : la scannérisation des articles de presse, difficulté due au fait que leurs formes sont souvent variées (en L par exemple), ou que les articles commencent à tel endroit et se continuent à tel autre. La nécessité absolue d'effectuer une bonne scannérisation a été soulignée par tous les intervenants.

Jean-Marie Teysseire, du ministère des Affaires étrangères, a raconté l'opération pilote menée par le Service central de l'Etat civil à Nantes de numérisation et de stockage sur disques optiques numériques des actes et extraits d'état civil, avec comme objectif non seulement l'archivage, mais aussi l'exploitation et la mise à jour de ces documents. Il a expliqué la démarche suivie, aboutissant au choix d'une opération pilote plutôt qu'à la rédaction d'un cahier des charges suivi d'un appel d'offres, malgré le risque de ne pas réutiliser les matériels après l'expérience pilote. Le choix d'un fournisseur a été déterminé par la préférence pour une application déjà en service afin de minimiser les risques, des contacts ayant été pris auprès d'administrations susceptibles d'utiliser de telles applications.

Françoise Mahaud, consultant, a participé à la mise en place d'un SGED à Radio-France. Le service Documentation d'actualité y offre un fonds documentaire constitué uniquement de coupures de presse extraites de quotidiens, d'hebdomadaires, de mensuels français. L'installation d'un SGED entraînant presque toujours des perturbations liées aux habitudes acquises, aux nouvelles tâches à apprendre, à l'utilisation la plus performante possible de l'outil, Françoise Mahaud a dégagé quatre secteurs dans lesquels les documentalistes ont eu à s'adapter. Il leur a fallu :
- adopter une nouvelle organisation (circuit du document, tâches modifiées, notamment la disparition des fiches manuelles et des opérations de classement, locaux réaménagés) ;
- maîtriser une autre méthode d'analyse (indexation basée sur un thésaurus à la place d'un plan de classement) ;
- employer de nouveaux outils (lecture non plus sur papier mais à l'écran, écriture sur clavier) ;
- modifier les habitudes des utilisateurs.

Des coûts

Reste à aborder l'aspect financier. La mise en place d'un SGED relève d'une décision au plus haut niveau de l'entreprise, le coût élevé n'étant pas l'un des moindres obstacles à la prise de cette décision. Comme le souligne Sylvie Dalbin, d'Assistance et techniques documentaires, « L'aspect financier ne peut pas être oublié. Les budgets démarrent à 250 000 FHT pour des stations monopostes et dépassent rapidement le(s) million(s) de francs dès lors que l'on passe à des fonds de documents importants (le million de pages scannérisées) et des utilisateurs en réseau. » Il s'agit de bien évaluer l'opportunité de la mise en place d'un SGED et de voir si les objectifs recherchés compensent l'investissement budgétaire. Or, ce n'est qu'après plusieurs années que la rentabilité d'une telle opération pourra être calculée. Quattend-on en priorité d'un SGED ? En premier lieu figure un meilleur accès à l'information, suivi d'une plus grande productivité, de la maîtrise de l'archivage et de la gestion améliorée de l'information. Les économies espérées concernent essentiellement la réduction des coûts de photocopies, celle des matériels de classement, auxquelles s'ajoutent des gains d'espace et des économies de temps.

A partir de quel taux de consultation et de diffusion devient-il intéressant et utile d'avoir un SGED ? Un nombre peu important de documents à gérer ne justifie pas les investissements d'un tel système. La taille des établissements influe également de façon significative sur la décision finale.

Malgré l'intérêt manifeste porté à la gestion électronique des documents, son implantation reste limitée : seuls 300 systèmes sont opérationnels en France. Même si les bibliothèques sont absentes actuellement de ce marché, une sensibilisation s'avère indispensable pour, le moment venu, mieux appréhender la complexité de la mise en place de tels systèmes et mieux situer les différents aspects de la GED dans le cadre d'une application documentaire 9.

  1. (retour)↑  EIT : Electronique, informatique et télécommunications.
  2. (retour)↑  Mainframe : gros ordinateur, notamment l'ordinateur principal d'un réseau.
  3. (retour)↑  Scanner : système permettant de numériser un document (texte, dessin, photo) en une série de points, dont le nombre varie selon la résolution choisie et en fonction du type de numérisation (noir et blanc, niveaux de gris ou couleur). Meilleure est la définition de l'image, plus grand en est l'encombrement : un document numérisé à 300 BPI (nombre de pixels numérisés au pouce), s'il est en noir et blanc nécessite un million de caractères ou méga-octets (MO) ; avec 16 niveaux de gris, 4 millions ; avec 256 niveaux de gris, 4 millions de caractères ; en couleur, de 8 à 35 MO.
  4. (retour)↑  BPI : bits per inch.
  5. (retour)↑  DON : Disque optique numérique
    DAT : Digital Audio Tape, cassette de stockage de données numériques sur bandes magnétiques.
  6. (retour)↑  Bitmap : dans ce mode, une image est constituée d'un ensemble de points élémentaires ou pixels (un pixel étant le plus petit élément d'image pour lequel on peut définir une couleur et une intensité lumineuse spécifique).
  7. (retour)↑  TIFF : Tagg image file format, format concernant le noir et blanc.
  8. (retour)↑  ISO : International Standard Organisation.
  9. (retour)↑  Cf. La gestion électronique de documents et la documentation : dossier documentaire, réalisé par Françoise MAHAUT et Sylvie DALBIN, ADBS éditions, avril 1992. Ce dossier documentaire reprend les interventions de la journée d'étude, complétées par des photocopies d'articles, tirés de différentes revues professionnelles et traitant de GED.