Transdoc : archivage et fourniture électroniques de documents
Le projet français Transdoc d'archivage et de fourniture électroniques de documents a été mis en place dans le cadre d'un appel d'offres de la Commission des communautés européennes. A l'initiative du CNRS, une base de données en texte intégral a été constituée pour l'occasion, et deux filières de stockage, disque optique numérique et microfiches expérimentées. La transmission de documents à distance, par réseau à haut débit ou par télécopie, est à l'essai en 1986.
The French project Transdoc for electronic document delivery and storage has been set up during an invitation to tenders from the Commission of the European communities. On the CNRS initiative, a full text database was built up on that occasion, together with two experienced storage networks : microforms and digital optical disk. The electronic document delivery, either by quick turnover network or by telecopy, is on trial in 1986.
Dans les années 60 et 70, le rapide développement du volume d'informations, surtout en sciences et techniques, et la mise au point des bases de données bibliographiques ont contribué à augmenter le marché de la fourniture de copies. Pour répondre à cela, les bibliothèques ont essayé d'intensifier les systèmes de prêt et des centres de fourniture de documents se sont mis en place dans tous les pays techniquement développés.
Même si la France n'est pas le pays le plus en avance sur ce point, il apparaît que le recours à l'interrogation de bases de données se banalise, au moins dans les secteurs les plus en pointe de la recherche. Ainsi la possibilité d'identification d'articles, revues ou autre forme de documents a-t-elle progressé. De même, les fournisseurs de documents sont mieux localisés et la transmission des demandes par des moyens autres que la poste est plus rapide (messagerie électronique pour le prêt interbibliothèques en France, expérience Candoc au CISTI au Canada...).
Le problème qui reste entier est celui des délais de réponse aux demandes de documents, qui gênent d'autant plus les utilisateurs que les premières étapes de la recherche sont facilitées et que la documentation semble plus accessible.
A cette difficulté pour les utilisateurs finals de la documentation vient s'ajouter le manque à gagner de plus en plus conséquent des auteurs et éditeurs qui voient leurs droits spoliés et la vente de leurs produits remise en cause par l'accès indirect à leur contenu. On se souvient, en 1973, du retentissant procès opposant Masson, Armand Colin, l'Entreprise moderne d'édition, et le CNRS accusé de contrefaçon d'articles de revues scientifiques. On touchait là publiquement, pour la première fois, le problème des intérêts apparemment contradictoires des utilisateurs et des éditeurs de revues scientifiques, les fournisseurs de documents se trouvant à la croisée des chemins.
De nouvelles formes d'accès au document
Aussi, face à la demande croissante de photocopies d'articles, les centres documentaires, comme les éditeurs, sont appelés à envisager des formes nouvelles d'accès au document satisfaisant mieux toutes les parties intéressées.
La question dépasse largement le cadre national. Dès 1973, l'IFLA en a fait une priorité en établissant le programme d'accès universel aux publications (UAP).
La Commission des communautés européennes a été amenée également à entreprendre une réflexion approfondie sur ce sujet.
En 1981, un plan d'action dans les domaines conjoints de l'édition électronique et de la fourniture de documents a été mis au point par Carlo Vernimb, responsable de la Direction du Marché de l'information (DG XIII) de la CCE.
Carlo Vernimb et Chris Leamy, de la British Library, ont fait l'état des ressources en Europe et ont constaté l'extrême variété des types d'éditeurs. Beaucoup sont des entreprises de taille moyenne ou petite mais contribuent, malgré tout, pour une large part, à la diffusion de l'information. Qui plus est, ils exportent une partie considérable de leurs produits hors de la communauté et constituent donc une composante essentielle de l'industrie de l'information européenne. C'est pourquoi les éditeurs sont intéressés par les technologies leur ouvrant de nouveaux marchés.
Cet aspect économique est fondamental dans les projets européens. Selon Carlo Vernimb, la communauté européenne est pauvre en produits alimentaires, énergie et matières premières et doit exporter des produits industriels. Pour que ses produits soient compétitifs, l'utilisation des nouvelles technologies, y compris dans le domaine de l'information, est indispensable. C'est précisément le terrain sur lequel l'Europe a besoin de rattraper son retard.
Le progrès scientifique, la prospérité industrielle et commerciale et par là-même le développement social et économique dépendent d'un accès à l'information rapide, .sûr et bon marché 1.
La DG XIII a donc cherché à promouvoir des actions qui pouvaient avoir « un effet catalyseur stimulant la recherche et linvestissement en la matière.
Un certain nombre d'études préalables ont permis de dégager les caractéristiques suivantes. En 1980, en Europe, 11 millions de demandes de documents dans les domaines scientifique, technique et médical ont été reçues par des bibliothèques, des centres spécialisés, des librairies... Ces demandes ont abouti à la fourniture de documents, la plupart sous forme de photocopies, par la poste (les demandes satisfaites sur place n'ont pas été comptées). L'augmentation annuelle des demandes est de 10 %; on peut donc prévoir, pour 1990, 28 millions de demandes concernant des articles de périodiques parus dans les cinq dernières années.
Si on admet qu'un article de revue compte en moyenne 8 à 10 pages, c'est environ 100 millions de pages de littérature STM (scientifique, technique et médicale) qui ont été demandées en 1980 et 250 millions prévisibles en 1990.
Mais une fois commandé, un document met entre deux jours et plusieurs mois avant de parvenir à l'utilisateur final. La moyenne européenne est de deux semaines. La poste n'est pas la seule responsable de cette situation. Les différentes étapes du traitement de la demande (enregistrement, identification, recherche de localisation, copie, facturation, préparation de l'envoi) multiplient les délais de réponse.
D'après une enquête menée par Yuri Gates du centre technique anglais des industries du papier et de l'imprimerie (PIRA), 82 % des utilisateurs interrogés accepteraient de payer davantage pour un service spécial plus rapide, concernant des documents importants.
Un plan d'action européen
Ayant réuni ces éléments d'analyse, la Commission des communautés européennes, sous la direction de la « Document Delivery Task Force » composée d'experts nationaux et des représentants de l'IFLA, de l'association des éditeurs européens, de l'EUSIDIC et de l'UNICE, a mis au point un plan d'action Docdel (DocDel Action Plan ou Community Action Plan for Electronic Publishing and Document Delivery).
Cette action s'articule à trois niveaux :
- le développement d'une infrastructure appropriée, pour inciter à la mise en place de services opérationnels, tels que la normalisation pour simplifier les procédures d'accès, la négociation avec les Postes pour un tarif de télécommunications adapté à la fourniture de documents, la coordination entre les nouveaux services et les activités traditionnelles des éditeurs, vendeurs de livres, bibliothécaires et auteurs...;
- la démonstration du caractère opératoire des nouveaux systèmes testés en situation réelle aussi bien pour la diffusion des documents aux utilisateurs, que pour la création des documents dans des formes adaptées à des systèmes électroniques;
- la recherche sur les systèmes automatisés et leurs interfaces, comprenant la saisie des documents, leur stockage et leur diffusion auprès des utilisateurs.
Une liaison avec des organisations comme l'IFLA, les PTT, l'ISO et les associations des éditeurs européens a été prévue pour la coordination, l'évaluation et la publicité des résultats.
Concrètement, l'action de la CCE s'est organisée autour de plusieurs axes :
- d'abord un appel d'offres pour des expériences pilotes pouvant prendre en compte tout ou partie de ce programme, avec co-financement de groupements nationaux mis en place en vue de la réalisation d'un projet, et éventuellement aide aux utilisateurs des systèmes expérimentés pour acquérir le matériel nécessaire aux tests;
- le projet du satellite de communication dont l'élaboration avec l'ESA était en cours. En avril 1983, est paru un rapport commun CCE, ESA et Eutelsat 2, The Apollo Concept, Electronic Document Delivery by Satellite 3;
- enfin, la CCE a commandité un ensemble d'études sur les données techniques, économiques et sociales que l'apparition de nàuveaux systèmes mettait en évidence.
Par ailleurs, la CCE a souhaité que soient pris en compte les problèmes d'ordre juridique, politique ou administratif soulevés par ces expériences.
La question centrale est celle de la protection des droits de propriété commerciale et intellectuelle des auteurs et des éditeurs.
En outre, certains Etats membres de la communauté imposent des contraintes à la publication ou à l'importation de documents contenant certaines idées politiques ou religieuses. Dans le même ordre d'idées, beaucoup de pays veulent que l'éditeur et l'imprimeur puissent être identifiés. Or, avec des publications n'ayant pas de présentation matérielle, traditionnelle, ces données seront bien moins aisément contrôlables.
C'est en novembre 1982 qu'a été publié l'appel d'offres pour des expériences de fourniture électronique de documents et d'édition électronique, dans le journal officiel des communautés européennes.
Les dix projets retenus dans le plan Docdel
Parmi un important nombre de propositions, 10 projets ont été retenus par la CCE.
journal électronique sur les sciences de l'information.
Origine: Grande-Bretagne. Maître-d'œuvre : Learned Information. Journal constitué d'articles d'origine géographique très variée : 1270 auteurs et correspondants. Disponible sur le serveur ESA à Frascati. Articles « on-line ». Critères de sélection : articles brefs (1500 mots), informations générales, revues bibliographiques, annonces, offres d'emploi.
Journal électronique pour les mathématiques appliquées
Origine : France. Maître-d'œuvre: Commissariat à l'Energie Atomique (CEA). Entrée par machine à traitement de texte (logiciel d'édition Edith Math/INRIA) ou par scanner (8 pixels/mm). La base de données est chargée sur Télésystèmes/Questel.
Edition de deux journaux électroniques concernant la chimie
Origine : Grande-Bretagne. Maître-d'oeuvre : Royal Society of Chemistry. Conversion en journaux électroniques de deux revues de chimie, Chemical Communication et International Journal of Chemical Research, disponibles en ligne sur le serveur Unilever Computer Services limited (UCSL).
Edition d'une revue sur l'industrie de l'information et de l'édition
Origine : Grande-Bretagne. Maître-d'œuvre : Learned Information. Création et édition électronique d'une revue disponible sur le serveur ESA-IRS à Frascati.
Stockage électronique
Origine : RFA. Maître-d'œuvre : Verlag Technische Megelwerke (DIN). Le but est de normaliser des formats de stockage. Formatage et système de décodage sont indépendants du type de matériel de traitement de texte utilisé pour la saisie. Poste de travail multifonctions, utilisation de terminaux graphiques à haute résolution, Fax groupe II et III.
Diffusion de documents scientiques
Origine : Italie. Maître-d'oeuvre : Mondadori, SDDS (Scientific Document Delivery Service). Le but est de rendre disponible rapidement la littérature grise. 400 à 500 auteurs frappent leurs thèses ou rapports de recherche sur machines à traitement de texte (logiciel Easy text, Mondadori), qui alimentent un ordinateur central (CILEA). Cela permet à la fois une mise à jour des bases de données en ligne et l'édition sur papier par photocomposition.
Edition électronique et fourniture en ligne de brevets
Origine : RFA. Maître-d'oeuvre : FIZ 4. L'ambition du projet est de fournir rapidement les documents relatifs au texte des brevets, mais aussi les schémas associés, les formules chimiques, les caractères et symboles spécifiques. L'innovation principale réside dans la compression des données réduisant le volume de stockage.
Eurodocdel
Origine : Pays-Bas, France. Maître-d'oeuvre : Europe Data, Bull. Projet de transmission multiréseaux (y compris le satellite européen ECS) pour diffuser les documents émanant des différentes instances de la communauté, auprès des utilisateurs particuliers et des nations membres, à partir d'un stock central localisé à Paris ou Bruxelles. La restitution se fera sur toute une gamme de terminaux installés chez l'utilisateur ou dans des centres régionaux de diffusion.
Collège invisible
Origine : Irlande. Maître-d'oeuvre : NIHE (National Institute for Higher Education). Utilisation d'un système automatisé pour la préparation, la saisie, la distribution par courrier électronique, de littérature grise entre les instituts d'enseignement supérieur en Irlande, Grande-Bretagne et France. Six micro-ordinateurs seront connectés avec des unités centrales par le réseau public de transmission de données. Cela implique de résoudre des problèmes de compatibilité des systèmes de logiciel et matériel.
Transdoc
Origine : France. Maître-d'oeuvre : CNRS, EDF, GDF, INPI, FNPS, Télésystèmes-Questel. Projet de stockage et de transmission électroniques de documents.
Le projet français Transdoc
Transdoc a pour but d'étudier et de mettre en place une chaîne automatisée de traitement de documents, pour les transmettre rapidement aux utilisateurs finals.
La réflexion des concepteurs du projet part du fait que le client d'un centre de documentation qui a mené sa recherche et fait sa commande « on line », supporte de moins en moins bien les délais de fourniture des documents « primaires ».
Le deuxième élément est d'ordre technique. On sait traiter du texte sous forme de codes entrés en mémoire et gérés par l'ordinateur. Mais pour stocker des documents déjà existant sur papier et comprenant, en plus du texte, des schémas, graphiques et tableaux, on les traitera sous une forme « image ». C'est-à-dire qu'il n'est pas question de ressaisir et codifier les données, mais de faire analyser « l'image » du document par la machine qui la décomposera en une multitude de points noirs ou blancs.
Or le traitement en mode « image » en est aux premières expérimentations tant dans le domaine du stockage que dans celui de la transmission et de la restitution.
Les partenaires du groupement
Le Centre de documentation scientifique et technique (CDST) du CNRS était depuis longtemps sensibilisé à ce problème, parce qu'il a vocation à fournir des documents identifiés dans sa banque de données PASCAL ou toute autre bibliographie et parce que son service de reprographie-micrographie cherche depuis de nombreuses années des améliorations techniques en la matière.
Quand l'appel d'offres Docdel a été lancé, le CDST souhaita y répondre. Pour des raisons économiques, et aussi pour diversifier les types de documents et d'utilisateurs, un « groupement scientifique » (GS) 5 de plusieurs partenaires a été constitué, avec l'appui financier de la MIDIST.
le CDST
Le CDST esr une unité de service du CNRS 6, qui possède le statut de laboratoire. Le CDST a pour mission de fournir à tous les spécialistes, chercheurs, professeurs, ingénieurs, industriels et étudiants, l'information scientifique et technique qui leur est nécessaire. Il édite le Bulletin signalétique et possède une bibliothèque multidisciplinaire. Par ailleurs, la division « Base de données » assure un service d'analyse et d'indexation qui enrichit la banque PASCAL de 500 000 nouvelles références par an.
Son département « Fourniture de documents » reçoit des commandes, selon des procédures très diverses. En 1984, sur un total de 373 148 demandes, 85,96 %, soit 1284 demandes/jour, ont été transmises par voie postale; le service rapide accessible par courrier, téléphone ou télex représente 9,76 %, soit 146 demandes/jour, et les commandes en ligne 4,20 % (43,78 % de plus qu'en 1983), en moyenne 63 demandes/jour.
La plus grande partie des demandes est satisfaite à partir des fonds propres du CDST, soit 292 018. Le reste est fourni par six bibliothèques parisiennes ayant passé des accords avec le CDST (17734), par échange avec quinze organismes français (9462), ou par achat de photocopies ou microfiches à l'étranger (4882) ; c'est donc en tout 86,95 % de réponses positives.
Electricité de France, Direction des études et recherches
Le CDST qui avait déjà travaillé en collaboration avec les services de documentation d'EDF sur certains problèmes de reprographie, proposa à la Direction des Etudes et Recherches d'EDF de rentrer dans le groupement scientifique.
Le département « Système d'information et de documentation » d'EDF reçoit 60 000 demandes par an. Chaque réponse représente une vingtaine de pages. 98 % des documents sont fournis sur papier, 2 % sous forme de microforme.
Le fonds est constitué d'articles de revues scientifiques, de comptes rendus de congrès, de rapports et de notes internes.
Les documents externes représentent 80 % du fonds. Les 18 % de rapports et notes internes se divisent en quatre catégories en fonction de leur accessibilité. Chaque document est identifié par un code de référence unique mentionné dans la banque de données EDF-DOC et dans les différents bulletins signalétiques de l'établissement. La banque de données est implantée sur un serveur interne EDF (GID) et deux serveurs externes : ESA/ QUEST et Télésystèmes-Questel, avec une version qui ne contient que les notes internes en accessibilité libre.
Les commandes se font soit en ligne, soit par voie postale (avec un formulaire spécial quand il s'agit d'une commande interne). Le numéro d'identification doit obligatoirement être indiqué. Toutes les commandes sont enregistrées sur un système informatique (SIDERALE) qui transmet au service de reproduction.
L'Institut national de la propriété industrielle
L'autre partenaire de Transdoc est l'Institut national de la propriété industrielle, établissement public placé sous la tutelle du ministère du Développement industriel. Il a pour mission de recevoir le dépôt des brevets d'invention et des marques de fabrique, de commerce et de service. Il les examine, les enregistre et les publie. Il reçoit aussi le dépôt des dessins et modèles industriels. Il tient le registre du commerce et des sociétés, et des dépôts de bilan.
L'INPI centralise tous les brevets déposés en France depuis 1791, date de la première loi sur les brevets. Il détient de ce fait 2,5 millions de documents, sans compter les brevets reçus à titre d'échanges internationaux (plus de 15 millions). Ce fonds documentaire est fondamental puisque chaque nouveau dépôt de brevet implique de vérifier que l'invention est vraiment nouvelle. On considère que 80 % de l'information scientifique et technique contenue dans les brevets n'existe nulle part ailleurs.
Les demandes de brevet sont imprimées en 70 exemplaires et les brevets en 50. Certains tirages sont remis à l'inventeur, d'autres présentés dans les salles de consultation, d'autres envoyés aux offices étrangers. Le reste est stocké et vendu au numéro pendant cinq ans par l'Imprimerie nationale. Les invendus sont le plus souvent détruits à la fin de cette période. L'ensemble de ces opérations est bien sûr extrêmement onéreux.
Jusqu'à la guerre, on parvenait à centraliser et à classer les documents par ordre numérique, les recherches s'effectuant dans des tables annuelles par nom de déposants et par matière. Mais, avec l'accroissement considérable du nombre de brevets publiés, les difficultés de stockage et de manipulation deviennent de plus en plus insurmontables. Les microformes ont été jusqu'à présent le moyen retenu pour lutter contre l'envahissement du papier. Depuis 1969, les demandes de brevets publiées et les brevets délivrés en France sont présentés sur microfilms 35 mm et cartes perforées à fenêtre.
Depuis 1981, l'INPI a mis en place deux bases de données interrogeables en ligne: INPI 1 qui contient toutes les données bibliographiques des brevets français depuis 1909 et INPI 2 qui concerne les brevets européens publiés. Les recherches des utilisateurs en ont été facilitées et les demandes de reproduction des documents primaires ont augmenté.
En 1984, un service d'information rapide a été installé qui fournit la copie des brevets dans les 24 heures, ce qui suppose soit une reproduction au format du brevet sur papier, soit une copie agrandie des microformes. On compte par an 2 millions de reproductions au format; plus de 20 000 tirages sur papier de cartes à fenêtre et 76 000 tirages à partir de microfilms.
Il y a plusieurs catégories d'utilisateurs. Ceux du service rapide sont, à 95 %, des cabinets de brevets et de mandataires qui sont abonnés pour avoir accès à la fourniture des documents. Les autres sont des chercheurs individuels, des juristes, des entreprises...
Il y a diverses formes de commande : la consultation et la demande de reproduction sur place, le service d'information rapide (SIR) qui reçoit 50 demandes/jour en ligne, ou la voie postale, qui implique 24 à 48 heures de délai supplémentaire.
Gaz de France, Direction des études et techniques nouvelles
Quant à GDF qui a rejoint plus tard le groupement, son service de documentation traite 6 000 demandes par an, sous forme papier seulement. Son fonds est constitué de sélections d'articles de revues scientifiques, de comptes rendus de congrès et enfin de rapports et notes internes qui constituent 9 % du total.
Chaque document est identifié par un code de référence unique qui est indiqué dans la base de données DAUGAZ et dans les différents bulletins signalétiques de l'établissement.
La base de données implantée sur un serveur interne est en cours de transfert sur Télésystèmes-Questel.
Le mode de commande est soit téléphonique, soit postal, soit sur place, à la bibliothèque du centre de documentation GDF et les commandes sont traitées manuellement à des fins statistiques.
Télésystèmes-Questel
Cette entreprise a pour activités principales le développement de logiciels documentaires et la gestion d'un centre serveur mondial de bases de données. Les bases de données PASCAL, INPI 1 et 2 et bientôt DAUGAZ sont implantées sur les serveurs Questel 1 et 2 situés à Valbonne.
La Fédération nationale de la presse spécialisée
La FNSP regroupe des éditeurs spécialisés français produisant 1 200 périodiques scientifiques, techniques, médicaux, juridiques, économiques et sociaux, et un certain nombre d'associations dont l'Association pour la promotion des publications médicales d'expression française (APPMF). C'est elle qui a créé, en mai 1983, le Centre français de perception et de répartition des redevances du copyright (CFC), d'abord association privée à but non lucratif régie par la loi de 1901, devenue, en mai 1984, une société civile juridiquement autonome et composée exclusivement d'éditeurs.
Le CFC a accepté au départ de servir d'intermédiaire entre les éditeurs français et le programme Transdoc afin d'obtenir l'autorisation d'utiliser leurs publications dans le système.
Les documents retenus
Le CDST était convenu de faire entrer une centaine de revues dans le système. Deux critères de sélection ont été retenus :
- parmi les titres les plus demandés, ceux dont le « rendement » était le plus élevé (rapport nombre de demandes/nombre d'articles édités);
- les collections les plus susceptibles d'intéresser des utilisateurs potentiels.
Plusieurs études ont donc été menées :
- recherche du secteur le plus utilisé : sur les 100 revues les plus demandées au CDST, 70 concernent les sciences de la vie;
- analyse de la clientèle : les plus « gros » utilisateurs appartiennent au domaine bio-médical;
- à partir des périodiques les plus demandés, calcul, par an, du nombre de fascicules, d'articles, de pages, du nombre moyen de pages par article, du nombre de demandes concernant l'année en cours pour calculer leur « rendement ».
Ainsi a été établie une liste de revues; environ 20000 articles, soit à peu près 200 000 pages, doivent être entrés dans le système.
EDF a retenu 3 000 notes internes à diffusion restreinte, qui représentent 100 000 pages.
GDF a également choisi des notes internes pour un volume de 3 000 pages.
L'INPI a choisi de tester le système avec les brevets français publiés à partir de janvier 1985, soit environ 15 000 brevets qui correspondent à 200 000 pages.
Au total, l'équivalent de 600 000 pages environ doit être traité. Il s'agit de documents en noir et blanc, de format A4 ou plus petit.
Le rôle novateur du CFC
La Commission des communautés européennes prévoyait, nous l'avons vu, la prise en compte des problèmes de copyright et c'est à cette fin que, dès le départ, une participation des éditeurs au projet a été souhaitée. Ceux-ci ont finalement délégué à l'organisme émanant de la FNPS, le Centre français du copyright, la responsabilité d'évaluer certaines solutions concernant le recouvrement des droits de reproduction. Etant bien entendu que ces dispositions ne sont applicables que dans le cadre du projet et pendant la durée de l'expérience sans préjuger des accords ou développements ultérieurs.
Le CFC, en se fondant sur les chiffres révélés par une enquête réalisée en Allemagne 7, estime que 20 % des 40 milliards de photocopies effectuées en France en 1984 concernent des oeuvres protégées par un droit. La même enquête montre également que les bibliothèques et les universités ne représentent que 171 millions des 5 698 millions de photocopies d'oeuvres protégées.
Le CNRS, souhaitant sortir de dix années de relations conflictuelles avec les éditeurs, a passé une convention avec le CFC, qui prévoit une redevance versée à l'éditeur pour chaque reproduction d'article. C'est une véritable innovation puisque c'est la première convention du genre signée par un centre documentaire.
Plusieurs principes ont été retenus : la progressivité; le règlement d'une partie de la redevance sous la forme d'une prestation de service (identification du demandeur, éléments d'informations statistiques... ).
Cette possibilité de connaître la diffusion réelle et la destination de leurs articles représente, pour les auteurs, un feed-back tout à fait appréciable. C'est pour les éditeurs, également, un moyen de mesurer l'audience de leurs revues et d'identifier leur clientèle potentielle, celle qui ne s'abonne pas mais se procure des photocopies. Par ailleurs, les centres de documentation s'inquiètent du surcroît que représenterait le versement d'une redevance élevée pour des systèmes de fourniture déjà d'autant plus coûteux qu'ils sont plus évolués.
Cette prestation de service répondrait au souci de « transparence » des auteurs et éditeurs et permettrait de moduler leur pression financière en fonction, des services qui leur sont offerts.
C'est ainsi qu'en contrepartie des autorisations données au CNRS, celui-ci s'est engagé : à stocker sur DON ou microfiches les documents autorisés par les éditeurs participant au CFC; à acquitter une redevance de 3 F par article 8 et à fournir des éléments d'information (identité des demandeurs, nombre de pages et d'articles copiés par journal, statistiques comparatives et typologie des utilisateurs), étant bien entendu que ces informations seront traitées comme relevant du secret commercial.
Le contrôle et la surveillance de l'ensemble de ces éléments d'information seront assurés par une commission paritaire mise en place par les signataires.
Description générale du projet
Le projet consiste à concevoir, mettre au point et développer un système permettant :
- le stockage d'informations scientifiques à partir de supports papier et de supports numériques (bandes magnétiques) : compact sur disque optique numérique et disque magnétique; non compact sous forme de microfiches;
- l'utilisation couplée du système avec plusieurs bases de données à diffusion internationale (PASCAL pour le CDST, EDF-DOC pour EDF, INPI 1 pour l'INPI et DAUGAZ pour GDF) au travers de réseaux différents.
Après obtention d'une référence bibliographique quel qu'en soit le moyen (base de données, bibliothèque, revue de sommaires), la commande en ligne sera automatiquement enregistrée avec toutes ses spécificités.
Le document demandé pourra être restitué soit immédiatement, soit en différé.
Dans la phase d'expérimentation, plusieurs types de fourniture sont envisagés : par voie postale et par télécommunication; sur réseau local et à distance.
Un serveur de documents doit intégrer les fonctions générales suivantes: la saisie des documents, l'archivage, la recherche et la gestion des commandes de documents, la restitution (ou diffusion) des textes de documents commandés.
Architecture du système Transdoc
Deux filières sont simultanément expérimentées :
- une filière disque optique numérique MC2 gérée par un ordinateur MINI 6 de BULL et comportant un système image (Image Link Controler ou ILC). Celui-ci sert à la compression ou à la décompression des données et sert de commutateur rapide entre les différents composants : scanner (1 à 2 secondes par page), écran haute définition Sintra, contrôleur de DON Thomson d'l giga-octect de capacité, imprimante laser CIT-Alcatel. Les écrans servent à la visualisation et à l'indexation des documents numérisés.
- une filière microfiche CGA où le MINI 6 joue le rôle de gérant de l'ensemble et de commutateur entre les composants : contrôleur d'images, armoire pouvant contenir 5 000 microfiches par 20 paniers de 256 microfiches en partition 98 vues, avec numériseur intégré, et une imprimante laser CIT-Alcatel. Un appareil Telmi A, allié au MINI 6, permet l'indexation des microfiches et la préparation des paniers qui seront placés dans l'armoire.
Le système Transdoc, dans chacune des filières, assure les mêmes fonctions.
En ce qui concerne la saisie, pour la filière DON, il y a numérisation 9 par scanner (définition 8 points/mm) d'un document papier ou d'une microfiche puis compression 10 des données; pour la filière microfiches, à partir d'un document papier, les prises de vue sont effectuées par caméra pour établir la microfiche.
Les documents sont indexés puis stockés sur DON ou dans l'armoire de microfiches.
Plusieurs prestataires de service interviennent pour la fourniture de logiciels :
- MC2 (société française qui a l'exclusivité de la diffusion du matériel Integrated Automation, en France) basée à Grenoble, a fourni le micro-logiciel pour le ILC et le logiciel d'application MINI 6/ILC;
- CGA fournira parallèlement le logiciel d'application avec le MINI 6 dans la filière microfiche;
- Télésystèmes enfin a fourni le logiciel de connexion Questel/ Transdoc pour la prise de commande, et, dans l'avenir, la connexion des fichiers des deux filières quand les commandes s'effectueront en ligne. Ce logiciel sert également à la mise en forme des statistiques pour le programme d'évaluation.
Les liaisons avec les utilisateurs du système s'effectuent soit directement, soit par l'intermédiaire d'un service de base de données bibliographiques permettant une recherche documentaire et la commande en ligne de documents.
Les documents commandés sont identifiés par leurs références et recherchés automatiquement sur les différents supports d'archivage.
Ils sont affichés en local sur un écran à haute définition ou sortis sur imprimante laser.
Dans l'avenir, ils seront diffusés à distance, par téléphone ou par réseau haut débit.
Les utilisateurs de Transdoc et la fourniture de documents
Des utilisateurs sélectionnés ont signé un protocole d'accord qui fixe les obligations réciproques de l'utilisateur et des fournisseurs de documents et producteurs de bases de données faisant partie du groupement Transdoc. Ces utilisateurs pourront, s'ils sont clients du CDST ou d'EDF, commander directement en ligne par Questel. Les commandes reçues seront traitées quotidiennement, éditées sur place par imprimante laser et expédiées par la poste. Les clients du CDST paieront comme d'habitude par vignette mais ceux d'EDF recevront une facture rappelant les éléments de la commande (24F pour les 10 premières pages et 17 F par tranche de 10 pages supplémentaires, plus les frais d'envoi). Les commandes des clients GDF seront reçues en bibliothèque, tant que la base GDF ne sera pas sur Questel, et introduites sur la console Transdoc située dans la bibliothèque.
Quand EDF ou GDF utiliseront Transdoc pour la fourniture de documents à leurs clients, ce sont ces organismes qui participeront à l'évaluation « utilisateurs ».
A l'INPI également, les clients pourront utiliser la console Transdoc à la bibliothèque. L'INPI sera alors l'interlocuteur pour l'évaluation et se chargera de l'expédition aux destinataires, avec une facturation classique. Les utilisateurs qui auront souscrit un abonnement de type SIR (service d'information rapide) et accepté de participer à l'évaluation, pourront faire leurs commandes en ligne. Le SIR prendra en compte la partie facturation et le CDST l'expédition.
Pour l'INPI, ce sont quelques cabinets de brevets qui ont accepté de participer et, pour le CDST, surtout de gros laboratoires pharmaceutiques.
Pour que l'usager puisse exprimer son opinion sur la qualité du service rendu, il lui sera envoyé, à chaque fourniture de document, une fiche dite de « suivi d'exploitation », lui permettant de retourner ses observations, en vue de l'évaluation finale des deux systèmes de stockage et de recherche.
Pour les documents qui ne seraient pas dans Transdoc, les commandes seront traitées de manière conventionnelle par les organismes possédant le document.
Evaluation des performances techniques et des coûts
Nous l'avons dit dès le départ, le but de cette expérimentation est de tester de nouvelles filières technologiques et de nouveaux matériels. A cette fin, des prototypes ont été mis au point avec plusieurs sous-traitants, par exemple, l'armoire à microfiche et numériseur intégré, avec la Compagnie générale d'automatisme, Alcatel, ou le disque optique numérique avec Thomson-CSF. Enfin l'accord avec la société MC2 pour la fourniture de logiciel et les logiciels proposés par Télésystèmes ou CGA dont nous avons parlé plus haut permettront d'évaluer les différents systèmes informatiques de gestion.
Il est encore bien tôt pour connaître le coût réel de l'opération et le prix de revient de chaque document fourni. Mais à titre indicatif, peut-on au moins indiquer les coûts estimatifs globaux en 1983.
En fait, en 1985, on en arrive à 23 millions de francs sur trois ans. La CCE finance à concurrence de 4,55 millions de francs et la MIDIST à concurrence de 4,5 millions de francs. Le reste du financement sera assuré par les organismes participants. Pour sa part, la contribution du CNRS représente 4 millions de francs répartis en : équipement : 0,6 million; fonctionnement : 0,4 million; personnel : 3 millions.
Les améliorations à prévoir
Ce qui est possible dès maintenant
Le goulot d'étranglement et les coûts importants se situent aux postes de saisie et d'archivage des documents. Les temps moyens peuvent être estimés à :
- 200 à 250 pages/heure pour la digitalisation d'un document sur scanner à alimentation manuelle,
- 20 minutes pour la constitution d'une microfiche 98 vues,
- 2 minutes par document pour l'indexation préalable à l'archivage, soit 10 secondes de visualisation par page.
Il convient d'ajouter un temps de préparation des documents papier, variable, par exemple faire figurer le numéro d'identification quand il n'est pas sur le document.
Des améliorations immédiates peuvent être envisagées :
- alimentation automatique du scanner,
- reconnaissance du document par code barre inscrit systématiquement sur la première page,
- avec l'indexation automatique, il n'y a visualisation qu'à la restitution du document, ce qui constitue une économie,
- meilleure résolution de l'image : non plus 8 points/mm mais au moins 12. En effet le 8 points/mm, s'il est satisfaisant pour les textes, ne l'est pas autant pour les notes, les graphiques, etc.
Par ailleurs, les difficultés rencontrées sont à la fois d'ordre organisationnel et technique.
Les problèmes organisationnels
Une expérience comme Transdoc révèle fatalement les carences ou les lourdeurs dans l'organisation du circuit du document.
Ainsi au CDST, il y a forcément concurrence, à l'arrivée du périodique, entre les nécessités de catalogage et d'indexation pour la base de données PASCAL et le traitement normal du document (bulletinage, équipement, mise en place dans les rayons) pour le rendre utilisable aux lecteurs de la bibliothèque ou aux demandeurs de documents.
La solution peut être, comme à EDF, l'achat en double du périodique mais, selon une étude de la MIDIST, le coût moyen d'une revue scientifique ou technique s'élève à 1,25 F la page. Une autre solution consisterait à photocopier systématiquement l'intégralité des périodiques dès leur arrivée au CDST. Mais en se fondant sur les chiffres de 1984, c'est 3,6 millions de photocopies qui seraient nécessaires, soit une dépense de 900 KF; dans le cas de figure le plus « économique », on arrive au chiffre de 270 KF.
Quant au transfert sur microfiche d'1 million de pages, les coûts vont de 150 000 F sur microfilm 16 mm à 600 000 F sur microfiche A6 partition 98 vues.
On voit qu'aucune solution n'est complètement satisfaisante.
les problèmes techniques
Par ailleurs subsistent des difficultés dues au manque de normalisation dans différents domaines 11.
En effet, un effort devrait être fait pour:
- l'identification du document (numérotation, classification...),
- la présentation/codification du format, de la mise en page, des emplacements du texte, des images, du graphisme,
- la représentation des graphismes et des symboles.
A terme, il serait possible d'envisager une exploitation séparée du texte codé d'un côté et de l'image de l'autre (graphiques, tableaux). Cela éviterait des coûts importants de stockage et de diffusion de l'information (puisque traiter du texte en mode image prend beaucoup plus d'espace-mémoire et de temps de transmission qu'en mode caractère). Une même saisie pourrait servir à des fins différentes : banque de données et archivage de documents. A plus long terme, ce serait la voie ouverte à l'édition électronique permettant des traitements en mode mixte : représentation codée et fac-similé.
De la même façon, si l'on pouvait obtenir la reconnaissance automatique du document lors de la saisie ou de la recherche grâce à une identité clairement lisible du document, on allégerait les circuits de gestion et on éviterait les « systèmes maison » toujours préjudiciables à une bonne accessibilité des documents et à leur utilisation rationnelle.
Enfin, l'inexistence pour le moment de réseaux à haut débit constitue un obstacle considérable à la diffusion des données, les délais de transmission de la télécopie étant encore beaucoup trop longs.
De nouveaux outils à inventer
L'une des carences révélée par Transdoc est, nous l'avons vu, la difficulté à traiter rapidement l'information.
Au CDST, on a été amené à revoir l'accès des utilisateurs aux références bibliographiques, compte tenu des délais d'entrée dans PASCAL des notices, indexation comprise. Une base, appelée TRANSDO, a été constituée spécialement pour l'expérience, dans le but de raccourcir ces délais. Les périodiques retenus pour entrer dans le système Transdoc font l'objet d'un traitement à part, plus rapide qu'à l'accoutumée.
L'indexation normalisée des articles
On a donné un numéro à 36 caractères à chaque article en retenant le numéro ISSN, l'année, le tome, le fascicule, et les numéros de page.
A EDF, dans la « sélection express », chaque article est signalé par un numéro attribué dès l'arrivée du périodique, constitué du millésime de l'année, d'une lettre plus cinq chiffres.
Le document a donc un numéro « maison », alors que le système de 36 caractères retenu dans Transdoc se veut universel.
La CCE est bien consciente de ce problème de normalisation de l'indexation des articles, puisqu'un appel d'offres Docmatch a été lancé et que la BLLD a été choisie pour trouver une solution recevable par tous et moins compliquée que les 36 caractères précédemment décrits. Les bases de données devraient donc, à terme, indiquer ces numéros de référence.
les revues de sommaires
La revue de sommaires est un outil fondamental pour le spécialiste d'une question qui veut mettre à jour sa bibliographie.
Ce genre de produit implique à terme un catalogage systématique à la source, avant publication, et donc une modification des habitudes des éditeurs.
Une saisie pour plusieurs usages
Plusieurs techniques pourraient être utilisées simultanément pour créer un document : saisie vocale, optique, numérique; conception, traduction, indexation assistées par ordinateur.
Un document pourrait alors se présenter sous plusieurs formes et des standards de restructuration devraient permettre sa reconstitution par des logiciels ou des réseaux de télécommunication ou par des équipements spécialisés ; cela impliquerait qu'un document soit archivé d'après ses structures de saisie en utilisant les supports de stockage les mieux adaptés.
On peut donc imaginer que les fonctions liées à la production de bases de données bibliographiques par exemple pourraient être intégrées grâce à une exploitation directe du document ainsi archivé. Ce qui permet à la fois une cohérence des résultats et une réduction des coûts (à la saisie, au stockage, à la restitution). Cela sous-entendrait une véritable révolution dans les rapports plus ou moins « affectifs » qu'entretiennent les auteurs avec leurs manuscrits.
Cependant, il est d'ores et déjà clair que beaucoup d'éditeurs, s'ils n'en sont pas tous au même point que les partenaires du projet Adonis, envisagent néanmoins de prévoir une normalisation du manuscrit fourni par les auteurs; aussi bien en ce qui concerne l'enregistrement de leur texte qui serait tapé sur machine à traitement de textes que sur des normes de présentation qui faciliteraient son encodage avant fabrication.
Mais s'il est raisonnable d'envisager dans un avenir très proche des modifications dans le mode de saisie, de stockage, de diffusion, un fait reste certain, c'est que les auteurs sont habitués à voir les résultats de leurs travaux matérialisés sous forme de papier tout autant que les utilisateurs qui choisissent le plus souvent la forme papier quand ils ont le choix entre la consultation d'une microforme sur un lecteur ou la fourniture d'une copie papier. Sur ce point, tous les responsables des fournitures de documents s'accordent.
L'avenir des bibliothèques et des centres de documentation
Une redistribution éventuelle du rôle de diffuseur
On peut imaginer, nous l'avons vu, qu'à plus ou moins long terme, les éditeurs modifieront le circuit de distribution de leurs produits. Plusieurs cas de figure sont envisageables :
- la mise en service de projets de type Adonis,
- l'appel à des sociétés de service fabriquant pour le compte des éditeurs des produits sous forme compacte,
- la production de textes sous forme électronique avec tirage sur papier à la demande...
Dans ces contextes, quel avenir pour les bibliothèques prises au sens large, qu'il s'agisse des bibliothèques universitaires, ou des centres de fourniture de documents comme le CDST ou la BLLD ?
Les tentatives d'ouverture des plus dynamiques d'entre elles (bibliothèque de l'Université de technologie de Compiègne, bibliothèque universitaire de Lyon, section sciences de La Doua en chimie...) vers les industriels ont apporté des résultats très satisfaisants qu'il faut analyser.
En dehors des tarifs très peu élevés proposés par ces établissements, il est évident que ces clients exigeants ont bénéficié d'un service de bonne qualité, les responsables se faisant fort de trouver par tous les moyens le document demandé et de satisfaire au maximum les commandes. Les accords passés avec les grandes bibliothèques universitaires parisiennes par le CDST vont dans le même sens d'une volonté affirmée de rendre un service de qualité.
La BLLD a connu un succès considérable en mettant en place des paramètres extrêmement précis de taux de satisfaction/temps requis dont les Français s'inspirent largement.
C'est sur ce terrain du service au sens propre du terme que les bibliothèques ont, quoi qu'il arrive, un rôle à jouer et à garder.
En effet, on peut prévoir que les copies seraient fournies à partir de formes différentes de stockage, éventuellement livrables chez l'utilisateur à partir de « scanning center »... (à supposer que le client puisse avoir le matériel adéquat, ce qui n'est pas pour demain compte tenu du prix du matériel). Les bibliothèques et centres de documentation assureraient le routage des documents, en commun avec les éditeurs, et la mise à disposition de l'utilisateur non équipé de télécopieur, et surtout ils pourraient affiner, préparer un accès aux bases de données bibliographiques. Celles-ci sont certes assez facilement interrogeables mais pour que leur utilisation soit rentable, une préparation très fine est nécessaire et un dialogue avec un spécialiste de la documentation (bibliothécaire ou documentaliste selon le cas) favoriserait l'efficacité des interrogations. La mise en évidence des descripteurs opératoires, des champs les plus efficaces, des procédures les plus rentables pour un problème donné, serait un service considérable et fortement apprécié d'un public qui est par définition intéressé par un résultat aussi complet que rapide.
On peut imaginer également que pour des laboratoires, des chercheurs, des clients des secteurs public ou privé, des revues de sommaires à périodicité préétablie puissent être envisagées.
Ainsi il n'y aurait plus cette méfiance de la part des uns, ce mépris de la part des autres vis-à-vis de technologies nouvelles, mais leur utilisation à des fins d'économie de travaux répétitifs et ennuyeux au profit d'une adéquation plus grande de la demande des utilisateurs à l'offre de service.
Les économies éventuelles rendues possibles par les désabonnements à certains périodiques accessibles indirectement sont un autre aspect très positif, induit par la fourniture électronique du document 12. Mais il est évident que les éditeurs ne doivent pas être spoliés pour autant; de même lors des consultations sur écran haute définition de revues « feuilletées » par l'ordinateur.
La conservation des documents
Il n'est jamais question dans la littérature consultée, ni dans les propos des concepteurs de ces projets nouveaux, de faire un travail rétrospectif de grande envergure.
Là encore, les bibliothèques par la richesse de leurs fonds datant d'une époque où l'exhaustivité était encore une ambition réalisable, sont irremplaçables.
Les collections de périodiques morts ou anciens ne sont utiles qu'aux historiens, aux épistémologues des sciences ou des techniques mais sont un patrimoine fondamental. De plus, dans certains domaines de la pensée, le problème de la rapidité de l'accès aux documents est très secondaire et c'est plutôt sous la forme d'ouvrages classiques que sont publiés les résultats de travaux de longue haleine 13. Pour les sciences humaines, les outils nouveaux sont intéressants pour croiser des données et constituer des séries statistiques, des typologies qui constituent des auxiliaires indispensables à la recherche.
Enfin, se pose le problème du contrôle bibliographique des documents édités sous forme électronique puisqu'on ne peut pas demander un document si on ne dispose pas aisément de ses références. Dans le même ordre d'idées, on doit s'interroger sur la stabilité des textes puisque modifications et ajouts se feront sans difficulté. Dernier aspect et non le moindre : la conservation et le stockage des documents. Même si les éditeurs se posent en remplaçants potentiels des bibliothèques pour régler ce problème, on ne peut être assuré qu'ils puissent assumer cette responsabilité, d'autant que leur pérennité n'est en rien certaine.
Ainsi, on le voit, les deux fonctions essentielles des bibliothèques, communication et conservation, ne sont pas sur le point de leur être confisquées, mais c'est plutôt une relecture des services à rendre et une ouverture vers des tâches, des techniques et des publics différents qui nous attendent.