Une expérience de coopérative documentaire : le réseau d'information sur l'économie de l'énergie

Louise Cadoux

Divers organismes ont décidé avec l'aide du Centre national de la recherche scientifique de coopérer pour constituer progressivement une banque de données documentaires en économie de l'énergie. Les documents sélectionnés sont traités grâce à un système de programmation logique en économie de l'énergie (SPLEEN). Conçu dans la perspective d'une exploitation des informations sous forme de bibliographies systématiques éditées mensuellement, ce système permet en outre de réaliser des abonnements sur profil et de fournir des réponses à des recherches documentaires.

Parler du réseau d'information en économie de l'énergie, c'est du même coup tenter de démontrer que, malgré des difficultés techniques et psychologiques, la coopération de plusieurs organismes sur un thème d'intérêt sans doute limité, mais qui les rapproche, apporte un moyen efficace de résoudre empiriquement un certain nombre des problèmes posés par la circulation de l'information.

Au point de départ de cette entreprise, une conviction partagée sur la vertu d'un certain nombre de données de bon sens, extrêmement banales, qu'on rappellera chemin faisant; mais surtout, deux ans après la première réunion constitutive du réseau, une affaire qui fonctionne, qui a traversé la petite enfance sans trop d'accidents de santé, qui peut se présenter comme un modèle pour d'autres groupements de caractère coopératif à monter sur d'autres thèmes d'intérêt. Deux ans pour rassembler neuf partenaires, définir les produits à proposer aux utilisateurs, cerner les différentes fonctions nécessaires, se répartir les charges, sortir un premier produit, complètement automatisé au surplus, s'entendre sur les modalités d'accès à la banque d'information, c'est, au total, bien peu si l'on fait le compte des difficultés qu'il a fallu surmonter pour parcourir le chemin qui sépare de l'action l'énoncé des intentions.

Neuf organismes dont un à compétence internationale, la Commission des communautés européennes (C.E.E.). Dans la liste des huit autres partenaires, tous français, on repérera des organismes à vocation générale et des instituts spécialisés, des établissements à statut public et des organismes privés, des universitaires et chercheurs d'une part, des ingénieurs d'autre part; Paris sans doute, mais la province aussi. Ce sont, par ordre alphabétique : le Centre de documentation sciences humaines du CNRS, le Commissariat à l'énergie atomique, le Centre d'études régionales sur l'économie de l'énergie, le Centre de documentation sciences exactes du CNRS Section 730, Elf-Union, l'Institut économique et juridique de l'énergie, l'Institut français des combustibles et de l'énergie, l'Institut français du pétrole.

Pas d'aide spécifique des pouvoirs publics pour entreprendre cette action, si ce n'est celle qui transite, dans la masse indéterminée des crédits, par les cellules de documentation mobilisées dans l'affaire. Pas non plus de formule juridique originale, mais un simple protocole d'accord signé au plus haut niveau par les directeurs généraux ou présidents des organismes engagés. Ce protocole d'accord dont l'exposé des motifs véhicule la foi en la coopération est un simple accord multilatéral qui étiquette les différentes opérations nécessaires à la constitution et à l'exploitation d'une banque d'informations documentaires et à cette occasion, enregistre, sur des détails concrets, ce à quoi chacun s'engage.

Plus encore que sur l'analyse qui fait, en général, l'objet de travaux privilégiés dans le monde des documentalistes, c'est sur la collecte des documents que les partenaires ont mis l'accent : il est en effet apparu, dans ce domaine limité, que l'information la plus précieuse, la plus recherchée et partant la plus difficile à repérer, empruntait des supports de diffusion restreints, échappant aux circuits de diffusion commerciale : sans doute doit-on compter quelques ouvrages et articles de périodiques; mais même ces derniers ne représentent qu'une faible proportion de l'ensemble du stock et la grosse masse des documents relève de la littérature souterraine qu'il est difficile, en général, de débusquer : thèses multigraphiées, rapports de recherche, études des services économiques des grandes entreprises énergétiques, documents internationaux. C'est ici, bien évidemment, que les organismes très spécialisés déjà munis, sous la pression des besoins, de moyens informels de ramassage prenant appui sur des relations personnelles, apportent une contribution tout à fait essentielle. La carte d'une banque française d'informations en économie de l'énergie méritait aussi d'être jouée dans la mesure où l'étude des problèmes d'information et de documentation à la conférence mondiale de l'énergie est confiée à un Institut français.

Après une étude, il est apparu que 200 à 250 documents sur l'économie de l'énergie pouvaient être engrangés chaque mois. C'est dire qu'il s'agit d'une banque de faible volume, qu'il n'est pas ici question de faire rêver par des chiffres comme ceux qu'annoncent les grandes entreprises documentaires telles Chemical abstracts, Medlars, le Bulletin signalétique du CNRS.

En même temps que sur la collecte, c'est sur la sélection qu'ont insisté les partenaires spécialisés, qui se sont ici faits les porte-parole des usagers. S'écarter de l'exhaustivité aussi délibérément, c'est bousculer l'orthodoxie documentaire. Mais pourquoi s'entêter sur un dogme qui, dans ce domaine au moins, ne répond pas aux besoins, qui accable l'usager sous le poids des références et le détourne du service documentaire, donne au documentaliste, en général à la documentaliste, exagérément pénétrée de ses limites - attitude qui aide encore à la repousser vers des tâches ancillaires - ce faux-fuyant, cette manière d'avoir bonne conscience et d'échapper à ses responsabilités ? Bref, sur ce point, et c'est encore ici la participation combien indispensable des documentalistes spécialisés du réseau qui permet d'affronter le dogme, le réseau a estimé devoir sélectionner les références aux documents qui seront accumulées dans la banque et éliminer la littérature redondante, les doublets en traduction, les travaux de vulgarisation, etc.

Deux mots encore sur le problème de la nature des références : d'une part, une place est faite aux recherches en cours, d'autre part les documents dits bruts, de caractère quantitatif, les statistiques, en somme, sont pris en compte au même titre que la littérature discourante.

Décentralisé ainsi qu'on vient de le voir au niveau de la collecte du stockage et de la sélection, le traitement de l'information l'est aussi, mais à un moindre degré au niveau de l'analyse. C'est ici qu'il faut commencer à parler du système SPLEEN, conçu et écrit précisément pour tenter de répondre aux besoins du réseau. SPLEEN, Système de Programmation Logique en Économie de l'Énergie, a l'ambition de régler un certain nombre de problèmes dans la perspective aujourd'hui très classique d'une exploitation des informations contenues dans la banque sous la forme de bibliographies systématiques éditées mensuellement dans une revue, d'abonnements sur profils, de réponses à des recherches documentaires.

Pour une banque d'informations dont on a souligné les dimensions modestes, il paraît peut-être un peu hors de proportion d'avoir voulu l'automatiser au départ. Divers mobiles ont conduit à répudier la solution manuelle : alliées à certaines circonstances (présence d'une équipe d'informaticiens chez l'un des partenaires -volonté de figurer en bonne place dans le concert international, sentiment confus que l'automatisation est la voie de l'avenir - volonté de « se faire la main » sur un terrain pilote), les justifications les plus valables sont encore celles qui prennent racine sur le thème de l'opposition entre la lourdeur des entrées et la souplesse et la diversité des exploitations possibles. Même pour un stock réduit, il est apparu qu'à long terme, la solution était valable.

Dans le système SPLEEN, à l'heure actuelle, l'entrée matérielle des données est centralisée; l'un des partenaires - c'était l'un des volets de sa participation -était en mesure de l'assumer et c'eût été vraisemblablement rechercher les difficultés que de vouloir décentraliser cette opération. Mais du même coup, l'option ici prise a des répercussions en amont sur l'opération d'analyse - support et fond.

Quant au support, on le comprendra aisément dès lors qu'il était décidé d'entrer l'information sous une forme riche, c'est-à-dire avec majuscules, minuscules et accents, rassembler des supports de saisie différents, cartes perforées, bandes perforées, bandes magnétiques émanant de centres différents eût exigé des tables de concordance à défaut d'accord sur le codage. De toute manière, un certain nombre de partenaires ne pouvaient présenter leurs références que sur des fiches manuelles et il fallait bien saisir les entrées correspondantes. Une console équipée d'une boule spéciale répondant aux contraintes de richesse typographique étant disponible dans le centre chargé du traitement, les entrées sont faites sur cette console « on line » grâce à un système d'entrées permettant le contrôle, l'effacement, l'insertion, la renumérotation automatique des lignes. Ici on le voit, pas d'instructions particulières pour l'écriture des fiches : il suffit grossièrement de suivre le génie des langues des documents traités, en veillant à ne pas en mutiler le graphisme. Précisons que si, on l'espère, la saisie peut être opérée « on line », ce mode n'est pas exclusif des autres systèmes d'entrée : carte, bande perforée, bande magnétique, « off line »...

Au niveau du type d'informations indispensables, un compromis était nécessaire qui s'inspire de l'idée suivante : il était hors de question de demander aux 9 partenaires de s'entendre sur un bordereau commun. Si certains des participants n'avaient pas de bordereau ou de type de fiche et étaient disposés à se plier à un bordereau commun, d'autres au contraire avaient déjà adopté une présentation de fiche et entendaient se borner à reproduire pour le réseau (par photocopie en général) les signalements concernant l'économie de l'énergie déjà extraits pour leurs propres besoins. On ne pouvait envisager un seul instant de leur demander d'abandonner leurs habitudes ou de recopier sur le bordereau type qui aurait été imposé par le réseau toutes les informations. Les partenaires se sont donc entendus sur une liste de types d'information nécessaires, variables d'ailleurs selon les 6 types de documents ramassés - et ils veillent à ce que les bordereaux qu'ils envoient pour divers qu'ils soient dans la répartition matérielle des renseignements bibliographiques sur la fiche contiennent ceux exigés pour le traitement ultérieur de l'information (titre, auteur, date, langue, etc.). Le bureau qui centralise les bordereaux émanant des différents partenaires repère les informations, définit les zones d'informations et les étiquettes à l'aide de codes; la liste des codes nécessaires, se présentant dans un ordre obligatoire, est donnée au personnel de saisie qui se trouve ainsi dirigé pour les opérations d'entrée. Ce personnel doit avoir des qualifications supérieures à celles d'une simple perforeuse puisqu'il lui faut non seulement s'interroger sur l'ordre dans lequel s'enchaînent les opérations - mais aussi manipuler le système d'entrée « on-line ». Les zones d'informations ainsi identifiées sont enregistrées en machine en format variable.

Six types de documents pouvant être répertoriés (ouvrages, articles de périodiques, travaux universitaires, rapports, congrès, recherches en cours), des règles très précises de catalogage pour chaque document ont été arrêtées. Elles sont réunies dans un mode d'emploi du bordereau, document de caractère très technique, rédigé pour les 9 partenaires de manière qu'ils puissent s'en inspirer; pour l'organisme centralisateur, c'est évidemment la bible.

Les informations documentaires ainsi saisies sont stockées dans une base de données : elles concernent, bien entendu, tant la forme physique des documents, ce qu'on appelle d'habitude les références bibliographiques, que l'analyse de leur contenu. Ce stockage est organisé de façon originale de manière à éviter la redondance des références bibliographiques; ainsi, un titre de périodique commun à plusieurs articles ne figurera-t-il qu'en un seul exemplaire dans la base de données. Cette option permet de gagner de la place sur la mémoire.

Quant à la partie de la fiche qui contient l'analyse du document, dite partie thématique, elle est structurée en deux niveaux : une phrase principale, venant en tête, qui rassemble, reliés par une syntaxe simple issue du langage naturel, les descripteurs qui définissent le contenu global du document; en économie de l'énergie, il semble que trois données soient fondamentales : la date de l'observation ou de l'analyse, le champ géographique, le sujet (étude d'un produit, d'un secteur, d'une méthode). Viennent ensuite, coiffées par cette phrase principale, les sous-phrases consacrées aux thèmes particuliers, spécifiques, traités par le document.

Cette option sur la structure de la phrase d'indexation s'est imposée pour permettre l'édition des index, riches quant au contenu, que l'on voulait offrir aux lecteurs du bulletin, en même temps qu'une stratégie de recherche dans le fichier documentaire.

Ainsi fragmentées en unités élémentaires d'information, les données sont entrées, contrôlées, corrigées et stockées sur des fichiers à accès direct. L'ensemble de cette base de données est géré par le système SPLEEN sur 3 fichiers où les enregistrements sont chaînés les uns aux autres. C'est par recherche dans ces fichiers que sont constitués les 6 types d'index mis à la disposition du lecteur dans chaque fascicule : index des types de documents, index par produit énergétique, index par pays, index des noms cités, index auteur, index matières enfin. Ce dernier est en réalité un KWOC : le descripteur est dégagé en tête, et, dessous, suit toute la phrase de contexte dans lequel il se situe. Si le descripteur appartient à une phrase principale, seule est reproduite la phrase principale dont il est extrait, s'il appartient à une sous-phrase, la sous-phrase est évidemment reproduite mais également précédée de la phrase principale de manière à enrichir le contexte.

On a donc voulu offrir au lecteur des accès systématiques à l'information extrêmement diversifiés. C'est l'étude et l'observation des démarches documentaires les plus fréquentes des usagers qui a inspiré le choix de ces accès systématiques. Les index ont été délibérément rassemblés en tête de la bibliographie pour habituer le lecteur à entrer dans l'information par les index qui sont, en quelque sorte, des pistes balisées.

Ces nombreux accès se traduisent évidemment par un coût élevé d'édition (papier et impression) : on compte que pour 200 références bibliographiques environ à paraître chaque mois, la revue dans un format 2I X 29,7 cm atteindra 200 pages, se répartissant à peu près à raison de 1/3 pour les analyses et de 2/3 pour la somme totale des index.

Dernière observation : les membres du réseau ont estimé que ne méritaient pas d'être éditées dans le bulletin les références à tous les documents enregistrés dans la base de données : celles-ci seront livrées pour les profils et la recherche documentaire à la demande, mais elles ne figureront pas toutes dans l'édition. On a déjà dit qu'une sélection était opérée par chaque partenaire du réseau au moment du repérage et du signalement des documents. Un second filtre est mis en place au moment de l'édition : un comité de rédaction y veille chaque mois.

Après recherche dans les fichiers, le bulletin constitué des analyses et des 6 index se présente sur une bande magnétique. Celle-ci reçoit des codes de fonction typographique (italique, gras, etc.) et les codes nécessaires à la mise en page. Elle est alors envoyée à l'imprimeur qui sort le bulletin en photocomposition.

Telle est donc l'étape à laquelle est parvenu maintenant le système SPLEEN; on peut avancer sans trop de présomption que ce système qui groupe, en une trentaine de programmes, 12 à 16000 instructions, est quasi-opérationnel puisqu'il a « fait tourner » 4 bulletins.

La correction des bordereaux par le bureau central, l'entrée des données, le traitement en ordinateur, le temps de l'édition et de la publication de la revue occupent 5 semaines environ. C'est encore trop long : il semble raisonnable d'escompter que les délais pourront être abrégés, ceux surtout de l'imprimeur qui, sur ces 5 semaines, en prend encore 3 pour les opérations de photocomposition, tirage, reliure.

Outre ces efforts du côté des délais pour lesquels il faut s'en remettre à la diligence de tous les partenaires du réseau, restent encore à franchir, à partir de la même base de données, les étapes ultérieures : celle de la recherche documentaire et celle de la desserte sur profils. Les deux prochaines années vont y être consacrées, en même temps que s'édifiera progressivement le vocabulaire d'interrogation. Pour l'instant une nomenclature de produits énergétiques et une nomenclature de pays sont utilisées. Sauf pour ces deux séries d'information qui seront contrôlées à l'entrée, il est prévu d'entrer l'information en langage naturel et de n'édifier le lexique qu'après avoir engrangé une masse plus importante de documents.

Il est également prévu de tester le système sur d'autres banques d'information sectorielles, également constituées sur une base coopérative, afin d'en éprouver la souplesse, la généralité et l'aptitude à traiter des volumes d'informations plus importants. L'ambition était, en effet, de constituer un software de base de données valable pour d'autres champs ou thèmes d'intérêt que l'économie de l'énergie. De même doivent être étudiés, pour l'édition, d'autres supports de sortie.

Il serait sans doute prématuré de publier un bilan financier de l'opération, car s'il est peut-être, mais avec mille réserves et explications, possible de faire une analyse des coûts, celle-ci ne concerne pas encore la phase de gestion opérationnelle. Tant qu'on ne sait pas quel accueil la clientèle présumée peut faire à ce genre de publication, on ne peut affirmer que la formule du bulletin mensuel est la meilleure. Utile dans la période de démarrage pour faile connaître la banque d'information constituée, elle devra peut-être s'effacer au profit des autres formules d'interrogations : recherche à la demande, profils, fourniture de bandes.

Beaucoup, trop peut-être, a été dit sur la banque d'informations documentaires. C'est, il est vrai, qu'en deux années, elle a absorbé beaucoup des énergies des différents participants du réseau. C'était presque un pari sur la bonne entente et l'efficacité - deux qualités peu communes - et les partenaires ne voulaient pas perdre ce pari. Mais parallèlement et plus discrètement, deux participants commençaient à constituer des banques de données quantitatives sur le thème de l'économie régionale ou des prix des produits énergétiques dans le monde. Un inventaire des sources d'informations disponibles dans le monde en économie de l'énergie exploitait un questionnaire envoyé à 200 organismes. On a parlé aussi de la normalisation du vocabulaire entreprise par étapes.

Annoncer trop bruyamment que le réseau d'information sur l'économie de l'énergie a atteint son rythme de croisière serait, bien sûr, présomptueux. Il reste encore à maintenir à un niveau convenable l'alimentation du réseau en informations, à éprouver et compléter le système SPLEEN, à promouvoir le ou les produits, par dessus tout à faire face à la sanction du marché par lequel s'exprime la masse des utilisateurs anonymes. Pas mal de chemin déjà parcouru; encore plus sans doute à faire.

Très volontairement, on n'a pas dit ici ce que chacun avait fait, car chacun a fait selon ses moyens, ses disponibilités et celles-ci sont de toute nature : tous ont mesuré que les seules ressources matérielles ne suffisaient pas à créer un esprit. C'est l'ultime leçon de cette expérience-pilote.

Illustration
Annexe 1

Illustration
Annexe 2 (1/9)

Illustration
Annexe 2 (2/9)

Illustration
Annexe 2 (3/9)

Illustration
Annexe 2 (4/9)

Illustration
Annexe 2 (5/9)

Illustration
Annexe 2 (6/9)

Illustration
Annexe 2 (7/9)

Illustration
Annexe 2 (8/9)

Illustration
Annexe 2 (9/9)