Quand l'information va vers le chercheur

Parina Hassanaly

Henri Dou

La documentation informatisée est actuellement le seul outil permettant une consultation large et pluridisciplinaire des acquis scientifiques et techniques des vingt dernières années.Pour arriver à un niveau correct de compétence, il est nécessaire d'initier les chercheurs, d'enseigner l'information sous forme légère à l'Université et dans les écoles d'ingénieurs, de former le personnel des bibliothèques. L'information en tant que science à part entière doit être développée en France pour combler le retard actuel

On line information retrieval is the only tool which has the capability to make pluridisciplinary searches dealing with the last twenty years of scientific and technical results. To obtain a good level of technicity, it is necessary to teach the scientists and studients, and also the librarians, various levels have to be specified. The information as a science must be developped in France to fill the actual gap

Le développement de l'information scientifique et technique est devenu un lieu commun. Au rythme de plus d'une publication toutes les quinze secondes (toutes les cinq secondes si on considère la totalité des fichiers disponibles), il est évident que les anciennes méthodes ne permettent plus une recherche rationnelle de l'information scientifique et technique (IST).

Devant cette situation, l'interrogation en ligne de bases et banques de données (avec des terminaux portables ou plus sophistiqués) a permis d'apporter la seule réponse possible. Le temps où un chercheur faisait reposer sa connaissance sur les seules données bibliographiques acquises par consultation de quelques revues de base est révolu. En effet, l'information moderne repose, pour environ 20 à 30 %, sur la connaissance par contacts, congrès et voyages, de la « tendance » et de l'évolution des thèmes de recherche avant publication. Ensuite, cette perception est replacée dans un contexte plus vaste, grâce à une vue panoramique et pluridisciplinaire très large du sujet. Ce n'est qu'à ce moment que l'on recentrera le travail à effectuer, en utilisant quelques revues spécialisées relatant en détail des expériences ou des modes opératoires similaires.

Ainsi, la valorisation d'un travail de laboratoire passe essentiellement par la connaissance la plus large possible des tenants et aboutissants du travail. Cet effort de synthèse ne peut être actuellement accompli sans l'utilisation de bases et banques de données.

Un effort doit être entrepris par les responsables scientifiques des formations de recherche afin de donner aux chercheurs des laboratoires l'accès le plus large aux sources d'information automatisées. Le potentiel constitué par nos institutions de recherche est vital et doit être dynamisé dans les circonstances actuelles pour donner au pays une impulsion nouvelle sur le plan des recherches de pointe et des technologies. L'information devient, dans ces domaines, un complément indispensable du savoir. Parfois, le conservatisme de nos institutions érige des barrières, mais il faut bien se rendre compte qu'actuellement la compilation, puissance du passé, doit laisser la place à l'innovation et à la réflexion qui deviendront les moteurs de notre avenir. La recherche est bâtie sur un savoir pluraliste international et tous les acquis sont à prendre en compte pour aller de l'avant et acquérir une méthode de pensée nouvelle, plaçant nos actions dans le contexte le plus large possible. C'est dans cette perspective que le traitement de l'information et les méthodes modernes d'acquisition de celle-ci prennent toute leur valeur.

Pour clarifier les idées, signalons trois cas qui illustrent notre propos : Current Contents (accessible en ligne par la base Scisearch) dépouille 2 500 à 3' 000 revues parmi les plus citées au monde pour fournir une bibliographie pluridisciplinaire ; Pascaline (base Pascal, Bulletin signalétique du Centre national de la recherche scientifique (CNRS), accessible en ligne) dépouille 8 000 revues pour conduire aussi à une information pluridisciplinaire ; enfin, Chemical Abstracts prend en compte 12 000 revues pour le seul domaine de la chimie et des sujets proches de celle-ci. Ces trois exemples illustrent les trois zones de l'information :
A : zone dure (Current Contents).
B : zone semi floue (Pascaline).
C : zone floue (Chemical Abstracts).
(B couvre aussi A et C couvre A et B).

C'est dans la zone floue que se situeront les applications techniques variées, les utilisations pluridisciplinaires, etc. Cette zone est très riche et porteuse d'idées. Mais son accessibilité manuelle est quasi impossible car le nombre de revues à consulter augmente exponentiellement en fonction de l'exhaustivité désirée.

La méconnaissance des grandes lois bibliographiques de la dissémination de l'information, ainsi que des possibilités offertes par la recherche en ligne, sont aussi à l'origine d'étranges comportements. L'exemple classique est celui du fichier Pascal. Au dire des chercheurs, le temps passé à effectuer une recherche sur Pascal est trop long pour la quantité d'information retrouvée, des fichiers tels Biosis Inspec, Psycinfo, Chemical Abstracts... étant plus complets. Ceci était vrai du temps de la bibliographie manuelle, mais le préjugé subsiste. Pourtant, c'est au niveau des interactions pluridisciplinaires que se situe l'innovation. Pascal est un des deux fichiers pluridisciplinaires du monde (le deuxième étant Scisearch - Current Contents). Il constitue une richesse peu utilisée, même en France, alors que la recherche bibliographique informatisée permet une consultation en quelques minutes. Encore faut-il utiliser Pascal le plus largement possible, pour amplifier les interconnections pluridisciplinaires sur un sujet plus vaste. Cela implique l'utilisation extensive de l'index de base (BI) implicite et du langage libre à l'interrogation (d'autant plus que le résumé, les descripteurs, les titres, sont inclus dans le BI).

La nécessité de la consultation des bases et banques de données

Il devient donc nécessaire pour le chercheur de consulter régulièrement les bases et banques de données appropriées afin de réaliser les synthèses qui permettent de situer le travail de recherche par rapport à l'ensemble des connaissances de la discipline concernée.

En France, la situation est loin d'être claire, et l'analyse consciente d'un travail ou d'un projet n'est que rarement effectuée.

Cet état de fait est principalement dû au retard de plusieurs décennies pris par l'IST dans notre pays. La comparaison avec les autres pays développés nous est très défavorable. L'IST, science à part entière chez les Anglo-Saxons, n'est pas encore reconnue par le CNRS qui n'admet pas, actuellement, la nécessité de l'interpénétration par le biais des chercheurs de cette science et de la recherche. D'autre part, l'interrogation télématique des bases et banques de données n'a pas trouvé une juste place dans les laboratoires.

Jusqu'alors la « puissance » et le contrôle des « opérations » scientifiques étaient souvent obtenus par une simple connaissance bibliographique, consolidée par des années de pratique. Cela n'est plus vrai. On peut désormais en quelques minutes obtenir, sur n'importe quel sujet et sur une période de quinze ans, plus d'information que n'en aurait un chercheur « confiné », depuis cette période, dans un sujet identique. Le temps est venu où la réflexion et l'analyse doivent se substituer à une simple connaissance livresque de l'information. On en est encore loin, mais des efforts sont réalisés dans ce sens.

On entend souvent l'objection suivante : « la bibliographie par ordinateur est trop chère, elle n'est pas bonne, on a fait des essais non satisfaisants ».

Nous allons examiner successivement ces deux points : les problèmes de coût et le taux de satisfaction.

Les problèmes de coût

Sans polémique, nous avons rapporté ici le coût de la bibliographie en ligne (par heure, pour divers fichiers) au prix de quelques fournitures de laboratoire.

Ceci est sans commentaire. Reste le prix du terminal. Celui-ci peut être acquis pour la somme de 15 000 F environ. Il peut être portable et servir à plusieurs laboratoires, puisque quelques heures seulement de bibliographie par mois seront nécessaires.

La faible qualité des résultats

Cette critique provient directement du mauvais usage qui, au départ, a été fait de cette technique. On n'interroge pas un fichier sans étude préalable ; une connaissance de base des fichiers (de leur contenu, des méthodes d'indexation...), du (ou des) logicie'l(s) d'interrogation et de la discipline s'impose. Pour cela, il est nécessaire de donner une formation tant aux spécialistes de la documentation qu'aux chercheurs. En effet, ce n'est pas en s'équipant d'un terminal que l'on résoudra le problème, mais c'est en comprenant suffisamment la technique, le sujet et l'utilisation du fichier que l'on aboutira au résultat escompté.

Les étapes d'une initiation rapide

Nous nous sommes aperçus rapidement qu'une formation dans le domaine documentaire, même si elle s'adresse à des scientifiques, demande plusieurs jours, et ceci par « doses contrôlées » avec un espace de temps (incubation) de l'ordre d'un mois à deux mois entre les formations.

Cette organisation a été mise en place avec la section de formation continue du CNRS et fonctionne depuis bientôt quatre ans dans la région Provence-Alpes-Côte d'Azur.

Mais avant d'obtenir des chercheurs qu'ils s'inscrivent volontairement (bien souvent, il faut aussi convaincre le directeur de la formation !) à ces sessions, il a fallu montrer, sur place, l'intérêt de ces méthodes de recherche bibliographique. Pour cela, nous avons, il y a six ans, décidé d'aller directement dans les laboratoires présenter lors d'une conférence les procédés modernes d'accès à l'information, avec une démonstration en guise de conclusion.

Cette approche a été réalisée au départ grâce à des contacts personnels et a été aussi favorisée par la curiosité de collègues, se demandant pourquoi nous nous intéressions à cette branche de la connaissance. Le programme était généralement le suivant :
- proposition d'une conférence suivie d'une démonstration ;
- fixation de la date et du lieu : nous allions généralement dans'le laboratoire ;
- test de la ligne téléphonique (on donnait le numéro équivalent à Transpac à l'époque et on vérifiait la présence de la fréquence) ;
- demande de proposition d'un sujet bibliographique intéressant le laboratoire, les frais de l'interrogation étant couverts par celui-ci, la facturation étant effectuée par l'Université.

Ces questions réglées, le jour de la conférence arrivait : et nous étions attendus généralement avec curiosité, scepticisme ou ironie. Après une introduction aux systèmes télématiques, au logiciel et à la constitution de bases de données, nous décrivions plus en détail l' « outil bibliographique papier » utilisé par les chercheurs, étant entendu que le même fonds serait interrogé en ligne.

Là, une première surprise attendait l'assistance : dans plus de 90 % des cas, les chercheurs n'utilisaient pas à plus de 50 % de leur capacité les produits papiers, sources de leur information. Il y avait à cela plusieurs causes possibles : connaissance insuffisante des instruments bibliographiques, achat d'une partie seulement des documents, etc. Arrivait la démonstration. Le sujet avait été préparé, et nous demandions toujours aux chercheurs de formuler devant nous une stratégie de recherche, semblable à celle qu'ils utiliseraient pour exploiter manuellement la source documentaire. On demandait aussi aux chercheurs s'ils avaient une idée bien précise du nombre de travaux publiés sur le sujet.

Généralement, le résultat n'était pas très positif, car les chercheurs ne retrouvaient pas ce qu'ils souhaitaient ; s'ils avaient essayé ce système d'interrogation auparavant, ils notaient que les résultats n'étaient pas plus performants. On effectuait alors la même recherche en utilisant une stratégie différente que l'on développait devant l'assistance. Celle-ci remarquait alors une différence fondamentale dans les résultats obtenus et bien souvent le chercheur, dont on n'avait retrouvé que les travaux personnels en utilisant les mots-clés indiqués par lui, constatait que de nombreux groupes scientifiques inconnus de lui travaillaient sur des sujets très proches.

Nous faisions alors des démonstrations de recherche par auteurs et le fait de savoir que l'on pouvait trouver qui publiait quoi et où, provoquait généralement divers commentaires. Nous terminions en réalisant une recherche sur l'évolution d'un sujet ou d'une technique d'analyse dans le temps, en volume de travaux, rapports, brevets, publications, etc.

Nous pensons avoir convaincu par cette méthode, beaucoup de gens et avoir donné à d'autres l'envie de mieux connaître ces systèmes. Ceux-ci s'inscrivent généralement par la suite à des cours de formation plus spécialisés.

La documentation et les documentalistes

Si, dans le secteur privé, on peut engager des spécialistes de telle ou telle discipline pour effectuer des interrogations, il n'en est pas de même dans le secteur public. La majorité des personnels est d'origine littéraire et, de ce fait, ne connaît pas particulièrement les disciplines scientifiques. Dans beaucoup d'autres cas, le personnel effectuant l'interrogation n'a jamais reçu la formation nécessaire à l'exercice de cette profession. La formation devient alors beaucoup plus difficile et ne peut être qu'un complément technique à celle des chercheurs qui devront, après une formation initiale, assister par leur connaissance du domaine le documentaliste lors de l'interrogation ou de sa préparation.

Pour atteindre ce but, nous avons créé à l'Université d'Aix-Marseille un certificat d'études supérieures (CES) de gestion de l'information économique, scientifique et technique qui permet à toute personne ayant des diplômes de type Bac + 3 (ou les connaissances jugées équivalentes) de se familiariser avec le matériel d'interrogation, la pratique des logiciels et l'interrogation de fichiers techniques.

Un complément léger d'informatique et de bureautique est enseigné dans ce CES. Le nombre des inscrits est limité à quinze.

Conclusion

En l'état actuel de l'enseignement de l'IST dans les écoles d'ingénieurs et à l'université, il paraît primordial :
- de fournir aux enseignants et aux chercheurs les connaissances de base nécessaires à l'utilisation correcte des méthodes modernes d'accès à l'information ;
- de donner au moins aux étudiants préparant un Diplôme d'études appliquées (DEA) et aux élèves-ingénieurs une initiation légère dans le domaine ;
- d'amener les personnels des bibliothèques volontaires à acquérir la technicité nécessaire à l'interrogation, mais en situant bien le problème de leurs relations interactives avec le chercheur, nécessaires pour effectuer un travail correct.

Illustration
Les trois zones de l'information

Illustration
Les problèmes de coût (1/2)

Illustration
Les problèmes de coût (2/2)