Systèmes experts et documentation
Isabelle Boudet
L'ADBS a consacré, le 3 mars 1987, une journée d'étude aux applications de l'intelligence artificielle et des systèmes experts en documentation. Chantal Reynaud, du laboratoire de recherche en informatique de l'université Paris-Sud, Centre d'Orsay, a retracé l'historique et décrit le fonctionnement de ce nouvel outil. La recherche en intelligence artificielle étudie les moyens de reproduire certaines des activités mentales humaines. Contrairement à l'informatique classique, qui utilise l'énorme puissance de calcul de la machine, elle emploie l'ordinateur pour « percevoir », « comprendre », « raisonner » sur des connaissances. Les premiers essais qui tentaient de mettre au point des méthodes universelles, se sont soldés par un échec. Au début des années 70, sont apparus les systèmes experts Dendral en chimie organique et Mycin en médecine.
Les systèmes experts ont pour but de reproduire l'expérience et le mode de raisonnement des spécialistes. Dans un domaine d'application précis et limité, ils peuvent être utilisés à résoudre des problèmes, vérifier des résultats, satisfaire des requêtes, détecter des incohérences ; on peut leur demander par ailleurs d'expliquer et de justifier leur raisonnement. La structure d'un système expert se décompose en une base de connaissances qui rassemble les données fournies par un spécialiste et mises en forme par un « cogniticien », et un moteur d'inférence qui va construire le raisonnement. Une base de faits décrit la situation à expertiser. Elle constitue la mémoire de travail de l'ordinateur et conserve les informations déduites en cours de raisonnement.
Si « je pense », alors « je suis »
Les données de la base de connaissances sont représentées sous la forme de règles de production : si « conditions », alors « conclusion ». Les règles sont indépendantes les unes des autres, aucune règle ne fait référence à une autre règle. Elles sont déclaratives, par opposition au caractère directif de la séquence d'instructions d'un programme classique ; elles sont entrées sans ordre, et, par conséquent, faciles à mettre à jour. Ce mode de représentation des connaissances permet d'exprimer de façon simple et modulaire le savoir des spécialistes.
Par exemple, dans le système Mycin : « Si le site de la culture est le sang, et si l'organisme est gram négatif, et si l'organisme est de forme bâtonnet, et si le patient est un hôte à risque, alors, il est probable (0,6) que l'organisme est le pseudomonas aeruginos. » On notera la pondération : 0,6. Pour transmettre des connaissances plus ou moins sûres, des coefficients de vraisemblance sont affectés aux règles.
Le moteur d'inférence construit dynamiquement une solution. Il sélectionne les règles candidates, en choisit une et l'applique. Deux modes de raisonnement peuvent être utilisés : le raisonnement déductif (ou chaînage avant) et le raisonnement régressif (ou chaînage arrière). En chaînage avant, la règle « si A, alors B » ne peut être déclenchée que lorsque les conditions exprimées par A sont vérifiées dans la situation à expertiser. Le fait B est alors ajouté à la base de faits. En chaînage arrière, la règle « si A, alors B » est utilisée pour remplacer le but B par un ensemble de sous-buts équivalents exprimés par la prémisse A.
La première étape d'un cycle de base de moteur d'inférence, la sélection des règles, nécessite la confrontation de chacune d'entre elles avec l'ensemble des faits de la base de faits. Comment choisir la règle à déclencher : la plus précise, la plus récente ou tout simplement la première trouvée ? Certains systèmes introduisent des « méta-règles » qui définissent une stratégie de choix liée au domaine de connaisssances, par exemple, dans Mycin : « Si le patient est un hôte à risque, s'il existe des règles qui mentionnent les pseudomonas dans leurs prémisses, s'il existe des règles qui mentionnent les klebsielles dans leurs prémisses, alors il est préférable d'utiliser les premières avant les secondes. »
Les systèmes experts s'avèrent utiles lorsqu'il n'y a pas d'algorithme pour résoudre un problème, mais qu'il existe des spécialistes de ce problème ; lorsque les connaissances évoluent très vite dans un domaine et que l'on veut les mettre à jour facilement ; lorsque l'on a besoin d'explications sur l'enchaînement des connaissances pour suivre le raisonnement, par exemple en enseignement assisté par ordinateur (EAO).
Après cet exposé général, les liens entre systèmes experts et documentation ont été évoqués par de nombreux intervenants.
Bernard Normier et Pierre Le Loarer, de la société Erli, ont fait le point de leurs recherches sur l'accès en langage naturel aux banques de données. Ces travaux, qui ont pour but de faciliter le dialogue homme-machine, relèvent de l'intelligence artificielle puisqu'il s'agit de passer par le sens et non plus par la forme, de construire un système de représentation des connaissances.
Clément Paoli, du Centre de documentation de l'armement (CEDOCAR), a insisté sur les difficultés liées au nombre et à la qualité des banques de données, et sur le besoin d'un système expert d'aide à l'interrogation, qui ait pour compétences la connaissance des banques de données, des serveurs et des procédures d'interrogation, l'évaluation des banques de données et des logiciels.
Pour Bertrand Michelet (Serpia/CDST), une banque de données est en elle-même une source d'information exploitable par un système expert, le problème étant alors d'extraire et de condenser l'information contenue dans la base. A cette fin, la méthode d'analyse des mots associés, concrétisée par les programmes LEXIMAPPE, permet de générer une information structurée qui peut être organisée en base de connaissances et utilisée en tant que telle. Ces programmes servent également à évaluer l'état de la recherche dans un domaine scientifique et à en déterminer les grandes tendances.
Christian Dutheuil, directeur du Service technique du CNIC (Centre national de l'information chimique), a mis l'accent sur l'intérêt que présentent les banques de données pour un système d'aide à la décision. Pour une entreprise, la surveillance de l'environnemént scientifique est un élément essentiel de la stratégie industrielle. L'analyse de données permet de déterminer un certain nombre de facteurs critiques qui sont placés sous contrôle permanent. L'application des méthodes de la statistique et de l'analyse de données aux banques de données donne naissance à de nouvelles disciplines, bibliométrie, technométrie, scientométrie, indispensables à l'exploitation stratégique de l'information. Déjà, des outils de dénombrement statistique sont apparus sur certains serveurs, GET sur Infoline, MEMTRI sur Questel et ZOOM sur IRS/ESA ; des logiciels sont disponibles sur micro-ordinateur, PATSTAT de Derwent pour les brevets, par exemple.
Applications multiples, marchés limités
D'autres expériences ont été décrites, qui montrent la diversité des applications possibles : l'informatisation d'un fichier bibliographique en neurologie, à la bibliothèque Charcot de la Salpêtrière ; les recherches du CNRS sur l'analyse et la reproduction du raisonnement dans le domaine archéologique, avec le moteur d'inférence SNARK ; les systèmes experts d'aide au diagnostic des maladies des plantes, développés à l'Institut national de la recherche agronomique (INRA), produits destinés à une large diffusion par minitel, afin de les rendre accessibles aux professionnels ; l'utilisation d'un système expert de reconnaissance automatique des caractères à Inovatic, société spécialisée dans la saisie de données par lecture optique.
Au total, une journée très dense qui illustre bien la multiplicité des domaines concernés par les systèmes experts. Mais, si les perspectives ouvertes par l'intelligence artificielle paraissent immenses, le chemin qui reste à parcourir ne l'est pas moins. Les problèmes à résoudre sont de tous ordres : techniques, économiques, sociaux et psychologiques. Et pour commencer les difficultés de la collecte de l'expertise auprès des spécialistes, cette maïeutique de l'évidence qui doit souvent recourir aux forceps 1.
Un certain nombre d'incertitudes et de questions n'ont pas manqué d'être soulevées dans le débat : en particulier celle du marché des systèmes experts en documentation, et des problèmes de coût qui y sont liés. On commence tout juste aujourd'hui à entrevoir des débouchés pour les systèmes experts dans les secteurs médical et financier, et dans celui de la production, pour la conception, la surveillance et le dépannage d'installations industrielles ; le domaine militaire restant le plus important de leurs champs d'application et leur véritable moteur : 60 millions de dollars ont été dépensés en intelligence artificielle par la Defense advanced research project army (DARPA) aux Etats-Unis, en 1986. Si l'on peut estimer à plusieurs centaines les prototypes actuellement à l'étude, et à plus d'un millier les maquettes en chantier, on ne compte de par le monde que quelques dizaines de systèmes ayant démontré leur « profitabilité » 2, ayant fait la preuve qu'ils étaient à la fois opérationnels et rentables.