MOBI-DOC
Étude comparative des progiciels de recherche documentaire pour micro-ordinateurs
Roland Bertrand
Emmanuel Henriot
Résultats de l'étude comparative des principaux logiciels de recherche documentaire utilisables sur micro-ordinateurs, menée par le Bureau des études et des opérations techniques de la DBMIST au cours du 1er semestre 1983. L'accent est mis sur 11 systèmes documentaires opérationnels en juillet 1983 décrits et comparés de façon précise.
Here are the results of a comparative study of the main packages for information retrieval available on micro-computers. The survey was conducted by the Technical studies and operations office of the DBMIST during the first half-year of 1983, and laid a special emphasis on 11 systems operative since June 1983.
L'article publié ci-dessous reprend de très larges extraits d'une étude publiée par la DBMIST au mois de septembre 1983.
Introduction
L'incessante évolution technologique, l'intelligence des machines automatiques, la révolution des micro-processeurs, les fantastiques performances des micro-ordinateurs... Ce sont quelques-unes parmi les diverses approches « accrocheuses » proposées au grand public, et souvent aux professionnels, en guise d'information sur les nouvelles technologies et leurs applications.
Quiconque a pour fonction de suivre ces développements doit déjà fournir un important travail de synthèse dans la mesure où il faut constamment tout à la fois réajuster ses connaissances et faire le tri entre ce qui est annoncé et ce qui est véritablement opérationnel. Pour ce qui concerne le public utilisateur potentiel - cible domestique ou non - la confusion est à son comble. Un seul exemple : l'utilisation indifférenciée des termes mini et micro-ordinateurs qui, de toute façon, sont génériquement regroupés avec les CRAY 1 sous le vocable d'ordinateur.
Dans tous ces secteurs, où le facteur d'obsolescence des connaissances est excessivement élevé, il est indispensable de « coller au plus près » de l'existant. C'est tout particulièrement vrai dans le domaine des micro-ordinateurs pour lequel tous les professionnels s'accordent à dire qu'un délai de 6 mois est maintenant suffisant pour rendre technologiquement dépassée une machine de pointe, ce qui ne signifie pas, tout au contraire, qu'elle ne pourra plus rendre aucun service, mais qu'elle tombera rapidement dans l'oubli des publications spécialisées et, par conséquent, de leurs lecteurs.
De par sa mission et sa situation centrale, la DBMIST joue un rôle important de conseil et d'information sur les nouvelles technologies. En ce qui concerne les micro-ordinateurs, la demande porte principalement - mais non exclusivement - sur leur utilisation en tant qu'outil de recherche documentaire. Mis en confiance par le discours dominant et par le phénomène de mode coexistant, beaucoup décident d'informatiser leur documentation et, pour ce faire, nous demandent de les aider. Beaucoup d'autres sont certainement sur la même voie et sont donc des demandeurs potentiels d'informations. Une mise au point s'imposait donc.
La prétention de ce rapport est simplement d'être une photographie de la situation actuelle en matière de fonctionnalité documentaire des systèmes informatiques bas de gamme que sont les micro-ordinateurs. Il s'agit, tout en s'efforçant d'être proche de l'exhaustivité, de faire un bilan facilement assimilable de la diversité de situation que recouvre la réponse à la problématique précédente.
A la recherche des progiciels
La notion de logiciel (ou progiciel suivant que l'on se place dans une optique scientifique ou commerciale) de recherche documentaire fait spontanément référence à des produits utilisant de grosses ou moyennes configurations. Ainsi tout le monde connaît MISTRAL ou STAIRS qui exigent des systèmes lourds, mais dans cette même gamme de matériel existent aussi les logiciels ORBIT, ELHILL, DIALOG, ESA-QUEST, QUESTEL, BASIS, GOLEM, ISIS,... ainsi que des produits moins sophistiqués tels que SPLEEN et TEXTO. Sur mini-ordinateur on dispose de MINISIS, MILOR et JLB-Doc. Leurs caractéristiques et, partant, leurs fonctionnalités sont notablement différentes. Il n'est qu'à considérer leurs tarifs qui varient de 25 KF (MEMO) à 113 K$ (BASIS).
En ce qui concerne les logiciels de recherche documentaire sur petits systèmes, la réalité est beaucoup plus difficile à appréhender dans la mesure où, beaucoup plus que dans le cas des gros et des moyens systèmes, le concept de « recherche documentaire » se voit doter d'un flou généralement inversement proportionnel aux performances du matériel support. Ainsi on a pu voir fleurir dans la presse des affirmations à la limite de la sanction par le « Bureau de vérification de la publicité » (BVP), du style : « Accédez à votre documentation de 20 000 fiches en quelques secondes à l'aide de votre ordinateur personnel ».
S'attacher à recenser les progiciels de recherche documentaire sur micro-ordinateur a consisté tout d'abord à essayer de mettre un peu d'ordre parmi tous les produits se réclamant de cette catégorie, mais un autre aspect de la question s'est rapidement révélé sinon primordial, du moins lié d'une manière incontournable au problème précédent, c'est celui de la définition précise de ce qu'est un micro-ordinateur.
Pour notre part, nous avons retenu tout matériel n'entrant pas dans la classification habituelle des minis et des gros systèmes mais possédant au moins des disquettes souples en périphérique. Un autre critère, certes plus polémique, mais qui n'est pas loin de cerner la même gamme de matériel, aurait été de ne retenir que les produits à technologie de circuits intégrés pour lesquels le service après-vente est peu ou pas du tout efficace. Il est vrai que dans ce domaine la situation commence à évoluer favorablement.
Nous avons donc inclus des matériels dont les tarifs varient de 15 KF à 1 MF puisque, jusqu'à nouvelle partition des gammes de matériel, tous sont réunis sous l'appellation de micro-ordinateur. Parmi eux, certains possédaient uniquement un fonctionnement en mode Vidéotex, nous y ferons bien évidemment allusion en les englobant dans cette étude.
Résultats préliminaires
***33 logiciels en course
Un premier tri qui s'impose de lui-même est de ne retenir que les systèmes qui sont réellement opérationnels à l'instant de cette étude, qui s'est déroulée de décembre 1982 à juin 1983 et d'éliminer, provisoirement pour certains d'entre eux, les autres.
Il est cependant intéressant de ventiler les produits non retenus suivant les raisons pour lesquelles ils se sont révélés inadéquats. On trouvera dans le tableau I la mise en correspondance des noms des systèmes, des SSCI * (ou laboratoires) et leurs coordonnées.
***12 logiciels ne passent pas le premier barrage
On peut les regrouper dans les 4 grandes catégories suivantes.
2 sociétés n'ont pas répondu à nos sollicitations
MULTICRITÈRES
Bien que MULTICRITÈRES soit vanté par une documentation sur papier glacé, il est apparu que R2E n'en avait pratiquement pas connaissance. Nous avons été aiguillés vers une SSCI (Acs St Cloud) qui eut beaucoup de peine à se souvenir qu'il s'agissait d'une commande d'un client dont les coordonnées promises n'ont jamais été fournies.
CRITÈRE II
Deux pages dans Documentaliste, une demie dans Documentation. On peut se demander pourquoi, puisqu'il n'a pas été possible de joindre les personnes concernées. Aucun résultat non plus à la suite d'une demande de documentation par l'intermédiaire de Minis et Micros.
3 progiciels ne sont pas opérationnels
GENTIANA
Si, en février 1982, était annoncée la sortie prochaine d'une version évoluée et même Vidéotex de GENTIANA dont étaient précisées les caractéristiques techniques et commerciales, il n'en est plus de même un an plus tard. Ce logiciel n'a jamais dépassé le stade expérimental : Basic interprété, donc très lent, et disquettes souples 5". Les difficultés rencontrées pour passer à la configuration supérieure n'ont pas été surmontées et ne le seront probablement pas puisque le projet semble en sommeil.
Documentation
L'édition 82-83 du guide des progiciels pour micro-ordinateurs du CXP annonce la disponibilité - pour 10 000 F, 2 journées de formation et assistance téléphonique comprise - d'un « système d'enregistrement de mots-clés et documents en vue de la recherche documentaire ». Après plusieurs tentatives téléphoniques se soldant par des réponses dilatoires, il fut finalement avoué que, les temps de recherche étant de l'ordre de 10 minutes, le système n'était pas au point.
KADOK/PASKADOC
L'annonce dans la presse devait être une erreur puisque la Société KA mit un terme à nos illusions le 30.12.82 : ce logiciel ne sera pas diffusé.
2 progiciels sont intéressants pour d'autres applications
CATHI
Bénéficiant de quatre pages dans Temps réel, du 20.09.82, CATHI (Consultation automatisée d'un thésaurus et information documentaire) avait retenu notre attention. Ce logiciel résulte d'un appel d'offres de la MIDIST et a été principalement financé par elle. Il a été réalisé avec la collaboration d'une Ssci (Cio) et du Gis Micro-informatique du CNRS de Grenoble et s'inspire du système CLAIRE de télématique communale mis en place par la municipalité de Grenoble.
Le système tourne sur Goupil-2 sous FLEX (ancienne version du système d'exploitation le plus répandu du Goupil-2 G2 FLEX2) et n'a pas été modifié depuis le printemps 82. Il n'est pas en mode Vidéotex mais prévu pour le devenir, c'est-à-dire que seules 40 colonnes sont utilisées sur les 80 de l'écran. Tout développement est à l'heure actuelle arrêté.
De par sa logique, ce système est difficilement utilisable en recherche documentaire : pas de définition possible de la structure de la notice, pas de troncature, pas d'édition de la base... Par contre, il est certainement très utile à la mairie de Grenoble où il est implanté, dans la mesure où on ne lui demande que l'affichage de fiches de renseignements administratifs. Il gagnerait cependant à être transposé dans un langage performant, sur Goupil-3 par exemple.
ALED
Nous n'avons pas demandé de démonstration de ce système qui concerne spécifiquement le secteur médical. Il possède la particularité de traiter le contenu même des fiches stockées dans la base, en fait des dossiers. Outre les fonctions de sélection suivant un profil et de dénombrement de dossiers, il permet, et c'est son véritable intérêt, de mener des calculs statistiques : Sigma, a, p, var, cov,...
Son coût est de 10 000 F et il fonctionne sur Apple II.
5 annonces qui promettent
Ces logiciels ne sont pas encore totalement écrits ou déverminés (debuggués) mais l'approche retenue est un indicateur de leur intérêt potentiel. Ce sont :
. MICRO-DOC,
. CARMEN,
. JLB-DOC micro,
. MINIDOC,
. SOFIA.
Leur description détaillée sera effectuée dans le chapitre suivant.
L'étude proprement dite
Après ce premier tri, nous nous sommes donc retrouvés face à 33-12=21 logiciels. Nous avons rencontré leurs concepteurs ou, à défaut, leurs diffuseurs, et demandé une démonstration. A ce niveau, un certain nombre de remarques ayant valeur de généralité peuvent être formulées :
a) La terminologie a été un gros problème. Il a fallu tout d'abord effectuer une mise à niveau au sein de l'équipe chargée de l'étude. Ce premier handicap surmonté, le problème s'est à nouveau posé face à nos interlocuteurs provenant d'horizons divers. Nous avons été amenés à traiter aussi bien avec des commerciaux, plus habitués aux jeux vidéo qu'aux applications professionnelles, qu'avec des chimistes ayant appris le Basic pendant leurs loisirs, des spécialistes des SGBD * relationnels ou encore des documentalistes et bibliothécaires peu au fait de la réalité des contraintes informatiques. A titre d'exemple, il est remarquable de citer l'ambiguïté entourant le terme fichier lorsqu'il est prononcé en présence d'informaticiens et de documentalistes. Mais il en a été de même avec la notion de champ appelée aussi zone, rubrique,... de la troncature, des opérateurs logiques, de l'équation booléenne, de la confidentialité, etc.
b) C'est peut être le point le plus important car il laisse planer un doute sur les possibilités pour un logiciel de remplir les fonctionnalités annoncées : il s'agit, et l'on peut s'en étonner, de l'impossibilité quasi générale d'obtenir une démonstration sur une base bibliographique de taille sinon respectable du moins suffisante pour tenter une extrapolation relativement au fonctionnement en vraie grandeur. En effet, il n'a pas été rare qu'il n'y ait pas 50 notices dans la base. Dans les cas extrêmes, le démonstrateur se contentait de créer une seule notice et de passer rapidement à la partie recherche du logiciel pour afficher à l'écran, à la satisfaction générale, exactement la même notice que celle qui venait d'être créée. Cette pratique introduisait généralement un biais fâcheux dans l'idée que l'on pouvait se faire de ce produit.
Ces 21 systèmes prétendant à l'appellation de progiciel documentaire et restant encore en lice après la première sélection sont si différents qu'il a fallu tenter de les regrouper. Ce ne fut pas aisé car, suivant le critère d'évaluation adopté, on se retrouvait avec des listes différentes de produits.
La décision fut prise, dans un premier temps, de séparer de leurs homologues les logiciels destinés à des applications Vidéotex. Ensuite nous avons distingué, au sein de ce sous-groupe, les systèmes qui peuvent « raisonnablement » être qualifiés de documentaires - à l'aide de critères ci-après définis -des autres produits, qui répondent plutôt aux besoins des hobbystes.
Un développement particulier sera réservé aux systèmes développés autour d'un SGBD relationnel dans la mesure où le champ de leurs possibilités est un sur-ensemble des systèmes documentaires classiques.
Les systèmes documentaires en Vidéotex
Nous avons contacté 6 sociétés annonçant l'existence ou la sortie prochaine de logiciels documentaires en Vidéotex *. Les systèmes concernés ainsi que les noms des sociétés qui les diffusent et les matériels qui les supportent se trouvent dans le tableau qui suit ("Systèmes concernés et sociétés qui les diffusent").
Une constatation s'impose d'emblée : pour la majorité de ces logiciels, leurs performances documentaires ne leur permettent pas, ou ne leur permettront pas pour ceux qui sont seulement annoncés, d'être directement compétitifs avec leurs homologues en informatique classique, ce qui ne signifie pas qu'ils ne puissent pas être mis en œuvre pour d'autres applications. Le système le plus prometteur actuellement semble être celui de la société CTL.
Une autre caractéristique générale est que, le plus souvent, la réalisation n'est pas encore totalement achevée. C'est bien sûr le cas du système qui est annoncé par TELMI, puisque le matériel n'est pas encore disponible, mais il en est de même pour les systèmes sur GOUPIL 3.
Les systèmes documentaires en informatique classique
Nous avons choisi de regrouper ces 15 progiciels en deux grandes classes :
a) les systèmes non documentaires
b) les systèmes documentaires (avec ou sans SGBD, relationnel * ou non).
Les contraintes discriminantes
Les critères retenus pour appartenir au groupe des systèmes documentaires sont les suivants et doivent de préférence être réunis simultanément :
* Le système autorise la gestion d'au moins 5 Moctets d'informations soit 4 000 notices de 1000 caractères par exemple (en tenant compte de la place occupée par le système). Actuellement ceci exige que le périphérique soit un disque dur et non des disquettes souples.
* Le langage de programmation est compilé et non interprété (Basic, Pascal,...) avec des routines en assembleur pour les fonctions les plus critiques. On note en effet des vitesses d'exécution, en nombre d'instructions par seconde, qui varient dans un rapport de 20, 30 ou même 50 suivant que le programme est écrit en Basic interprété ou en assembleur.
* Les temps de réponse sont très inférieurs à 1 minute pour une recherche de complexité moyenne mettant en oeuvre plusieurs critères.
* La recherche s'effectue sur des champs spécifiques, si désiré.
* La structure interne de gestion des données met en jeu au minimum des fichiers inversés - au mieux un véritable SGBD -c'est-à-dire qu'une technique consistant à rechercher une chaîne de caractères dans une chaîne de caractères par balayage séquentiel de tout le fichier est exclue.
* La structure des notices est paramétrable par l'utilisateur.
* Les mots-clés sont organisés en lexique.
* Il est possible d'affiner la recherche.
Les critères préférentiels
A toutes ces contraintes discriminantes, il est souhaitable d'adjoindre les critères préférentiels tels que :
* portabilité : quel système d'exploitation (OS), quel microprocesseur,
* existence d'un thésaurus : synonymie, hiérarchie, voisinage,
* contrôle de la saisie des informations : analyse syntaxique et au mieux sémantique,
* version en français : messages d'erreur...,
* documentation claire et complète si possible en français,
* module de télétransmission : en entrée comme en sortie. Interrogation de banques de données distantes, intégration d'un fonds déjà constitué,
* existence d'une structure commerciale assurant le suivi du logiciel,
* gestion de plusieurs bases,
* recherche sur texte.
Résultats
Systèmes non documentaires
Ce sont les systèmes qui, à notre avis, ne méritent pas, tout du moins dans l'état actuel de leur développement, l'appellation de progiciel de recherche documentaire en tant qu'ils ne répondent pas aux critères définis au paragraphe précédent. Ceux-ci, au nombre de 4, sont les suivants :
TE-80
PFS
AUTODOC
ADDOC
Il est à noter que le logiciel Dico, souvent évoqué dans la presse, n'est pas mentionné dans cette étude mais trouverait sa place dans cette liste. Son absence résulte de l'impossibilité de se le voir démontrer, bien que rendez-vous ait été pris dans ce but : le vendeur s'est refusé à nous présenter autre chose que PFS.
Cela dit, les informations que nous avons pu recueillir concordent pour affirmer que Dico est encore moins performant que PFS, tout en possédant des caractéristiques semblables. On trouvera dans le tableau II une présentation détaillée de ces 4 logiciels.
- TE-80
Le plus simple à évaluer car, en réalité, il n'existe pas ; la démonstration a été effectuée à la DBMIST, sur une série de divers modules sans aucun lien autre que potentiel entre eux. De plus le lancement du système faisait apparaître la date du 17 novembre 1981 comme dernière version. Il nous a d'ailleurs été confirmé qu'aucune modification ni développement n'a été effectué depuis.
Ce programme est cependant vendu - et cher, 15 à 20 KF - ce qui laisse supposer un délai certain entre la commande et la mise en service, puisqu'en réalité il faut le construire. Par ailleurs, même opérationnel, ses fonctionnalités seraient très médiocres : Basic interprété, opérateur et seulement, pas de troncature, pas de modification automatique du lexique,...
Notons enfin la confusion, faite dans sa présentation et reprise par 01 Hebdo, entre temps d'accès à une piste (200 ms) et temps moyen de réponse à une question booléenne (quelques minutes ?) ce qui n'est, on le voit, pas du tout la même chose.
- PFS
Il s'agit du système qui nous a été présenté à la place de Dico. Il est parfaitement représentatif des logiciels qui ne pourront jamais fonctionner avec des disquettes de plus grande capacité que les 5" car le temps de recherche annoncé est d'environ 2 minutes pour 500 fiches et résulte de la technique d'exploration mise en œuvre : balayage séquentiel et comparaison d'une chaîne de caractères avec d'autres chaînes de caractères. Cependant, il peut convenir pour une utilisation personnelle car son coût, environ 1 300 F HT, est très raisonnable et il se montre relativement souple en autorisant la définition de la structure de la notice, ainsi que les troncatures à gauche et à droite (conséquence de la technique exploratoire utilisée).
Une étrangeté à signaler : le nombre de notices répondant à la question posée n'est affiché qu'une fois leur visualisation réalisée.
- AUTODOC
De même conception que le précédent (balayage séquentiel, Basic interprété), AUTODOC semble un peu plus intéressant car il organise les mots-clés en lexique (qui occupe 17 K au total en mémoire centrale) et permet d'utiliser les opérateurs booléens et, ou et sauf. Affiner la recherche est aussi possible mais seulement si l'opérateur sauf n'a pas été utilisé. La structure de la notice est définissable. Le branchement sur le lexique s'effectue à tout instant. Un processus de sauvegarde des données permet de retrouver des informations effacées par mégarde.
Du côté des aspects négatifs, on relève sa gestion par ligne qui a pour conséquence que toute ligne entamée occupe 72 caractères. Ainsi la configuration basse du micro-ordinateur LOGABAX LX 515, qui nous a entre autres été proposée, (disquettes 5" de capacité 90 Ko) permet de gérer seulement 50 notices de 25 lignes... Dans ce cas un fichier carton ferait aussi bien l'affaire.
La plus grosse configuration en disquette (764 Ko) atteint péniblement 400 notices de 25 lignes. Il est vrai que les informations peuvent être mises bout à bout mais elles deviennent alors difficilement lisibles.
- ADDOC
Le plus intéressant. Il est déjà opérationnel depuis plus d'un an à la bibliothèque universitaire de Perpignan, secteur énergie, et sera certainement implanté à la bibliothèque de l'UER de psychologie de Toulouse. Il possède l'intérêt d'organiser les mots clés en thésaurus. L'interrogation utilise les 3 opérateurs booléens et accepte le parenthésage mais non la troncature. Accessoirement, il traite les cas de polysémie. Les questions peuvent être affinées et les éditions papier cataloguées.
Malheureusement, le système de recherche est assez primitif et ne met pas en oeuvre de SGBD. L'interrogation est uniquement possible sur le champ des mots-clés et la notice ne peut être affichée totalement à l'écran : il faut demander une édition papier.
Ses concepteurs sont conscients de ces défauts et envisagent d'y remédier dans une version ultérieure à laquelle ils pensent adjoindre une « couche ergonomique » mais sa réalisation n'est qu'à peine ébauchée et demandera certainement une assez longue mise au point. C'est néanmoins un logiciel à ne pas perdre de vue.
Les systèmes documentaires
Nous parvenons enfin au coeur de cette étude dont l'objectif est de cerner précisément l'ensemble des systèmes documentaires opérationnels en juin 83, même si, nous l'avons vu, il ne faut pas se désintéresser de tous les projets en gestation.
Ces logiciels sont au nombre de 11 ; ce sont :
VALSE
BIBLIO 8 000
SAF
FB 02
SANS NOM
GESTION DOCUMENTAIRE
DIDEROT
GESTDOC
MIKRODOC
SUPERDOC
MICRO-QUESTEL (ex-TAMIL)
Leur description détaillée se trouve dans le tableau Il situé à la fin de cette étude. Un commentaire a été effectué pour chacun d'eux dans les pages qui suivent.
VALSE
Il a été conçu par Hélène Desvals et Gilbert Mathieu au Laboratoire de thermodynamique et de micro-calorimétrie (CNRS) de Marseille, et écrit en Basic.
Fonctionnant sur Northstar Horizon, ce système est destiné à gérer une documentation de chercheur. Il fonctionne exclusivement sur des disquettes 5", et trouve ses limites dans celles du support : pour accéder à l'information désirée, il faut passer en revue les disquettes les unes après les autres.
Néanmoins la notice est structurée de telle sorte que cette recherche soit accélérée ; certaines informations sont enregistrées sous forme codée en tête de chaque enregistrement. La recherche s'effectue par accès direct sur cette partie codée. Cependant la recherche documentaire véritable s'effectue séquentiellement par un procédé de recherche d'une chaîne de caractère dans une autre, VALSE ne possédant pas de fichiers inverses. Ce procédé autorise la troncature droite et gauche.
Un premier fichier de réponses (150 maximum) est constitué, à partir duquel on peut alors utiliser les opérateurs et, ou, sauf. En aucun cas il n'est possible de combiner ce fichier avec le reste de la base. 13 champs sont interrogeables, mais il faut remarquer l'absence de lexique (et a fortiori de thésaurus). Une vaste liste de procédures cataloguées d'édition sont utilisées et appréciées par les chercheurs du laboratoire pour imprimer par exemple des demandes de prêt-inter et de photocopies au CNRS ou des listes de références bibliographiques au niveau chercheur ou laboratoire.
Du point de vue de l'organisation des données, les notices sont composées d'un nombre variable d'enregistrements de longueur fixe (76 caractères) : toute ligne commencée occupe donc 76 caractères.
Il est possible de saisir les données communes à plusieurs notices. Gain de temps appréciable, puisqu'il ne reste plus qu'à entrer les données spécifiques à chacune.
En résumé, la longueur de la recherche, due au procédé retenu, le maniement obligatoire de plusieurs disquettes, l'absence de lexique, la combinaison de questions limitée au sous fichier de la première réponse (soit 150 documents) sont autant de handicaps d'un système qui a cependant le mérite d'exister et d'être utilisé. A noter que la commercialisation d'une version mettant en oeuvre un fichier inverse et un disque dur est à l'étude.
TELEVALSE est un complément intéressant de VALSE. Il permet d'interroger des bases de données extérieures et de réintroduire les données ainsi obtenues dans les fichiers de VALSE.
BIBLIO 8000
Comme le logiciel précédent, il a été pensé pour gérer la bibliographie d'un groupe de chercheurs.
Conçu par Roland Salesse (INRA, Orsay), BIBLIO 8000 fonctionne sur un Commodore 8001, et utilise des disquettes 5".
Le programme est écrit en Basic compilé et en assembleur, les données essentielles sont stockées sur une seule disquette. Cela permet une recherche rapide, le système indiquant, lors de la réponse, sur quelle(s) disquette(s) se trouve l'intégralité des informations correspondant aux références ainsi obtenues.
L'utilisateur définit lui-même la capacité de son fichier : pour 10 mots-clés, on pourra gérer de 5 à 6 000 fiches ; pour 25 mots-clés de 3 à 4 000.
Le programme de recherche permet la combinaison des questions par et, ou, sauf, et autorise la reprise de l'étape précédente. Les opérateurs (>,<,=) sont prévus sur les champs numériques (date par exemple).
De nombreuses éditions, soit obtenues par des procédures cataloguées, soit définies par l'utilisateur, sont prévues.
De même que pour VALSE, l'inconvénient majeur vient du type de support utilisé. Même si le système indique quelle disquette renferme l'information, il sera fastidieux d'avoir à manipuler plusieurs disquettes pour une question amenant un grand choix de références. Autre inconvénient de BIBLIO 8000 : l'interrogation ne se fait que sur les trois premiers auteurs seulement (dans le champ auteur).
Notons d'autre part l'absence de mot de passe, contrebalancée par l'utilisation d'une clef sans laquelle le micro-ordinateur ne se met pas en route.
Remarquons aussi certains aspects agréables du logiciel pour un utilisateur le connaissant bien : réponse anticipée (9 caractères tampons), noms de revues codés et décodés par le système.
La version 2 de BIBLIO 8000 est en cours d'écriture, et tentera de rendre compatible le système avec d'autres types de matériel. Elle utilisera un disque dur, et prévoit d'interroger les bases de données extérieures pour intégrer les données obtenues dans les fichiers de BIBLIO 8000. Roland Salesse est en contact pour la diffusion avec AIO (Ssci).
SAF
Logiciel documentaire produit par la CEGI, SAF fonctionne sur Dynabyte avec des disquettes 8" ou disque dur de 5 Mo et plus. Il est écrit en PASCAL Z et en assembleur.
Il n'y a pas à proprement parler de notice structurée : seuls le titre et le corps du document composent la notice. L'utilisateur ne peut pas paramétrer cette structure.
Pendant la saisie qui s'effectue à l'aide du logiciel de traitement de texte WORDSTAR, un lexique est automatiquement créé en liaison avec un dictionnaire de mots vides. Il est possible de visualiser le lexique, mais cependant pas de l'éditer.
La recherche se fait sur les mots de tout le document, avec combinaison par et, ou, sauf, sans parenthésage. La synonymie est prise en compte lors de l'interrogation, un mot pouvant renvoyer automatiquement à son synonyme.
SAF prend en compte la troncature gauche et droite, et le caractère de masque.
Notons qu'il est possible de reprendre une étape précédente, mais pas de la combiner avec une autre. Une commande historique est disponible.
L'édition des documents répondant à une question posée se fait suivant leur ordre d'apparition à l'écran, aucun choix n'est possible.
Aucune confidentialité d'accès n'a été définie. SAF annonce qu'il peut gérer jusqu'à 16 bases différentes, et environ 16 000 documents de 500 caractères sur un disque dur de 10 Mo.
La version prochaine sera écrite en PASCAL MT+ et assembleur sous CP/M. On disposera alors d'un intéressant système de recherche de textes tels que rapports, études, catalogues,...
FB 02
Développé par Francis Brioist (Société d'informatique et de formation en gestion) FB 02 fonctionne sur un matériel multiposte MATRA MBC Alcyane, qui peut s'intégrer dans un réseau en étoile. Ce logiciel écrit en Basic utilise un disque dur amovible de 2 x 10 Mo.
La notice est structurée en 5 champs : rubrique, mots-clés, références, commentaire, date.
L'interrogation se fait par champs, par l'intermédiaire d'une grille : le système propose les champs l'un après l'autre, il reste à l'utilisateur à les compléter ou non avant de lancer sa recherche. Ces champs sont implicitement liés par la condition et. Les mots-clés peuvent être combinés par groupes de trois, 5 groupes pouvant être combinés. Cependant ce procédé ne peut s'appliquer aux mots du champ rubrique, qui contient, lui aussi, le contenu du document, d'une façon beaucoup plus générale.
La visualisation se fait automatiquement dès qu'une référence est trouvée en réponse à la demande. Il est tout à fait dommage qu'il ne soit possible que de les compter ou de les visualiser. Faire l'un puis l'autre serait beaucoup plus utile.
La reprise des étapes antérieures n'est pas possible.
FB 02 dispose d'un lexique, mais qui n'est ni éditable, ni visualisable. Cependant, ce lexique s'oriente assez fortement vers une notion de thésaurus à 2 niveaux, car les mots-clés appartiennent à une rubrique qui est, en fait, constituée de mots-clés génériques, représentant le domaine d'un ensemble de documents. Cette notion de rubrique permet de définir une sorte de partition de la base.
La suppression des notices peut se faire automatiquement par la date de péremption. Aucune sécurité d'accès n'est actuellement prévue sur ce système.
FB 02 dispose également d'un programme de rapport d'exploitation.
SANS NOM
Développé par M. Consigny à l'IFPSES de Reims, ce logiciel qui n'a pas encore été nommé, fonctionne actuellement sur un micro-ordinateur Alpha Micro System, avec un disque dur de 90 Mo. Il est écrit en Basic et en assembleur.
La notice, paramétrable à la génération du système, est à l'heure actuelle composée d'environ 500 caractères et de 4 champs. La saisie des informations est simple (il suffit de remplir un masque de saisie). L'introduction dans la base des données nouvelles se fait en différé.
Un lexique est constitué au moment de la saisie, avec contrôle de l'existence préalable et introduction éventuelle de mots nouveaux sur ordre de l'utilisateur.
L'interrogation se fait sur 3 champs, que l'on peut combiner entre eux par et, les termes de chaque champ pouvant être combinés par et, ou, sauf.
Le système fournit le nombre de documents répondant à la question. On peut ensuite visualiser les champs titre et auteur, puis choisir de visualiser les notices complètes, ou certaines d'entre elles seulement.
Pas de fonction « historique » disponible, mais il est possible de reprendre l'étape précédente.
On regrettera l'absence de troncature et il faudra attendre la version 2, prévue en septembre, pour voir tous les modules liés entre eux.
Une interrogation à distance est prévue par liaison modem.
GESTION DOCUMENTAIRE
Le logiciel développé par Alpha Micro System est construit autour du logiciel de base ANDI et fonctionne sur les micro-ordinateurs Alpha Micro Multipostes (16 bits), avec un disque dur de 5 Mo ou plus. Il est écrit en Basic semi-compilé et en assembleur.
La structure de la notice n'est pas paramétrable par l'utilisateur, mais peut être redéfinie à la génération du système, pour chaque application, par le producteur. Elle se compose dans la version actuelle d'un numéro de référence, d'un champ auteur, d'un champ titre, d'un champ mots-clés. La taille de ce dernier champ ne doit pas dépasser 256 caractères, ce qui autorise environ 15 mots-clés de 20 caractères (3 caractères étant codés sur 2 octets). Enfin un texte libre de 1920 caractères peut être lié à ces champs.
L'interrogation permet de combiner 16 critères par et, ou, sauf. La recherche peut se faire sur plusieurs champs simultanément, l'utilisateur étant guidé tout au long de la session par l'apparition des commandes disponibles, en bas de l'écran. La recherche sur le résumé se fait par une procédure de recherche d'une chaîne de caractères dans une autre, processus plus long que le premier.
Le système gère un lexique.
On visualise les réponses l'une après l'autre, il n'y a pas de choix possible pour l'accès à une réponse précise (la énième).
La structure de la notice, assez incomplète, est un des points négatifs de ce système, qui n'a malheureusement pas été travaillé depuis sa conception, et qui est donc « au point mort ».
Par contre le disque dur autorise la gestion d'une base pouvant aller jusqu'à 65 500 enregistrements, et l'outil de recherche semble assez rapide.
Notons également la confidentialité, très au point, et pouvant intervenir jusqu'au niveau du champ.
DIDEROT
Conçu par la Société Polyphot pour fonctionner sur Goupil 2 et des disquettes 5" ou 8", DIDEROT est un logiciel plus tourné, aux dires même de M. Kendall, directeur de Polyphot, vers la gestion de bibliothèque que vers la recherche documentaire.
La structure de la notice (500 caractères) n'est pas paramétrable par l'utilisateur, mais se rapproche d'une notice bibliographique habituelle. 19 champs au maximum la composent, tous pouvant être inversés.
A l'interrogation, seuls 2 critères peuvent être combinés simultanément par et, ou, sauf, la troncature n'étant pas prévue dans la version standard. Les reprises d'étapes ne sont pas possibles. Les réponses sont obligatoirement visualisées l'une après l'autre, sans choix possible.
DIDEROT ne gère pas de thésaurus, seulement un lexique éditable (mentionnant la fréquence d'apparition de chaque terme) mais non accessible en ligne.
Quelques éditions sont prévues, par des procédures cataloguées.
Il est nécessaire de noter ici la lenteur de ce logiciel lors de la saisie : Polyphot annonce 40 mn pour la création des liens d'insertion de 30 notices dans la base. Bien entendu, comme le dit M. Kendall, on peut faire autre chose pendant ce temps là... A l'interrogation on a pu constater un temps de réponse de 30 secondes pour une combinaison de deux critères dans le même champ, pour une base de 30 notices, ce qui augure assez mal des performances que l'on obtiendra avec une question plus complexe sur une base importante.
Polyphot annonce la préparation d'un logiciel documentaire sur Goupil 3.
GESTDOC
Produit par la Société DATATRAME, GESTDOC fonctionne sur un micro-ordinateur 8 bits ITT 3030, avec des disquettes 5", ou un disque dur de 5 Mo et utilise le SGBD dBase II.
La structure de la notice est paramétrable par l'utilisateur qui choisit les champs qui serviront d'index (32 champs au maximum dont 16 maximum pour l'index).
La recherche s'effectue implicitement sur les mots-clés que l'on peut combiner par et, ou, sauf. La troncature n'est pas prévue, mais seuls les premiers caractères suffisent. Lorsqu'il y a ambiguïté, le premier mot-clé correspondant est choisi, sans que l'utilisateur ait son mot à dire.
Il est possible d'étendre la recherche à tous les champs, de les combiner par et, ou, saufet d'utiliser les opérateurs numériques (>, <, =).
Le nombre de documents répondant à la question est fourni par le système. L'utilisateur peut reprendre l'étape précédente, avec une combinaison implicite par et. La visualisation est séquentielle et non triée.
GESTDOC utilise un lexique, créé a priori par l'utilisateur. Lors de la saisie, l'existence dans le lexique des mots-clés employés est contrôlée. Les possibilités d'édition sont nombreuses, bien que ne permettant pas le choix de la mise en page, ni le choix des documents édités.
L'interrogation des bases de données extérieures et l'introduction des documents recueillis dans les fichiers de l'utilisateur, annoncées par la brochure publicitaire, n'ont pas pu nous être présentées.
MIKRODOC
Le système développé par la Société MiKRO-CERID fonctionne sur Micral 80 avec disquettes 5" ou disque dur 5 Mo. Il a été écrit en Basic et s'appuie sur le SGBD Cardbox. Il peut gérer plusieurs bases indépendantes.
Paramétrable par l'utilisateur, la notice comporte 24 champs maximum. L'inversion des mots se fait automatiquement et constitue un lexique par zone. L'absence d'un dictionnaire des mots vides est fort regrettable lorsque cette technique est adoptée, même si le lexique est, comme ici, réorganisé automatiquement après les mises à jour. Le lexique est visualisable lors de la saisie.
La recherche se fait uniterme par uniterme, sans blanc ni caractères tels que l'apostrophe, le trait d'union... (ce qui est assez gênant). Troncature et masque permettent une souplesse relative, et il est possible de reprendre l'étape immédiatement précédente.
Pour affiner une recherche, on peut mettre en oeuvre une procédure de recherche sur texte.
Une fonction « historique » est disponible. Le format (ordre, longueur de ligne) de visualisation est également paramétrable par l'utilisateur.
Tout au long de la session l'utilisateur est guidé par le rappel des commandes disponibles, en bas de l'écran.
Ce logiciel assez facile d'emploi présente cependant le défaut d'afficher systématiquement le premier enregistrement lors de la mise en fonction du système, ce qui est totalement inutile. D'autre part les messages devront être traduits en français.
SUPERDOC
Fonctionne sur Micromachine 2000 (SYMAG) chez Thermodata (Grenoble) où il a été développé. Écrit en PL 1, ce logiciel utilise des disquettes 8" ou un disque dur de 10 Mo.
La structure de la notice est paramétrable par l'utilisateur, avec une grande souplesse (nombre et longueur des champs). Un éditeur permet une correction facile.
La version de ce logiciel utilisée lors de la démonstration n'autorisait l'interrogation que par les seuls descripteurs de la notice. Dans le cas où plusieurs champs sont inversés, un seul lexique est créé. Par conséquent, mis à part le cas où un seul champ est inversé, il n'est pas possible de préciser sur quelle rubrique porte l'interrogation, ce qui est regrettable. Certes, il est toujours possible d'affiner le fichier de réponses par une recherche sur texte, mais la lenteur de cette procédure est bien connue.
A tout moment l'utilisateur est guidé par une ligne de rappel des commandes disponibles en bas de l'écran. Point positif de SUPERDOC : une véritable équation booléenne lors de la recherche, avec combinaison parenthésée (10 niveaux) des opérateurs et, ou, sauf.
Il est possible de faire une visualisation sélective des réponses.
La reprise de l'étape immédiatement précédente est possible, et on peut alors la combiner avec le reste de la base. Le lexique géré par le système est créé lors de la saisie, mais n'est interrogeable qu'en dehors de la saisie. Il est éditable.
A l'édition on peut choisir les champs édités. La mise en page des éditions est paramétrable. Il est possible de trier les réponses selon un critère prédéfini (par l'utilisateur).
Il est prévu d'adjoindre à SUPERDOC une procédure de récupération d'informations après interrogation de bases de données extérieures.
Malgré l'aspect ergonomique du logiciel (facilité d'usage par l'utilisateur novice), SuPERDOC présente un caractère inachevé qui enlève un peu à l'intérêt que l'on peut y trouver (pas de troncatures, pas d'interrogation sur des champs différents, pas d'opérateurs numériques...). D'autre part SUPERDOC fonctionne actuellement avec des mots-clés composés de symboles chimiques, laissant peu de place à l'ambiguïté. La procédure de H-coding utilisée (sur trois caractères) risque d'amener des collisions difficiles à résoudre avec l'emploi de mots véritables.
Il s'agit néanmoins d'un des meilleurs outils de recherche documentaire sur micro-ordinateur actuellement disponible pour quiconque ne dispose pas d'un financement supérieur à 100 KF.
MICRO-QUESTEL (EX-TAMIL)
Il a été conçu et réalisé par Guy Demians, géologue de formation qui a passé une vingtaine d'années dans un service de documentation. Le logiciel écrit en Business Basic fonctionne sur ONYX (16 bits) avec un disque dur de 20 Mo.
Entièrement paramétrable par l'utilisateur, MICRO-QUESTEL semble pouvoir répondre à des besoins variés. Il gère 4 bases et permet 8 accès simultanés. Un code d'accès assure la confidentialité.
La recherche s'effectue selon un mode très proche du logiciel de recherche documentaire QUESTEL, et permet l'interrogation par mots-clés, sur champs différents, par une véritable équation booléenne et, ou, sauf (parenthésage à 5 niveaux). Les opérateurs numériques ( > , <, = ) et la troncature sont également utilisables. En cas de troncature, la partie du lexique correspondante s'affiche, sans qu'il y ait cependant de choix possible parmi les termes affichés. Les opérateurs de proximité, l'aide en ligne et la reprise d'étape sont également disponibles.
Un lexique est créé lors de la saisie. Il est visualisable et il est alors possible de sélectionner un ou plusieurs des termes visualisés. Toutes les éditions souhaitables sont possibles.
Très complet, ce logiciel a néanmoins le défaut de ne pas disposer de gestion de thésaurus, défaut important pour un logiciel de cette qualité générale et de ce prix (deuxième défaut) : 100 000 F pour le logiciel complet (un fractionnement par module est possible).
Un protocole de diffusion signé à la mi-juin en confère l'exclusivité de la distribution à
Télésystèmes qui envisage une version Vidéotex.
Comparaison de ces logiciels
Celle-ci s'avère difficile car selon que l'on s'attache à un critère de choix ou à un autre, on obtient des groupes différents de logiciels. L'idéal serait qu'un même logiciel se trouve dans le maximum de groupes. Tentons quelques rapprochements.
a) thésaurus
Aucun des 11 ne possède de gestion de thésaurus, bien que la plupart de leurs concepteurs en reconnaissent l'utilité. Seul FB 02 introduit la notion de hiérarchie. Dans le groupe des non documentaires, ADDOC fait preuve d'originalité avec un vrai thésaurus.
b) notices structurées à la demande
C'est le cas de
GESTDOC
SUPERDOC
MIKRODOC
MICRO-QUESTEL
c) à noyau SGBD
GESTION DOCUMENTAIRE
GESTDOC
MIKRODOC
d) avec un module de télécommunication VALSE
e) plusieurs bases en ligne
GESTION DOCUMENTAIRE
SAF
GESTDOC
SUPERDOC
MICRO-QUESTEL
f) possibilité d'affiner la recherche
VALSE
BIBLIO 8000
SANS NOM
GESTION DOCUMENTAIRE
SAF
GESTDOC
SUPERDOC
MIKRODOC
MICRO-QUESTEL
g) interrogation sur plusieurs champs
Impossible avec BIBLIO 8000
SAF
SUPERDOC
h) recherche sur texte
VALSE
SAF
FB 02
MIKRODOC
GESTDOC
SUPERDOC
MICRO-QUESTEL
Au vu de ces différentes fonctionnalités, on peut tenter de regrouper ces logiciels en 3 types d'application. Ce ne sont pas des catégories étanches, il s'agit simplement d'indiquer comment on pourrait les employer au mieux.
1) gestion de la bibliographie de chercheurs VALSE
BIBLIO 8000
2) gestion de dossiers
SAF
FB 02
3) gestion de notices bibliographiques
* nécessitent un habillage spécifique complémentaire :
SANS NOM
GESTION DOCUMENTAIRE
* systèmes directement utilisables (par ordre croissant de préférence) :
DIDEROT
GESTDOC
MIKRODOC
SUPERDOC
* système haut de gamme :
MICRO-QUESTEL
Conclusion
3 enseignements sont à tirer de la comparaison que nous venons d'effectuer :
* le coût de chacun de ces logiciels est supérieur à 10 000 F, jusqu'à 100 000 F pour MICRO-QUESTEL,
* sauf rares exceptions, chaque logiciel est associé au matériel sur lequel il a été développé. La transposition sur un autre micro-ordinateur demandera toujours un certain travail de reconfiguration,
* il n'existe pas de logiciel possédant toutes les caractéristiques attendues d'un système documentaire sur micro-ordinateur, mais c'est techniquement réalisable.
Les systèmes prometteurs
Nous en avons recensé 5, mais ce dénombrement n'est certainement pas exhaustif car il est très probable que de nombreux systèmes sont en gestation aussi bien dans des lieux universitaires que chez des Ssci.
MICRO-DOC
Développé sur VICTOR (ex-SIRIUS) par la Société BURICOM MICRO-DOC sera la version actualisée et « redécoupée » de PIAFDOC déjà opérationnel sur IBM 360 et IRIS 80. Sa particularité sera de posséder, en plus des fonctions documentaires habituelles sur de plus gros systèmes, une fonction d'analyse linguistique.
Ce système effectuera une véritable analyse sémantique et syntaxique des données qui lui seront fournies. L'intérêt pratique en est par exemple en mode saisie :
- vérification de la saisie (notamment des résumés),
- normalisation des substantifs,
- homogénéisation du thésaurus ;
mais aussi en mode interrogation :
- question libre en langage naturel,
- question guidée (type multicritères implicite en vidéotex),
- question booléenne avec parenthésage, troncature, masque.
Il est de plus prévu :
* de traiter des champs « infographiques » c'est-à-dire possédant un alphabet ou des caractères particuliers, ex. : recherche d'un nabla (nabla;) dans un texte mathématique,
* mais aussi d'effectuer des calculs à l'intérieur des champs (type tableau).
La taille optimale de la base à gérer est prévue pour se situer entre 40 et 60 Mo. La partie linguistique est déjà opérationnelle, 2 ingénieurs INSA travaillent avec des documentalistes de chez ELF à la réalisation de tout le logiciel.
CARMEN
Bernard Gattegno est un membre de l'équipe SMT, mais il est aussi ingénieur conseil en micro-informatique et travaille pour son propre compte. C'est pourquoi il a l'intention de développer un logiciel documentaire sur Micromega dont il a déjà listé les fonctionnalités.
La non existence de la version diffusable de ce logiciel dont la réalisation est à peine ébauchée lui confère paradoxalement l'intérêt de bénéficier de l'expérience de ses concurrents en lui évitant de ne pas inclure certaines fonctionnalités très demandées.
JLB-DOC MICRO
Si l'on excepte l'absence (provisoire ?) de troncature, JLB-Doc est un bon logiciel documentaire pour mini-ordinateur. Sa transposition sur un micro-ordinateur serait très intéressante. A notre connaissance, celle-ci est envisagée par au moins 2 voies distinctes :
a) l'équipe Olivier-Laflèche elle-même qui en annonce une version simplifiée sur AXEL en assembleur 16 bits sous CP/M-86,
b) Honeywell lance un système compatible... Honeywell appelé Microsystem 6/10 (intégrable dans l'architecture DNA et DSA, raccordement X 25, compatible IBM Pc,...) et effectuerait la transposition de JLB-Doc.
MINIDOC
Nous arrivons avec ce logiciel dans les produits haut de gamme puisque le noyau de gestion des données sera un SGBD relationnel, qui existe déjà depuis décembre 1981 et se nomme Rébu.
La nouvelle version en cours, Rébu-I, est développée par l'équipe de Serge Miranda à l'Université des Sciences sociales de Toulouse. Rébu-I prendra en compte :
* la sécurité des données : confidentialité, intégrité, reprise sur panne, accès multi-utilisateurs,
* l'implantation d'un langage graphique ergonomique (LAGRIF) qui sera l'interface entre l'utilisateur non averti et le SGBD relationnel,
* la définition interactive du schéma relationnel,
* l'utilisation de fichiers de messages pour obtenir des versions multilingues,
* la définition d'un langage de manipulation interne dont les primitives peuvent être utilisées par des programmeurs d'application.
Actuellement sur Apple II, Rébu est en cours de transfert sur une nouvelle micromachine (SYMAG-IAPX 286) conjointement avec CAP-SOGETI (Rébu prévu pour la fin de l'année et MINIDOC début 84 pour des coûts respectifs d'environ 5 et 10 I<F), sur le bureau viseur de l'INRIA, et est envisagé sur le SM 90 (appel d'offres ADI),
Autour de Rébu sera développée une couche périphérique qui pourra être celle d'un logiciel documentaire : MINIDOC.
D'autres applications sont possibles, en particulier celles qui concernent les bases de données 3e génération relatives non seulement aux données factuelles mais aussi aux textes et aux images.
SOFIA
Il s'agit du second système à noyau SGBD relationnel. Mis au point par J. Le Maître du LisH Marseille, SOFIA est écrit en Basic et en assembleur sur micro-ordinateur ALPHA MICRO SYSTÈMES (AMS) ce qui ne va pas sans poser de problèmes de portabilité, donc de démonstration. C'est pourquoi la transposition va être effectuée sous CP/M-86 et installée sur un MICRAL 90/50.
Une première version d'un logiciel documentaire utilisant SOFIA est déjà réalisée et, c'est son avantage, est utilisée pour gérer un fond de 1 300 livres au LISH Marseille. 3 000 à 4 000 termes sont introduits dans ce qui n'est encore qu'un lexique mais qui deviendra bientôt un thésaurus. C'est, à terme, un véritable système de gestion de bibliothèque qui est envisagé.
Il est prévu que la prochaine version sera opérationnelle à la fin de l'année 1983.
Conclusion
L'évolution prévisible des systèmes
Les 8 bits contre les 16 bits
Il est indéniable que la tendance actuelle du marché est au développement de la production des microprocesseurs 16 bits, qui ont véritablement déferlé au COMDEX 82-OEM LAS VEGAS, dont les 2 plus fameux représentants sont le 8086 d'INTEL et le 68000 de MOTOROLA.
INTEL 8086
Le premier des 2 à être apparu sur le marché. 29 000 transistors sur 5,7 x 5,7 mm2, (il y en avait seulement 5 000 dans le 8080). Technologie HMOS. 1 Mo adressable en 16 x 64 Ko.
MOTOROLA 68000
Apparu 1 an après le précédent. 68 000 transistors, 16 bits externes mais 32 bits internes. C'est un pont entre les microprocesseurs 16 bits et les 32 bits. 4 Mo adressables. Extensibilité à 16 Mo.
Il en existe beaucoup d'autres, parmi lesquels il faut mentionner particulièrement le 8088 d'INTEL qui est un sous ensemble du 8086. 16 bits internes et 8 bits externes le placent intermédiairement entre les 8 et les 16 bits. Sa puissance est d'environ 70 % de celle du 8086.
Les microprocesseurs 16 bits semblent indiscutablement préférables aux 8 bits, tant pour la taille des données manipulables que la fréquence du cycle de base (5 ou 8 MHz contre généralement 2 MHz), ou encore l'éventail d'instructions de base. Cependant, et paradoxalement en raison de cette dernière caractéristique, les applications « tournent » quasi systématiquement plus vite avec un microprocesseur 8 bits qu'avec un microprocesseur 16 bits car la plupart des utilitaires (compilateurs,...) ou progiciels ont été tout simplement traduits à partir de leurs homologues 8 bits. Or l'on sait que si la bibliothèque de logiciels est particulièrement bien fournie en 8 bits sous CP/M, ce n'est absolument pas le cas en 16 bits. Ainsi il n'est pas rare que la vitesse en 16 bits soit 40 % de celle qui serait obtenue avec un 8 bits. Il est vrai que le temps contribuera à gommer cet écueil mais c'est une donnée qu'il faut avoir actuellement bien présente à l'esprit.
Les mémoires de masse
Nous avons vu que les systèmes documentaires devaient à l'heure actuelle pouvoir gérer des disques durs en périphérique. Ceci est dû à ce que les disques souples, ou floppy, n'autorisent pas des stockages suffisants soit environ 2,5 Mo pour un double lecteur 8" DF/DD alors que le plus petit des Winchester a une capacité de 5 Mo *.
Un problème se pose cependant en ce qui concerne la sauvegarde des données.
Aujourd'hui, le système le plus courant consiste à recopier le disque dur sur des disquettes 5", autrement dit on manipule à chaque fois une dizaine de disquettes avec tous les risques d'altération de l'information que cela suppose, sans tenir compte de la pénibilité de l'opération qui peut inhiber les utilisateurs.
On voit apparaître dès maintenant d'autres possibilités de sauvegarde. S'il est vrai qu'existent des « streamer» permettant de recopier sur bande magnétique des dizaines de millions d'octets, il faut reconnaître qu'ils sont encore très onéreux. Le transfert sur bande vidéo d'un magnétoscope classique, quelques dizaines de Mo aussi, tend à apparaître, mais malgré les redondances et autres contrôles de parité, la fiabilité de ce système semble mise en question. Plus intéressante par contre est l'apparition de disques durs amovibles tels que les Winchester de type SYSQUEST.
S'il est important pour les micro-ordinateurs de disposer de lecteurs de disquettes qui sont très bon marché, il est non moins indispensable, surtout dans une optique documentaire, que les mémoires de masse soient de taille convenable et que la sauvegarde, ou l'échange des données soit aussi « ergonomique » que possible.
Notons que pour des configurations hautes, on peut dès maintenant disposer de racks de disques 5" 1/4 atteignant 380 Mo (MAXTOR CORPORATION).
La zone de partage entre floppy et disque est actuellement bien délimitée en ce qui concerne leurs capacités. Ce ne sera plus vrai dans les années qui viennent, en raison principalement de la mise au point dans les laboratoires de techniques d'enregistrement (et corrélativement de lecture) perpendiculaire, ce qui se traduira rapidement par un accroissement, dans un facteur 20 environ, des densités d'enregistrement surfacique.
Si l'on en croit le Monde informatique, les périphériques qui seront monnaie courante dans 5 ans sur les petits systèmes sont : disquette 10 Mo, Micro-Winchester 100 ou 200 Mo, disque optique numérique partagé. Grâce à ces développements, conjugués à l'accroissement prévisible de puissance des microprocesseurs on voit bien l'intérêt que la recherche documentaire peut en tirer.
Les systèmes d'exploitation
* En système 8 bits, il est maintenant devenu parfaitement clair que CP/M est un standard de fait. Tous les micro-ordinateurs prévoient maintenant l'interface électronique réalisant la « compatibilité CP/M ». Créé il y a 10 ans, ce système d'exploitation en est à la version 3.0.
Quelques chiffres : 500 000 utilisateurs, installé sur 700 000 machines et 1 500 000 copies vendues (comprenant les versions successives). Ce n'est pas le meilleur, car par exemple, il ne possède pas de séquentiel indexé, mais c'est le plus répandu, donc celui qui autorise la meilleure portabilité théorique. Dans la réalité, il faudra toujours demander une démonstration sur le matériel présenté, car « fonctionner sous CP/M » n'est pas en soi une garantie en raison des nombreuses versions existant sur le marché et des différentes classes au sein de chaque version.
Son extension multipostes MP/M est conçue pour gérer 16 terminaux en simultané et 4 Go mais aucun utilisateur averti ne s'aviserait de connecter plus de 3 postes au même système s'il ne veut pas se voir confronté à une chute dramatique des performances.
La version réseau CP/Net a le mérite d'exister mais n'a pas semblé enthousiasmer le marché : nous n'avons rencontré personne ayant vu une application CP/Net opérationnelle.
* En 16 bits, par contre, la situation est beaucoup moins décantée. Parmi les sigles les plus importants et qu'il convient d'avoir déjà rencontrés, citons : CP/M-86, MSDOS, PROLOGUE, OASIS, UNIX, UCSD P-SYSTEM, OS9. La tendance se dessinant actuellement est la suivante :
a) UNIX en raison de ses performances, mais aussi de sa complexité, est réservé aux gros systèmes du type PLEXUS ou ONYX à microprocesseur 16/32 bits, ou encore aux futurs micro-ordinateurs 32 bits. C'est assez logique dans la mesure où il provient de la gamme des mini-ordinateurs de DEC (PDP-11...). Très bon système multi-utilisateurs, il nécessite la maîtrise du langage C. On trouve sur le marché beaucoup d'« UNIX-like » qui n'ont de commun avec UNIX que le sigle, ce qui interdit le plus souvent toute portabilité.
b) Pour les autres microprocesseurs 16 bits, la concurrence agit principalement entre CP/M-86 et MSDOS (avec un tout récent avantage pour ce dernier). Ainsi, à la foire de Hanovre 83 déjà citée, tous ou presque tous les nouveaux micro-ordinateurs 16 bits supportaient ces 2 systèmes d'exploitation.
Notons également le système PROLOGUE se distinguant par sa gestion du séquentiel indexé et son caractère multitâches (et multiutilisateurs pour juillet 83). Développé par la Société R2E pour sa gamme MICRAL, il est maintenant disponible sur IBM PC et VICTOR. Des émulateurs CP/M et MSDOS existent dans PROLOGUE.
Autres
On peut prévoir des développements dans beaucoup d'autres directions :
* les micro-ordinateurs seront de moins en moins bâtis autour d'un seul microprocesseur. Des tâches seront sous-traitées, par exemple : un Z 80 pour l'écran-clavier, un processeur graphique mais aussi un microprocesseur couplé à une antemémoire pour optimiser les accès disque, ce qui présente un attrait indéniable pour la recherche documentaire. C'est la voie ouverte vers la réalisation de véritables Machines Bases de Données.
* l'ergonomie sera améliorée :
. écran tactile,
. synthèse vocale,
. reconnaissance de la parole,
* les images auront droit de cité (en fait tout ce qui est numérisable) avec le disque optique numérique (DON).
L'évolution prévisible des logiciels documentaires
Directement liée aux performances des matériels et dans un contexte d'intérêt croissant pour la manipulation d'IST, cette évolution semble facile à prévoir ; ces logiciels devraient être promus à un bel avenir.
Il y a environ une année, il n'existait pratiquement pas, sur le marché, de logiciel de recherche documentaire sur micro-ordinateur. Rappelons que les 16 bits et les disques durs pour micro-ordinateur n'avaient pas encore pénétré le marché. Puis la situation a évolué, rapidement même, puisqu'est apparue une multitude de systèmes parmi lesquels nous avons vu qu'il fallait en éliminer bon nombre. Ce qui est important c'est de se rendre compte que maintenant recherche documentaire et micro-ordinateur sont des concepts qu'il est possible de mettre en rapport pour engendrer des outils performants. Ce travail reste encore à effectuer dans sa plus grande partie.
Nous avons en effet remarqué les 2 éléments suivants :
- les systèmes à fonctionnalités documentaires complètes étaient le fait d'une ou plusieurs personnes ayant un arriéré documentaire conséquent. En contrepartie, ces systèmes étaient souvent très pauvres du point de vue de la gestion interne des données ;
- inversement, des systèmes informatiques particulièrement astucieux, avec d'excellents temps de réponse, manquaient souvent de commandes de base qu'il n'aurait pas été du tout difficile de leur adjoindre.
En conséquence, on peut penser que les systèmes de recherche documentaire sur micro-ordinateur vont évoluer, et bien évoluer, en prenant en compte les notions de :
Portabilité : chacun est convaincu mais cela dépend, en particulier, de l'évolution des systèmes d'exploitation en 16 bits.
Ergonomie : aide en ligne (Sos, guide) dialogues et périphériques, plus user-friendly.
Télécommunication : il y a une très nette tendance, encouragée d'ailleurs par différents serveurs, à développer des outils d'interrogation des banques de données et d'intégration à sa propre base locale, des notices bibliographiques ainsi cernées.
Microserveur : la technique n'est plus un obstacle à l'interrogation à distance de son propre fonds.
Parmi toutes les Ssci citées dans ce rapport, n'apparaît jamais le nom de celles qui dominent le marché de la télématique. Il ne faudrait pas en conclure qu'elles se désintéressent de ce marché. Il semble, au contraire, qu'elles travaillent beaucoup sur ce type de progiciel, mais tout en préférant « attendre et voir » comment leurs homologues de taille moins conséquente répondront à la demande.