Histoires d'OPACs

Nicole Bellier

Béatrice Estéoule

La médiathèque de la Cité des sciences et de l'industrie a proposé, le 21 septembre dernier, une journée d'études sur les catalogues en ligne. Pour François Reiner, directeur de la médiathèque, le catalogue en ligne, qui concrétise les règles, méthodes et principes qui régissent les bibliothèques, est « la manifestation vers le public du fonctionnement intellectuel interne des bibliothèques ». L'interrogation multiplie l'usage du catalogue. Largement utilisé pour sa disponibilité, son attrait et son accessibilité via le minitel, le catalogue en ligne ne nécessite pas de pédagogie particulière, ni même de formation a priori et rend les utilisateurs de plus en plus exigeants.

Du système...

Un tour d'horizon des générations de systèmes Outre-Atlantique et Outre-Manche était d'abord proposé par Nathalie Mitev 1, enseignante au Département des sciences de l'information de la City University de Londres. En introduction, après avoir précisé qu'elle ne recommanderait aucun système, N. Mitev rappelait les différentes définitions d'un catalogue en ligne. Pour Charles R. Hildreth 2, il s'agit d'un catalogue traditionnel réalisé dans un média différent.

Pour Emily G. Fayen 3, « un catalogue en ligne fournit des accès en ligne à des enregistrements bibliographiques de tout le fonds de la bibliothèque, avec des points d'accès correspondant au moins à ceux du catalogue sur fiches »; elle considère également qu'« un véritable OPAC (Online public access catalog) doit fournir des accès sophistiqués à des « candides » et se substituer à l'utilisateur dans l'interprétation des diverses règles et pratiques qui régissent une bibliothèque ».

L'informatisation locale a donné la priorité aux systèmes de prêt conçus à partir d'un enregistrement bibliographique minimum. Le catalogage a été amélioré par la participation à des réseaux qui, de fait, ont imposé leur standard : les réseaux anglo-saxons s'appuient ainsi sur le format MARC et sur les règles AACR2. L'action conjuguée des standards et de la baisse croissante des coûts en matériel rend accessible l'informatisation locale de la recherche dans le catalogue. L'explosion actuelle des techniques - notamment celle du CD-ROM - favorisera l'introduction de ce nouveau service auprès du public.

Nathalie Mitev devait ensuite insister sur l'opposition qui existe entre la « philosophie » des OPACs et celle des systèmes traditionnels de recherche documentaire. L'OPAC vise un domaine de connaissance étendu (à savoir l'ensemble du fonds de la bibliothèque) ; il repose sur le format MARC, intègre les classifications, propose un nombre limité d'index ; interrogeable sans formation préalable, il est d'une utilisation facile et accessible à tous. Il se distingue d'un système de recherche traditionnel en ce qu'il ne propose pas d'accès au résumé ou à de multiples index, mais offre une facilité d'usage qui permet de se passer d'intermédiaires.

La présentation comparée des différentes générations d'OPACs permettait de comprendre l'évolution des systèmes. Dérivés des systèmes de prêt et de catalogage, les systèmes de première génération proposent un accès par phrase ou « clé », la précoordination, la recherche auteur/titre et le « butinage » alphabétique d'index. Les interfaces reposent sur des menus, des écrans tactiles et des questions-réponses. Les systèmes de seconde génération intègrent les techniques d'interrogation utilisées dans les systèmes commerciaux de recherche bibliographique en ligne : accès par mots, postcoordination, recherche par sujets, interface par langage de commande et opérateurs booléens. La troisième génération offre de nouveaux développements en associant catalogues et systèmes de recherche en ligne. Cette génération, que N. Mitev qualifie de « manquée », fait actuellement l'objet de travaux dans le domaine des sciences de l'information. Trois axes de recherche sont ainsi à l'étude aux États-Unis et en Grande-Bretagne : aides « mécaniques », aides à la formulation de recherche et aides sémantiques. Certaines perspectives semblent être particulièrement intéressantes ; on retiendra par exemple la pondération booléenne (qui consiste à donner un « poids » aux termes, avec l'idée que les mots les moins fréquents sont peut-être les plus pertinents), le feedback de l'utilisateur dans la formation d'équations booléennes (le système proposant de nouveaux termes à l'utilisateur, pour une éventuelle reformulation de sa recherche), et l'utilisation d'interfaces graphiques avec icônes.

A l'avenir, l'utilisateur exécutera sa recherche à partir d'un « terminal convergent », poste de travail connecté à de nombreux réseaux et permettant, grâce à un interface homme/machine très convivial, d'accéder à de nombreux services 4.

...à l'utilisateur

Micheline Hancock, bibliothécaire à la City University de Londres, a focalisé son intervention sur l'utilisateur de catalogues en ligne. Partant du principe qu'un OPAC doit être extensible et interactif, elle est aujourd'hui convaincue que « pour exploiter pleinement les potentialités de ce système, il faut partir de l'évaluation des besoins et des comportements de l'utilisateur ».

Pour mener une étude de ce type, il ne faut pas avoir peur d'examiner et réexaminer ce que l'on connaît déjà, et de définir des critères et des mesures. M. Hancock a ainsi longuement commenté trois études importantes menées dans les années 70 et portant sur l'utilisation des catalogues sur fiches aux États-Unis et en Grande-Bretagne 5. Ces études de base, menées de manière scientifique, ont permis de récolter des données quantitatives et de les exploiter statistiquement. Différentes observations peuvent ainsi être faites : l'observation de l'utilisateur est difficile, la consultation est un processus de recherche, la structure du catalogue influence le comportement de l'utilisateur, le comportement de l'utilisateur ne reflète pas nécessairement ses besoins.

Trois recherches font date dans le domaine des catalogues en ligne. La première 6, exploratoire, a étudié le comportement du lecteur devant le fichier traditionnel, ainsi que son attitude devant des catalogues en ligne : malgré les difficultés rencontrées, le lecteur préfère en général la recherche sur écran, même si elle ne donne pas accès à l'ensemble du fonds de la bibliothèque. Pour étudier l'accès par sujets, l'équipe n'a pas hésité à suivre le lecteur dans sa recherche, à le faire parler à haute voix et à l'enregistrer sur bande magnétique. La seconde étude, menée par le Council on library resources 7 (CLR) de 1981 à 1983 et portant sur 29 bibliothèques américaines, avait pour objectif de « qualifier » ce qui n'est pas « quantifiable » : le lecteur souhaite disposer d'un interface qui lui donne une liste de mots en relation avec ses termes de recherche, qui lui propose les sommaires ou les index d'ouvrages, qui lui indique la disponibilité des documents et lui permette d'imprimer ses résultats ; l'accès sujet doit pouvoir se faire par un ou plusieurs termes dans un fichier d'autorité. Le lecteur veut pouvoir être guidé à tout moment. Une troisième étude analysait les transactions en ligne grâce à un suivi de la démarche faite par l'utilisateur ; la difficulté à distinguer le début de la fin d'une session d'interrogation en a cependant rendu l'exploitation difficile.

Depuis 1984, des études « post CLR » menées par des équipes de recherche portent sur l'analyse des transactions automatiques des interrogations et sur le développement de systèmes prototypes expérimentaux. En ce qui concerne les transactions automatiques, il a été constaté que la majorité des sessions de recherche dure entre 2 et 4 minutes, et que le lecteur n'hésite pas à utiliser plusieurs types d'accès dans une même interrogation ; on observe cependant que dans 13,3 % des cas, l'interrogation est mauvaise 8. Ray R. Larson (Université de Californie) a étudié le comportement de l'utilisateur sur l'OPAC Melvyl, une première fois lors de l'installation du système en 1982, puis trois ans plus tard. Il a constaté que l'usage des écrans d'aide à l'interrogation a diminué de 14,25 % à 7,35 %, tandis que les recherches par menus passaient de 59 % à 25 % ; les recherches par mots du titre ont augmenté de 18,8 % à 26 % ; en revanche, les recherches à partir de la liste d'autorité LCSH (Library of Congress subject headings) sont passées de 52 % à 25 %. M. Hancock devait cependant remarquer que les thésaurus manuels n'avaient pas été remis en cause lors de l'informatisation ; cette dernière baisse d'utilisation n'est donc pas forcément significative et l'accès sujet repensé doit, à son avis, être proposé avec l'accès titre.

M. Hancock terminait alors son exposé par un peu de prospective, en présentant trois prototypes expérimentaux de troisième génération : CITE, OKAPI et SOC/DOC. CITE (1980) s'oriente vers la concordance entre le langage naturel de l'utilisateur et le vocabulaire du thésaurus MESH, la troncature automatique des termes, la détection des fautes d'orthographe, la pondération des termes et le feedback de pertinence. OKAPI (1984/1986) a, quant à lui, introduit dans sa seconde version trois techniques nouvelles : la troncature faible ou forte, la correction automatique des fautes d'orthographe et la table d'équivalence. Des tests comparatifs ont été pratiqués sur les différentes versions pour mesurer l'impact des modifications sur l'efficacité de la recherche. Enfin, le système DOC (système de troisième génération remplaçant SOC) a intégré la classification Dewey comme accès sujet ; une concordance établie entre les codes de classification et les termes permet ainsi d'enrichir le vocabulaire d'interrogation.

Un débat sur la place des systèmes experts dans les OPACs clôturait cette journée. Des tentatives sont menées actuellement au BLDSC (British library document supply center) avec le système Plexus. L'utilisateur pourra-t-il un jour interroger en langage naturel ? A suivre !