entête
entête

Les formats et normes de catalogage

Évolutions et perspectives

Yves Desrichard

Le Joint Steering Committee (JSC) pour la révision des AACR (Anglo-American Cataloguing Rules) a suscité la tenue d’une conférence qui a eu lieu à Toronto, les 23, 24 et 25 octobre 1997. À cette occasion, un certain nombre de contributeurs ont élaboré des textes portant sur des points précis concernant l’évolution des pratiques de catalogage en général, et celles des AACR en particulier.

Le but était d’offrir, non une réflexion théorique, mais des propositions pratiques et concrètes susceptibles d’être appliquées immédiatement par le JSC dans la révision des AACR.

Parallèlement à la mise à disposition de ces textes via le site Web de la Bibliothèque nationale du Canada, cette même bibliothèque avait mis en place un forum de discussion spécifique entre les mois de juillet et d’octobre 1997. Ce forum a été abondamment alimenté par des débats divers, parfois très techniques, souvent passionnés, et le plus souvent extrêmement « fouillés ».

Le présent article se propose d’effectuer une synthèse, d’une part des différentes contributions des conférenciers, d’autre part des débats. L’auteur s’est permis quelques apartés et l’ajout, quand le besoin s’en faisait sentir, d’exemples francophones pour éclairer certains aspects parfois ardus ou très novateurs du propos. Pour le reste, l’article se veut un reflet fidèle et non partisan tant des propositions élaborées par les conférenciers que des appuis ou objections que celles-ci ont suscités chez les participants au forum électronique.

Dans la mesure où la totalité de ces débats et textes a été établie en anglais, il n’a pas paru opportun de traduire certains termes qui correspondent soit à des pratiques de catalogage spécifiques à « l’univers » des AACR – pratiques sinon anglo-saxonnes, du moins anglophones – soit à des notions nouvelles pour lesquelles on ne s’est pas risqué à établir une proposition de traduction.

L’évolution de la notion de catalogue

Une bonne part des commentaires prend acte de ce que, désormais, le « catalogue » d’une bibliothèque ne donne plus uniquement un aperçu du fonds matériel de la bibliothèque en question. D’autres catalogues répertoriant les fonds matériels d’autres bibliothèques peuvent être accessibles par ce même biais et, surtout, nombre de ressources électroniques, secondaires (banques de données) mais aussi, et de plus en plus, primaires (documents ou ressources eux-mêmes) sont et seront accessibles via un « guichet » unique.

D’évidence, l’avenir est à la constitution d’interfaces ergonomiques et indifférenciées, faciles à comprendre et à utiliser, quels que soient le type de document concerné et le type d’accès impliqué. Confrontés à cette expansion a priori infinie (par le biais des liens) du catalogue, les catalogueurs et les responsables de bibliothèque, tout autant que les usagers, doivent prendre en compte une réalité multiforme et qui plus est mouvante. C’est un exercice difficile qui représente, de plus, une évolution presque « ontologique » de l’organisme documentaire, où la notion de « frontière matérielle » est dépassée au profit d’une « nouvelle frontière » (rejoignant là, et ce n’est pas un hasard, l’un des mythes fondateurs du système américain) qui, en fait, n’est plus du tout une frontière, et où la seule limite est le point d’accès, c’est-à-dire le producteur (professionnel) ou l’utilisateur (usager).

En outre, à l’expansion des fonctions d’un catalogue, et des ressources auxquelles il peut donner accès, répond celle de ses utilisateurs potentiels, qui ne sont plus limités à un lieu physique (la fameuse « salle des catalogues »), encore moins à un campus, mais proviennent dorénavant et en théorie du « monde entier », lequel ne vient plus interroger un catalogue donné, mais des catalogues « interconnectés » (au moins virtuellement) par le biais de technologies de type Z39.50 1.

À ces bouleversements, et concernant cette fois le contenu même du catalogue « traditionnel », s’ajoutent la multiplication des types de supports physiques à décrire, mais aussi, pour un nombre croissant de documents, la disparition (ou presque) de cette notion de support, ou la coexistence, impensable jusque récemment, d’informations de types différents (images, textes, sons) sur un même support.

D’une certaine manière, bon nombre de catalogueurs considèrent que, avec l’avènement des catalogues informatisés, ils ont « perdu le contrôle » sur le destin des données créées. Ainsi, les formats de type HTML n’ont absolument pas été conçus dans une perspective de traitement documentaire ; pourtant, ils sont de plus en plus largement utilisés à ces fins.

La banalisation des interfaces, celle des recherches, vont de pair avec une banalisation de l’information : monde jusqu’alors « clos », le catalogage ne peut plus se suffire à lui-même ni se satisfaire de lui-même. Ces bouleversements seront rapidement perceptibles dans les règles de catalogage elles-mêmes où, par exemple, la notion de « core record », notice sinon minimale du moins non exhaustive, privilégiant la prise en compte de la plupart des besoins de tout le monde en évitant la complétude pour des informations jugées trop spécifiques, va dans le même sens.

Dans cette perspective, l’utilité même du catalogue et sa « visibilité » sont aussi mises en cause. Certains auteurs regrettent que la mise en place d’interfaces banalisées ne permette plus de distinguer un catalogue de l’interrogation de bases de données, ou de « fonds » électroniques en ligne. Pourtant, cette banalisation est considérée comme primordiale par nombre d’utilisateurs, et le caractère forcément « frustrant » de l’interrogation du catalogue (on ne peut pas, ensuite, accéder directement au document) peut largement être compensé par l’installation d’outils pouvant être couplés avec des systèmes de demande de prêt entre établissements.

Pour ce qui est de l’adaptation des AACR à ce nouveau paysage, certains commentaires leur reprochent justement d’être un outil commode pour créer des descriptions bibliographiques uniques, mais pas pour créer un catalogue : la richesse d’un catalogue réside dans les relations entre les différents éléments, qui permettent d’en repérer les points forts et, éventuellement, les lacunes. La richesse d’une notice, « en elle-même », se situe dans la multiplication des possibilités de retrouver précisément cette notice quel que soit le mode de recherche ordonné. Les deux processus n’ont pas forcément la même finalité et, à l’heure du document électronique, la première, qui consiste à créer un catalogue, semble plus pertinente : il faut, en d’autres termes, définir des « entités », comme, par exemple, un périodique donné à travers les évolutions successives de son titre et des « relations » telles que « suite de » ou « fusionne avec ». Pour les publications en série, les types de relations sont largement identifiés, et traités comme tels à la fois dans les règles de catalogage et dans les formats ; mais pour d’autres types de documents et d’autres types de relations, d’importants problèmes demeurent et des études approfondies restent à faire.

L’évolution de la notion de catalogage

Sans verser dans une philosophie un peu facile, il est indéniable que, dans ces débats, c’est aussi l’une des angoisses majeures de cette fin de siècle qui s’exprime, celle de la substitution à l’expertise humaine d’une « expertise » informatique. Si les données descriptives des documents sont élaborées de manière automatique (« métadonnées »), et si l’on utilise des outils de recherche (« search engines ») de plus en plus aboutis de façon à simuler le comportement humain, quelles seront la place de l’homme dans ce contexte et l’utilité, non seulement du catalogueur (dont les tâches ont été largement diminuées par le catalogage partagé), mais aussi de tout professionnel de la documentation ?

Certains commentateurs vont jusqu’à considérer que, par exemple dans le débat sur la notion de « main entry » (voir plus loin), c’est, une fois de plus, de la « lutte » entre l’homme et la machine qu’il faut parler. Pour eux, les progrès de l’intelligence artificielle ne transformeront pas les moteurs de recherche sur Internet en une pensée à l’œuvre, de même qu’un document ne pourra pas se cataloguer lui-même de manière parfaitement pertinente pour un humain : de ce fait, et le travail sur les points d’accès (contrôle d’autorités, établissement de liens, etc.) et les modes de recherche devront in fine être relayés par l’homme – pour l’homme – quels que soient les discours ambiants, souvent plus volontaristes que réalistes.

Pour autant, il serait faux de croire que les débatteurs se replient sur des positions conservatrices, et beaucoup soulignent que, dans ce débat, on s’accorde enfin sur la nécessité de modéliser les données bibliographiques et leurs relations. S’il faut conserver une distinction claire entre, d’une part, les éléments bibliographiques, tirés du document lui-même ou de sources spécifiques, et dont l’établissement doit être fait dans un strict souci d’harmonisation, et, d’autre part, les « points d’accès », dont l’élaboration, plus dépendante des besoins de chaque établissement, suppose une marge d’appréciation beaucoup plus importante, les éléments bibliographiques eux-mêmes devraient faire l’objet de profondes modifications quant à leur collecte.

Modélisation des données bibliographiques

Les travaux de l’IFLA (International Federation of Library Associations and Institutions) sur la modélisation des données bibliographiques et des relations entre notices (cf. bibliographie) sont largement évoqués. Nombreux sont ceux qui s’accordent à juger que, si les AACR (et les ISBD) d’abord, les formats MARC ensuite, n’étaient qu’une transcription respectivement « utilitaire » et informatique de règles établies pour une large part au XIXe siècle et tout à fait empiriquement, les démarches actuelles consistent à modéliser la nature même de l’information bibliographique, et se situent donc encore en amont de l’élaboration des formats MARC, qui avaient pris comme « fait acquis » la déconstruction de l’information bibliographique posée par la fiche de catalogage en format de type ISBD.

De ce fait, il peut paraître paradoxal que l’on souhaite adapter ce type de modélisation aux AACR, qui, presque par définition, y sont irréductibles, et la démarche de l’IFLA en cette matière semble aux débatteurs beaucoup plus féconde et beaucoup plus originale. À ceux qui leur reprochent de vouloir imposer par ce biais des notions « révolutionnaires » (« revolutionary »), certains auteurs ou débatteurs répliquent qu’il faut plutôt les considérer comme « évolutives » (« evolutionary »).

C’est que, à l’heure du document électronique, la donne est complètement bouleversée. La question de savoir si l’on catalogue un document dans un état donné (c’est-à-dire à un moment donné) ou si l’on s’efforce de le cataloguer de manière continue en remplaçant au fur et à mesure certains éléments, prend une particulière et vitale importance, même si, par exemple, le catalogage des publications en série a toujours plus ou moins posé ce type de problème. Là où les évolutions du document imprimé étaient nécessairement lentes, la « réactivité » ou non du catalogueur pour ce qui est des documents électroniques (un site Web par exemple) peut devenir un handicap, et, en tout cas, ne permet plus d’envisager cette collecte d’informations comme une « autopsie », faite une fois pour toutes (en amont donc), tandis que, en aval, dans l’exploitation et la présentation des informations, le terrain reste mouvant 2.

Certains auteurs (peu, curieusement) soulèvent cependant un des problèmes fondamentaux posés par les changements demandés, parfois majeurs : il s’agit du poids de l’existant, à savoir des millions et des millions de notices produites depuis plus de trente ans (date d’apparition des premiers formats MARC), selon des règles de catalogage qui ont finalement peu évolué pendant ces trois décennies, et leur exploitation dans des formats MARC marqués de la même lente progression. Certes, cet obstacle est commun à nombre de projets d’envergure, et la traditionnelle « résistance au changement » y trouve souvent matière à objections faciles. Mais il est vrai que, au regard de la masse de données déjà accumulées, et à l’heure où l’avènement du document électronique et des « métadonnées » « encapsulées » dans son contenu risque de rendre obsolètes les formats MARC, voire les normes de catalogage, on peut se demander si « le jeu en vaut la chandelle ».

Formats et catalogage

Nombre de participants s’interrogent sur la nécessité de ménager une dichotomie entre les règles de catalogage et les formats informatiques utilisés pour traiter et pour présenter les informations. En effet, tant dans les modes d’indexation que dans les modes d’affichage, les différences sont de plus en plus nettes entre ce que réclament les normes de catalogage (largement basées sur les ISBD) et les possibilités des logiciels qui gèrent, eux, des formats de données. C’est par ce biais que ressurgit l’accusation de « redondance » dans la saisie d’information, si souvent faite aux formats de type MARC, et qui voit la « même » information présentée, de manière différente, dans des champs distincts (par exemple dans des champs codés et des champs de notes) ; ce point est abondamment discuté dans la perspective d’une évolution des règles de catalogage comme des formats.

Il est acquis pour beaucoup que le « pavé ISBD » ne peut plus être le mode unique d’affichage de catalogues informatisés, où la notice peut être facilement et à façon « déconstruite » : autrement dit, il n’y a plus de coïncidence entre l’activité du catalogueur et le résultat pour le lecteur/chercheur. Les pratiques peuvent rester les mêmes, mais on doit prendre en compte les besoins des utilisateurs, et même de différents types d’utilisateurs, ce qui a forcément des conséquences sur le « pavé » (en affichage), mais aussi, voire surtout, sur les points d’accès qui deviennent les éléments essentiels de la recherche. À partir de là, par exemple, le souci de la ponctuation devient secondaire par rapport aux nécessités de prendre en compte de façon précise des données bien structurées dans un format informatique et, aussi, dans un ou plusieurs types d’affichage.

Beaucoup s’accordent pour dire que la démarcation entre les AACR (méthode de collecte d’information) et la présentation des éléments ainsi rassemblés va aller en s’accentuant, et que le rôle prescriptif des AACR dans le second cas ira en diminuant (voire s’éteindra). De ce fait, toute la symbolique basée sur la ponctuation, l’ordre de présentation des éléments, etc. devra être éliminée comme non fonctionnelle, et les règles de catalogage devront se concentrer sur un « agreement » autour de la définition précise de certains termes (publication, reproduction, auteur, point d’accès, etc.) et sur leur collecte – mais de moins en moins sur leur ordre de succession et sur leur présentation.

Ainsi, la présentation façon « pavé ISBD » est souvent délaissée au profit d’une présentation par libellés, plus conforme aux possibilités des OPAC (Online Public Access Catalog) et, surtout, aux souhaits des utilisateurs ; l’usage même de la ponctuation liée aux normes ISBD qui, d’une certaine manière, avaient valeur de remplacement pour des libellés « en clair » (impossibles à gérer dans un catalogue papier), semble lui-même peu pertinent désormais. Dans ce contexte, les AACR deviendraient plus purement un « code » et non un « display » : une liste organisée d’éléments et, élément par élément, les méthodes et les règles pour les extraire du document lui-même.

D’autres contributeurs réfutent soit les arguments prônant une intégration entre formats et règles de catalogage, soit l’utilité même d’un débat de ce type. Certains se demandent si les catalogueurs doivent se soucier de l’utilisation des données qui seront établies à l’aide des règles, ou non. C’était certes évident dans le monde des catalogues papier, cela le devient beaucoup moins dans l’univers électronique, où les mêmes données peuvent de toute façon être déclinées d’une infinité de manières : index différenciés, présentation de listes, notices complètes ou non, avec les codes de format ou des intitulés en clair, etc.

À ceux qui prônent l’intégration des AACR et du format MARC (sous-entendu USMARC dans l’univers anglo-saxon), leurs adversaires répondent en évoquant par exemple le problème des utilisateurs des AACR qui se servent d’autres formats bibliographiques (c’est possible, comme en témoignent d’ailleurs les variantes LC-MARC ou OCLC-MARC aux États-Unis, même si les différences sont minimes) et en arguant que, de toute façon, cette intégration ne résoudrait en rien les problèmes posés par l’affichage, l’indexation, la recherche, etc.

De même, la ponctuation « signifiante » des ISBD, utilisée dans les AACR, est vigoureusement défendue par certains comme une alternative internationale à la multiplication des présentations avec libellés. Ces dernières s’avèrent tributaires tant des systèmes qui les gèrent que de la langue dans laquelle ils sont exprimés, même si, de plus en plus souvent, l’anglais est présenté au moins à titre d’option quasi obligatoire.

Dépassant ces querelles, des suggestions novatrices, bien qu’assez éloignées des buts des AACR, sont faites, comme par exemple la définition de « niveaux d’affichage » standards des notices. Nombre de participants insistent sur le fait que, quelles que soient les évolutions des normes de catalogage, celles-ci ont donné et donnent encore lieu à la production d’informations de grande qualité, dont il serait dommage de se priver, ou qu’il serait regrettable de modifier en prenant en compte les contraintes de systèmes eux-mêmes non figés, et en constante amélioration de leurs performances et de leurs capacités de traitement de données complexes.

En fait, si le catalogage reste essentiellement l’affaire de catalogueurs et non de prestataires de systèmes, c’est aussi que l’échange de notices s’est accéléré, et que, par conséquent, la nécessité de standards communs ou étroitement harmonisés n’a jamais été aussi prégnante. En revanche, la présentation et l’exploitation de ces données (catalogues ou autres formes) restent plus libérales, et les commentateurs semblent s’en féliciter : s’il faut savoir ce que l’on a et comment cela a été collecté, l’exploitation des données ne saurait, quant à elle, être standardisée, tant les besoins sont différenciés selon le type d’établissement, etc.

Le débat n’est pas nouveau, notamment pour la problématique d’indexation matières (qui ne concerne les AACR que d’une manière très marginale). La souplesse des adaptations permises par l’outil informatique lui donne cependant une vigueur nouvelle.

Les métadonnées

Certains commentateurs se demandent si les AACR peuvent être utilisées comme un standard pour l’élaboration de métadonnées, qui semblent l’une des voies d’avenir de la description bibliographique de documents électroniques. Pour eux, les AACR, qui délimitent strictement la description bibliographique d’une part, les points d’accès d’autre part, ne sont pas adaptées au « nouveau » concept, où cette distinction n’a pas grand sens, puisqu’elle conduit à des redondances dans la saisie d’information.

Pour autant, l’utilité des aacr comme référence pour le catalogage, en liaison avec d’autres « standards » tels que le Dublin Core, les formats marc, les ISBD, TEI, voire les LCSH ou la DDC, n’est pas contestée. Simplement, il ne peut plus être question de considérer les AACR comme « le moyen et la fin » de pratiques de catalogage beaucoup trop diversifiées et aux objectifs beaucoup trop hétérogènes, pour qu’un seul corpus de règles soit suffisant pour couvrir l’ensemble des – souvent nouveaux – besoins 3.

La notion de « work »

La mise en avant de la notion de « work » est l’une des initiatives les plus originales surgies à l’occasion du projet de révision des AACR. C’est aussi celle qui a suscité les débats les plus longs et les plus passionnés.

Martha Yee propose du « work » la définition suivante : « Le produit de l’activité intellectuelle ou artistique d’une ou de plusieurs personnes ou d’un groupe exprimé d’une manière spécifique. Un ‘work’ a un nom, ou peut être nommé, et peut se suffire à lui-même en tant que publication. Pour autant, son nom peut changer sans devenir un autre ‘work’ ». La définition peut sembler vague, et son application ne va pas sans poser problème, d’autant plus que Martha Yee fait reposer une partie de l’appréhension de la notion de « work » sur le sentiment du lecteur ou du catalogueur, éminemment subjectif.

Les tenants de la notion de « work », posent comme préliminaires que :

– le lecteur recherche une « œuvre » 4, non une édition particulière d’une « œuvre » ;

– malgré tout, les « œuvres » sont publiées sous forme d’édition, et l’un des objectifs fondamentaux du catalogue doit être d’organiser la masse hétérogène et complexe des différentes éditions de façon à répondre simplement à la première assertion ;

– dans un affichage, le lecteur doit avoir accès simultanément à toutes les éditions d’une « œuvre » donnée.

En d’autres termes, l’utilisateur ne recherche pas un ouvrage, un document matériel donné, il recherche une « œuvre », un « document » contenant certaines informations, et, à partir de là, un peu à la manière des « titres de forme » et d’autres types de points d’accès autorités, il faut pouvoir lui proposer des « titres d’œuvre » normalisés, quelle que soit la présentation du titre sur un document matériel donné.

La création du concept de « work » implique celle du concept de « manifestation », qui est la matérialisation (une matérialisation) d’une œuvre donnée. C’est l’existence ou non de ce niveau qui conditionne la détermination d’un « work ». Si certains auteurs insistent sur la nécessité de créer presque systématiquement des autorités pour chaque « work » engendré, d’autres penchent plutôt, de manière plus pragmatique, vers la création de « super records » qui seraient créés uniquement quand un « work » aurait donné lieu à plusieurs manifestations : autrement dit, et pour donner un exemple quelque peu caricatural, on ne créerait pas de notice de « work » pour un nouveau roman français ne comportant qu’une seule édition brochée, mais, dès que cet ouvrage serait publié en poche ou traduit en anglais, une notice – ou un lien – serait créée de façon à ce qu’un usager du catalogue puisse immédiatement identifier ces deux « manifestations » d’une même « œuvre ».

Avec la mise en place des notions de « work » et de « manifestation », s’expriment les tenants du « content versus carrier » comme l’indique le titre de l’une des interventions à la conférence. Ce qu’il importe de décrire, de manière prioritaire, c’est le contenu du document, et non sa forme matérielle, qui n’apporte que peu d’informations à l’usager du catalogue, et qui, en tout cas, ne correspond à aucune démarche de recherche ou d’identification. Si la détermination des points d’accès, a priori indépendante de la forme matérielle des documents, relève de cette démarche dans les AACR2, certains considèrent que, en fait, elle est dépendante de cette forme – et que cette dépendance est, en soi, un risque de mauvaise efficacité dans la description des documents.

Définir les « works » en catégories précises

Pour mieux en cerner la notion, et pour aider les catalogueurs à déterminer les « works », certains auteurs proposent de les définir en catégories précises, de telle façon qu’un changement de catégorie implique la création d’un nouveau « works ». Parmi les catégories proposées, on retrouve des catégories de « types » (texte, musique, image fixe, image animée, données spatiales, objets, données numériques, etc.), qui peuvent elles-mêmes être subdivisées en « genres » (poésie, théâtre, etc.) L’assemblage semble complexe et on peut même se demander si, en utilisant des catégories aussi fines, il deviendra possible de regrouper différentes entités sous un « works » unique.

Pour l’établissement d’un « works », qui ressemble beaucoup à la notion de « titre clé » déjà utilisée pour les publications en série, certains débatteurs citent en exemple le travail du réseau ISSN. Beaucoup pensent que les règles de l’ISSN et les AACR pourraient être harmonisées et utilisées en les adaptant, d’une part, pour la détermination et la construction du « titre clé » d’un « works », d’autre part pour la définition des critères impliquant un changement de titre clé pour une publication donnée. On peut remarquer que ce second point, déjà très épineux pour les publications en série, le deviendrait encore plus si la notion de « works » devait s’implanter durablement, et être traitée comme telle par les catalogueurs. Ainsi, le film de Visconti, Ossessione, est une adaptation inavouée du roman de James Cain, Le Facteur sonne toujours deux fois, qui a lui même fortement influencé un autre roman policier, écrit par James Hadley Chase cette fois, Tirez la chevillette : convient-il d’établir un lien entre toutes ces notices ? Dans ce cas, quel titre retenir pour le « works » en question ? Ces problèmes sont loin d’être anecdotiques à l’heure où l’on « décline » de plus en plus, sur des supports et sous des formes de plus en plus différentes, un même « produit ». Certes, ces pratiques rendent encore plus nécessaire et utile l’établissement de relations entre différentes notices descriptives, mais elles n’en facilitent ni la constitution ni la gestion.

Pour ses détracteurs, la notion de « works » se heurte à l’incapacité de définir précisément de quoi il s’agit : ainsi, dans le cas d’un livre adapté au cinéma, le film qui en est tiré peut-il être considéré comme une « manifestation » de ce livre ? L’approche est complexe, par exemple, pour les compositions musicales, qui peuvent donner lieu à une partition, mais aussi à un disque ou à une reproduction sur vidéo d’une exécution. Dans ces deux derniers cas, on achoppe sur la définition de la « responsabilité principale », et, tout particulièrement dans le second, le réalisateur de la vidéo est-il l’auteur principal ? Ou est-ce toujours le compositeur de l’opéra considéré, ou le librettiste ? Ces questions donnent lieu à des débats passionnés, que dominent souvent, il faut l’avouer, des « intérêts catégoriels », par exemple ceux de catalogueurs spécialisés dans les documents musicaux.

La notion de « copy »

En sus de la notion de « works » et de « manifestation », s’ajoute celle de « copy », qui doit être comprise comme un sous-ensemble du précédent, et par conséquent un sous-sous-ensemble du « works ». Là encore, on se heurte rapidement à des problèmes de définition : la vidéo d’un film adapté d’un roman est-elle une « manifestation », ou une « copy » ? On pourrait considérer que c’est une « copy », la « manifestation » originelle ayant été le film. Mais si, comme cela arrive souvent dans le marché de la vidéo, la vidéocassette se présente comme la version intégrale, non expurgée, du film, avec des scènes supplémentaires, un reportage sur le tournage, etc. du film considéré comme « manifestation » ne devient-elle pas elle-même une « manifestation », ou plutôt une « sous-manifestation », de l’œuvre originelle ?

La mise en place de ce triple niveau, si elle répond, d’une part à une prise en compte enfin effective de ce que les bibliothèques ont des documents sur des supports de toutes natures et ne veulent pas proposer des catalogues spécifiques, type de support par type de support, d’autre part aux préoccupations croissantes liées à la description et à l’accès au document électronique (y compris directement à partir du catalogue), ne va pas sans poser de délicats problèmes. On peut penser que, s’ils se posent au catalogueur, ils se poseront encore plus au lecteur, quelle que soit la qualité des outils informatiques et des interfaces proposées.

Pour ses détracteurs, la mise en place de notices de « works » semble à contre-courant d’une tendance générale à la simplification des procédures, à l’accélération de la production, et au souci de pratiques de « flux tendus » en matière de catalogage, directement inspirées d’une démarche de management. Par ailleurs, la facilité d’établissement de liens informatiques est aussi une des raisons pour lesquelles certains auteurs « militent » contre ce type de notices, dont le but serait simplement d’assurer un pivot entre différentes manifestations d’un même « works » : dans la mesure où, souvent, les liens sont invisibles aux utilisateurs, pourquoi vouloir leur donner un titre purement artificiel, là où il suffirait simplement de dire que tel ouvrage possède une traduction en français ou a fait l’objet d’une adaptation au cinéma, et de créer un lien spécifique directement à partir de la nature et du libellé de ce lien, par exemple « traduction » ou « adaptation » ? Pour eux, une exploitation complète des possibilités des différents types de formats MARC serait déjà une bonne façon de faire progresser la description des documents, et d’améliorer l’efficacité lors des sessions de recherche, y compris pour ce qui concerne les liens entre notices.

Les publications en série

Avec l’avènement du document électronique, qui concerne largement ce que recouvre pour l’instant la notion de « publication en série », nombreux sont ceux pour qui la définition même du terme « publication en série » est amenée à évoluer. Pour certains, il faut abandonner deux critères qui sont pour l’instant déterminants pour définir précisément ce qu’est une publication en série, à savoir la notion de numérotation et celle de « fascicules successifs ». La suppression de ces critères n’est pas sans inconvénient, mais semble une condition nécessaire à une bonne prise en compte des « publications en série » électroniques, qui se multiplient et qui ne peuvent s’accommoder parfaitement des règles de catalogage actuelles.

D’autres vont même jusqu’à proposer l’abandon pur et simple de cette notion de publication en série « opposée à » (ou définie par rapport à) d’autres types de publications (monographies, cartes, etc.), au profit d’une distinction entre les publications « figées » et les publications « on going », c’est-à-dire pour ces dernières soumises a priori à une évolution continuelle, facilitée par les outils de publication disponibles pour les formats de documents électroniques, mais dont le traitement catalographique pose des problèmes particulièrement complexes. Comme le souligne de manière imagée l’un des débatteurs, si le catalogage d’un ouvrage s’apparente à une « autopsie », « cataloguer une publication en série ressemble à vouloir rattraper une antilope à la course ».

La gestion des autorités

Le débat sur les points d’accès, prolongement naturel des réflexions sur l’évolution du catalogue et du catalogage, prend des formes nouvelles en aboutissant à une redéfinition de la constitution et de l’intérêt des autorités, et notamment des notices d’autorités. Les débats sur ce point sont liés à ceux sur la notion de « works », mais aussi, d’un point de vue plus purement technique, à l’avènement d’un nouveau standard, Unicode, qui permet (permettra) la gestion, au sein d’un même système, d’un jeu de caractères prenant en compte différentes écritures, ceci pouvant rendre à terme obsolètes ou redondants les efforts de translittération menés depuis longtemps par les organismes documentaires.

Dans cette perspective, certains proposent que les règles AACR acceptent comme points d’accès des formes non translittérées de noms, de titres, etc. Les tenants de cette (r)évolution considèrent que pour faciliter aux chercheurs l’accès à des documents sans qu’ils aient à entrer dans les arcanes de la translittération, on pourrait abandonner jusqu’au concept même de translittération ou, tout au moins, le limiter fortement.

Pour d’autres, cette mise en place supposera un contrôle d’autorité sur toutes les formes du nom d’un même auteur, sans que l’on puisse déterminer si toutes ces formes doivent figurer dans une même notice d’autorités, ou dans plusieurs... selon l’alphabet retenu.

De plus, on ne peut confondre les alphabets et les langues qui l’utilisent, ce qui introduit un niveau supplémentaire de distinction. Sur cette lancée, la notion même de notice d’autorités, notamment pour les auteurs, semble contestée : certains pensent qu’il ne faut plus mélanger au sein d’une même notice les différents pseudonymes d’un même auteur, comme c’est traditionnellement le cas, surtout dans la mesure où, le plus souvent, c’est le « vrai » nom de l’auteur qui est retenu comme terme d’autorité, par exemple Samuel Clemens pour Marc Twain ou Eugène Grindel pour Paul Éluard. Ceux-là pensent que chacune des « manifestations » du nom d’un même auteur devrait faire l’objet d’une notice distincte, l’ensemble des notices en relation étant bien sûr reliées.

C’est la notion d’« identité bibliographique » qui l’emporterait, qui permettrait de distinguer les œuvres de Frédéric Dard et celles de San-Antonio, ou celles de Jacques Laurent de celles de Cecil Saint-Laurent. On peut se demander ce que devient alors la notion même de notice d’autorité auteur, qui perd beaucoup de son sens et de son intérêt.

Ainsi, pour beaucoup, c’est de la technique que viendront les solutions à ces débats, c’est-à-dire la généralisation d’Unicode, qui permettra, au sein d’un même catalogue, de gérer différents alphabets. Unicode pourrait entraîner l’établissement de notices d’autorités d’un nouveau genre où, par exemple, un auteur donné pourrait avoir une forme d’autorité par type d’écriture, le tout dans une notice unique, ce qui pourrait aboutir à la disparition de la notion de « main entry ». Pour autant, nombre de problèmes devront avoir été résolus avant cet avènement, ainsi du classement des différents types d’écritures. Mais tous s’accordent à dire que les règles en question seront édictées, non par les professionnels des bibliothèques, mais par les constructeurs et les concepteurs de logiciels, et Microsoft au premier rang d’entre eux.

La fin de la « main entry » ?

La notion de « main entry » est donc largement contestée car liée aux contraintes physiques (aujourd’hui considérées comme obsolètes) d’un catalogue papier, où devait figurer une fiche « mère » et des fiches « filles ». Beaucoup vont même jusqu’à considérer que cette notion n’a jamais eu de pertinence, et qu’elle correspond à un « fantasme de bibliothécaire » qui n’existe pas dans le monde réel.

D’autres rétorquent que les librairies, les bibliographies et autres outils ou services nécessitant de classer des documents, utilisent, d’une manière ou d’une autre, un concept semblable pour leur classement. Certes, selon ses besoins et ses capacités, le lecteur ou le chercheur aura recours ou non à ce point d’accès, ayant à sa disposition, grâce aux catalogues informatisés, une infinité de points d’accès autres ; mais, pour les tenants de la « main entry », il faudra trouver un point d’accès principal, et l’existence de celle-ci n’est pas liée aux catalogues sur fiches, mais s’applique tout aussi bien dans un environnement informatique.

Pour ses partisans, la notion de « works », est incompatible avec celle de « main entry ». En effet, s’il faut absolument désigner un auteur principal qui, par exemple, pourrait être l’auteur d’un opéra, cela veut dire que le metteur en scène de l’opéra, ou le réalisateur du film tiré de cet opéra, ne pourraient plus être considérés comme « auteur principal ». Ceci choque certains pratiquants, tandis que d’autres s’en trouvent satisfaits, pensant qu’un usager ira plus volontiers chercher sous le nom du compositeur de l’opéra dont le film se veut l’adaptation que sous celui du réalisateur de ce film. Il est évident pourtant que cette pratique suppose un a priori – on cherche un film tiré d’un opéra – sans répondre de manière satisfaisante (en tout cas si on se focalise sur la notion de « main entry ») à d’autres types de recherches, par exemple celle de tous les films d’un réalisateur donné.

Enfin, pour beaucoup, la notion de « main entry » ne renvoie pas uniquement à l’organisation du catalogue, mais aussi à celle des collections : si elle perd de sa pertinence pour les collections « immatérielles », elle reste indispensable, sous une forme ou sous une autre, pour les collections physiques, qu’il faut bien classer, ordonner, de façon à regrouper des « items » relevant (pour faire vite) d’un même auteur, et permettre ainsi à l’usager d’accéder facilement auxdites collections.

La multiplication des liens

L’avènement des outils de type hypertexte et des formats correspondants, si elle n’a pas à proprement parler entraîné la création des liens entre notices d’un catalogue, a cependant largement avivé les problèmes liés à leur conception et à leur activation, en liaison d’ailleurs avec l’évolution même de la notion de catalogue.

Ainsi, l’usage généralisé d’interfaces basées sur HTML (notamment pour la consultation de catalogues de bibliothèques) et, plus généralement, de type « hypertexte », permet de transformer en zones de liens supposées des zones qui n’ont pas été explicitement conçues comme telles, par exemple les « added entries ». Mais l’utilisateur n’a pas réellement la garantie, en « cliquant », de trouver autre chose, encore moins autre chose de pertinent. Là où les liens explicites entre les notices sont, a priori, obligatoirement bidirectionnels (lien entre un périodique et celui qui l’a suivi et lien inverse par exemple), ce type de « liens » (dans un sens plus purement informatique que bibliographique) n’a pas été conçu de cette manière, et n’a donc pas forcément été produit tel quel lors de la phase de catalogage.

Là encore, on constate que la notion de « lien », et son application dans les règles de catalogage, achoppent aussi sur le fait que les règles de catalogage ont été conçues dans la perspective de catalogues papier : à l’heure où les formats de type HTML et les outils de programmation, qui rendent leur utilisation plus aisée, accentuent et facilitent l’établissement de tels liens, il y a à ménager une « révolution culturelle » importante et complexe sur un sujet qui, faute de possibilités techniques tout comme par une sorte de paresse intellectuelle, n’a jamais semblé intéresser beaucoup les bibliothécaires 5.

C’est que l’ensemble des liens de type hypertexte propose, sous une visualisation non différenciée (traditionnellement, des termes en surbrillance dans une couleur donnée et soulignés) des liens de nature très différente : de « vrais » liens bibliographiques, prévus comme tels dans le format qui a été « traduit » en HTML ; le lien avec le document décrit lui-même par le biais d’un URL (comme dans le cas de la zone 856 ajoutée pour ce faire au format USMARC, et maintenant UNIMARC) ; mais aussi d’autres types de liens, le tout sous une forme homogène.

L’usager ne peut pas deviner facilement quelle recherche il va lancer en activant le lien indiqué, et quel sera le niveau de pertinence de ce lien. Quand on sait combien rapidement peut devenir déroutante une navigation de ce style à l’intérieur d’un catalogue (voire à l’intérieur d’un ensemble de documents proprement dits), on mesure mieux les risques, les difficultés et les limites de ce type, à première vue séduisant, de recherche.

Le « problème des liens » est particulièrement aigu dans le cas de la création de notices pour les « works ». Pour ses détracteurs, cette notion de « works », qui implique la création de liens entre des entités qui peuvent être différentes voire fort éloignées (que faire par exemple de l’adaptation en comédie musicale d’un film qui était lui-même l’adaptation d’un roman ?), entraîne une trop grande part de subjectivité de la part des catalogueurs, qui ne sauraient être des spécialistes de toutes les disciplines (notamment artistiques) susceptibles d’être traitées.

Pour contourner la nécessité supposée d’introduire des notices d’autorités pour les « works », certains auteurs préfèrent mettre en avant la facilité de création de liens spécifiques qui, dans les systèmes actuels, font plutôt l’objet de notes et, en tant que tels, ne se prêtent pas facilement à l’établissement de liens. À partir d’une typologie simplifiée des liens possibles (traduction, adaptation, extrait, édition, version, etc.), par le biais d’un champ éventuellement unique muni du nombre d’indicateurs nécessaires, ils pensent pouvoir établir entre différentes manifestations le même type de relations que celles permises par les autorités de type « works », sans avoir à bouleverser les règles de catalogage (les changements seraient plutôt au niveau des formats et des logiciels de traitement) et sans entraîner la constitution systématique, forcément lourde, de nouveaux types d’autorités.

On le constate, cette multiplication des liens entre notices de tous types risque aussi de mettre à l’épreuve les capacités tant des AACR que des formats MARC : en effet, pour ces derniers, l’avènement des bases de données relationnelles ou des formats de type SGML, où la notion de lien est largement plus développée et en quelque sorte « native » à leur élaboration, montre bien les limites d’un type de format vieilli, peu adapté aux évolutions informatiques les plus récentes.

Enfin, la multiplication des liens, si elle présente l’avantage pour l’utilisateur de naviguer plus facilement et de manière plus pertinente entre les notices, présente aussi comme inconvénient majeur d’accroître les lourdeurs de gestion de la base proprement dite : chaque modification, si elle doit être répercutée sur un grand nombre de notices, entraîne une grande complexité de mise à jour. De plus, dans le cas où des bases centrales alimentent des bases locales, qu’il faut elles-mêmes mettre à jour, la lourdeur en est encore accrue.

De ce fait et curieusement, quelques commentateurs évoquent l’idée d’un « super-catalogue » qui regrouperait l’ensemble des notices et l’ensemble des localisations du plus grand nombre possible d’organismes documentaires : ainsi, les mises à jour ne seraient faites, quelle que soit leur complexité, qu’une fois, et l’on n’aurait pas à se soucier des risques de « biseau » entre catalogues mutuellement alimentés.

Les actes de la conférence seront publiés prochainement, conjointement par l’American Library Association, la Canadian Library Asso- ciation et la Library Association. Parmi les décisions de principe retenues, on peut citer les suivantes :

– Mettre en œuvre une modélisation des données permettant une analyse logique des principes et des structures qui sous-tendent les AACR.

– Créer une liste des principes des AACR2.

– Mettre en œuvre les recommandations faites sur la redéfinition de la notion de « publication en série » (« seriality »).

– Faire évoluer les AACR vers la primauté du contenu intellectuel d’un document par rapport à son support physique.

– Créer un site Web pour les AACR.

Janvier 1998

Illustration
Sites Web

Illustration
Sigles

  1.  (retour)↑  On peut d’ailleurs noter que, curieusement, les liens entre les protocoles de type Z39.50 et les formats marc et les AACR sont rarement évoqués.
  2.  (retour)↑  Ainsi, l’un des auteurs envisage de créer un lien entre la zone de l’éditeur du livre décrit et le site Web de cet éditeur, voire un site où l’on puisse commander le livre ou d’autres livres du même éditeur, ce qui suppose une grande acuité dans la collecte d’informations sur une zone où, traditionnellement – absence de contrôle d’autorités permet, sinon oblige – le travail de catalogage n’était peut-être pas toujours le plus fourni.
  3.  (retour)↑  Comme pour les protocoles de type Z39.50, on relèvera cependant que l’articulation avec les métadonnées préoccupe assez peu les débatteurs.
  4.  (retour)↑  Même si la traduction est tentante, il n’a pas semblé souhaitable de traduire « work » par « œuvre », dans la mesure où les deux mots recouvrent dans les deux langues des notions très différentes.
  5.  (retour)↑  C’est du moins ce qu’estiment les débatteurs.