entête
entête

Des corpus dans un plan de classement

L'expérience de la Bibliothèque nationale de France

Bruno Béguet

Le recours aux corpus d’auteurs pour des collections de monographies en libre accès, c’est-à-dire au rassemblement sur les rayonnages des oeuvres et de la critique concernant un auteur donné, ne se réduit pas à un mode de classement des ouvrages.

Il constitue, bien en amont du classement, le cadre d’exercice de la politique de constitution d’un fonds en libre accès pour certaines disciplines. Cet article se propose de présenter les procédures appliquées aux collections en libre accès du site Tolbiac-François Mitterrand de la Bibliothèque nationale de France, tant en matière d’acquisitions que de classement proprement dit, et de tirer un premier bilan des avantages et des limites de ce mode de constitution et de présentation des collections. La dimension des collections – 250000 volumes de monographies sont d’ores et déjà proposés à chaque niveau de la bibliothèque, pour une capacité globale évaluée à plus de 700000 volumes – rend évidemment l’expérience de la Bibliothèque nationale de France atypique. Elle ne constitue d’ailleurs pas un précédent, le système du corpus ayant été appliqué dès l’origine par la Bibliothèque publique d’information, de façon systématique pour les littératures et l’art, plus marginalement en sciences humaines. Mais le parti délibéré de privilégier ce type de traitement pour une part importante du libre accès, et le fait d’avoir pensé assez tôt la constitution d’une partie des collections en ces termes, ont contribué à donner à cette problématique une place importante dans le discours et la pratique de la Bibliothèque nationale de France.

La « charte documentaire » qui énonce les grands principes de la politique documentaire du nouvel établissement, avant de les décliner par discipline, y fait explicitement référence : « Sont rassemblés, pour une liste d’auteurs préalablement établie et qui ont marqué la pensée dans leur domaine, leur oeuvre et les principaux commentaires de leur oeuvre. Ce choix, qui correspond à une forte demande des chercheurs, corrige l’un des inconvénients de la classification Dewey, l’éclatement systématique au sujet » 1. Les deux aspects qui définissent le recours aux corpus – élaboration de listes d’auteurs, rassemblement des oeuvres et des études sur les rayonnages du libre accès – ont donc d’emblée influencé l’activité des responsables d’acquisition de certaines disciplines et l’élaboration du plan de classement des monographies, qui se devait de prendre en compte cette dimension, jusqu’à rompre ici ou là avec la logique interne de la Dewey.

Les grandes options

Le tableau de la page suivante récapitule les grandes options prises en matière de corpus d’auteurs : les disciplines concernées par la constitution et le classement des fonds en corpus y sont recensées, avec, pour chacune d’entre elles, les particularités de cotation mises en oeuvre afin d’obtenir le classement souhaité. La place occupée par les corpus dans chacune de ces disciplines est très variable. Ils jouent un rôle « structurant » dans la politique documentaire et l’organisation de la collection en littérature et en philosophie, et, quoique de façon moindre, en psychologie et psychanalyse, en histoire des sciences, et dans les collections consacrées aux arts. Leur fonction est plus marginale dans les fonds de sociologie, d’ethnologie, de religion. Ils occupent enfin une place plus discrète dans d’autres disciplines, telles l’économie et la science politique, pour lesquelles des rassemblements d’œuvres et d’études existent localement, sans qu’une cote leur soit nécessairement dédiée 2.

Ces différences de traitement renvoient à des différences de nature entre des disciplines pour lesquelles la règle privilégiant, dans la constitution et le classement du fonds, la liste d’auteurs s’avère plus ou moins adaptée. L’adaptation paraît naturellement maximale dans les champs de la connaissance ou de la création où se rencontrent trois caractéristiques étroitement liées :

– le primat de la notion d’auteurs et d’oeuvres 3, qui trouve sa traduction dans une production éditoriale largement orientée par ce primat (éditions de textes, oeuvres complètes, catalogues raisonnés, travaux sur les auteurs et les oeuvres, etc.) ;

– l’insuffisance ou l’inadaptation du raisonnement en termes de « contenu » et de « sujet » auquel l’utilisateur professionnel de la classification Dewey doit se plier (tel est particulièrement le cas en philosophie ou en psychanalyse) ;

– le caractère naturel ou « spontané », pour un public qui a dépassé le stade de l’initiation, d’un mode d’accès privilégiant le classement alphabétique des auteurs au détriment de la constitution d’ensembles documentaires sur la base du sujet, du genre littéraire ou de la discipline artistique.

Liste d’auteurs sélectionnés

La politique d’acquisition des littératures, de la philosophie, de la psychanalyse, de l’histoire des sciences et d’une partie de l’art s’est ainsi traduite par l’élaboration de listes d’écrivains, de philosophes, de psychanalystes, de scientifiques 4 ou d’artistes, dont la représentation en libre accès allait emprunter la forme du « corpus », et pour lesquelles l’inscription dans la liste avait en quelque sorte valeur d’engagement à faire figurer en libre accès un large choix d’éditions de textes et d’études fondamentales ou représentatives (pour la production récente). La même logique a été appliquée à la constitution et au classement de fonds de taille plus réduite dans d’autres disciplines, pour lesquelles le corpus représente un choix minoritaire, qui vise essentiellement au regroupement d’un certain nombre d’auteurs canoniques (« pères fondateurs » et grands noms de la sociologie, de l’ethnologie, de la psychologie, de la pensée économique, etc.) sous une seule ou plusieurs cotes.

La volumétrie de ces listes, constituées par les responsables d’acquisitions à partir des outils de référence de chaque discipline, est le reflet de celle des collections en libre accès à Tolbiac (cf tableau 1).

Illustration
Tableau 1 - Les corpus d’auteurs dans les collections en libre accès du site Tolbiac-François Mitterrand

. À titre d’exemple, plus de 500 philosophes (dont 160 pour le domaine français) et près de 3000 écrivains d’expression française (dont plus de 700 pour le monde francophone) 5 sont actuellement représentés dans les collections et traités en corpus. Ce traitement est réservé à près de 50 anthropologues et ethnologues, plus de 80 sociologues, près de 70 psychologues ou psychanalystes 6. Un autre contexte imposerait évidemment des adaptations d’ordre volumétrique et intellectuel : choix des auteurs représentés, part approximativement dévolue à chacun en fonction de la production éditoriale et de la place dont on dispose, décision de recourir plus systématiquement au corpus en sciences sociales par exemple.

Ces corpus ne visent naturellement pas l’exhaustivité, notion qui n’aurait pas de sens en libre accès, mais ils manifestent le souci d’assurer la représentation la plus complète possible des auteurs sélectionnés, ce qui, dans la pratique, donne un caractère plus systématique aux acquisitions, et contribue à éviter l’émiettement. L’affectation d’un auteur donné à un seul corpus est une règle qui souffre des exceptions, certains auteurs pouvant être représentés dans plusieurs disciplines (ainsi de Diderot ou Platon en philosophie et en littérature, de Nabokov en littérature russe et en littérature américaine, les deux corpus ainsi constitués présentant des différences de taille et de contenu), pour des motifs d’ordre intellectuel aussi bien que pratiques (dimension et répartition de la collection, particulièrement en haut-de-jardin) 7. Les listes d’auteurs suivent les évolutions de la politique d’acquisition ou de classement des fonds : intégration de nouveaux auteurs pour les disciplines où le traitement en corpus est la règle, élargissement de la sélection d’auteurs traités en corpus pour les autres.

La place des corpus

Certaines disciplines échappent totalement à cette conception, qui a paru à tous points de vue inadaptée à la constitution et au classement des fonds d’histoire, de géographie, de droit, de sciences et techniques, et de la plus grande partie des fonds économiques et politiques. Ces disciplines relèvent clairement de logiques différentes, spécifiques à chacune, où les notions, par exemple, de sources, de recueils de données, de synthèses de travaux, l’emportent sur celle d’œuvres. Ici, l’esprit de la classification Dewey s’applique, le contenu de l’ouvrage déterminant sa localisation dans le plan de classement – et ceci quelles que soient par ailleurs les adaptations effectuées pour d’autres motifs 8.

Lorsque le classement en corpus s’applique, la place occupée par les corpus dans l’ensemble des fonds d’une discipline est très variable : le graphique 1

Illustration
Graphique 1 – Part des corpus d’auteurs dans chaque discipline

résume, pour les collections du rez-de-jardin, ces disparités déjà évoquées, et montre la grande homogénéité des collections de littérature, pour lesquelles le corpus représente systématiquement 80 à 85 % des titres proposés 9. L’histoire et la critique générale (généralités, bibliographies, études par siècles, par mouvements, par genres littéraires) viennent compléter ces corpus, dans des proportions similaires à celle observée en philosophie pour le même type d’ouvrages. Partout ailleurs, le poids des corpus est moindre, ce qu’expliquent les restrictions délibérément posées à leur utilisation (sciences sociales, religion) ou les caractéristiques de la production éditoriale (art, cinéma) 10.

Globalement, les deux niveaux de la bibliothèque sont de ce point de vue assez homogènes, les corpus occupant un peu plus de place en haut-de-jardin pour les littératures, un peu moins dans les autres disciplines – ce qui reflète une politique documentaire qui donne une très large place aux oeuvres littéraires en haut-de-jardin, et qui accentue en rez-de-jardin le caractère historique des fonds, par le biais des oeuvres fondatrices de chaque discipline.

La cotation

Le traitement appliqué aux corpus, du point de vue plus technique de la cotation, devait satisfaire à deux exigences : faire apparaître ces rassemblements d’ouvrages en leur dédiant des cotes propres, organiser pour chaque auteur le sous-classement des ouvrages sélectionnés. La construction de cotes dites « de corpus » a pris des formes variées en fonction des opportunités qu’offraient les combinaisons d’indices et de subdivisions de la classification Dewey. On se reportera au tableau de la page 4 pour connaître dans le détail ces cotes, qui se répartissent en trois grandes catégories : cotes subdivisées géo-chronologiquement pour les littératures et la philosophie (cotes simplement chronologiques pour l’art, la musique et l’histoire des sciences), cotes sans précision de pays ni de période partout ailleurs. Le détournement de la Dewey que constitue le recours aux subdivisions –092 ou –01 (en sciences sociales) pour coter des documents qui ne sont que pour une part « biographiques » ou « théoriques » était inévitable, la notion même de corpus rentrant en contradiction avec la Dewey. Dans le cas des littératures, des cotes non conformes aux constructions de la Dewey ont été élaborées, afin de faciliter le repérage et l’implantation des corpus.

Du fait de cette disparité dans le choix des radicaux de cotes de corpus, les effets produits sur l’implantation physique des collections sont variés : insertion de cotes de corpus, uniques ou successives, dans le déroulement des cotes pour les sciences sociales, les arts, la psychologie ou la religion, alternance de cotes de corpus et de cotes de généralités par pays et période en philosophie (les études générales sur la philosophie française d’un siècle donné précédant immédiatement le corpus des philosophes français de ce siècle), report de l’intégralité des cotes de corpus à la suite de l’histoire, des outils et des études générales, pour chacune des littératures.

Le sous-classement

En ce qui concerne le sous-classement des ouvrages sous chacune de ces cotes, le système retenu est directement repris de celui appliqué dès l’origine par la Bibliothèque publique d’information, afin de séparer les oeuvres de la critique, et de regrouper les oeuvres par types d’éditions. L’indice Dewey et les quatre premières lettres (ou plus afin de lever les homonymies) du nom de l’auteur (ou du titre anonyme) sont suivis :

– du chiffre 1 pour les oeuvres complètes, puis de la première lettre du titre ;

– du chiffre 2 pour les oeuvres choisies, puis de la première lettre du titre ;

– du chiffre 4 pour les oeuvres particulières, puis des quatre premières lettres du titre dans la langue originale de l’œuvre ;

– du chiffre 5 pour les études critiques, puis des deux premières lettres de l’auteur de l’ouvrage.

L’intégralité de ces éléments de sous-classement n’est mobilisée qu’en littérature, en philosophie, psychologie et psychanalyse. Les autres corpus bénéficient d’un système simplifié, reportant la critique (« 5 ») derrière les oeuvres (pas de chiffre, sous-classement à la première lettre du titre comme pour l’ensemble des collections ne relevant pas du corpus) 11.

Les variations d’une discipline à l’autre

Justifiée au départ par la volumétrie des collections et la volonté d’assurer un classement aussi précis que possible sur les rayonnages, pertinente pour les auteurs dont les corpus rassemblent plusieurs centaines de titres (plus de 200 pour Platon et Freud, 250 pour Balzac et Proust, 350 pour Shakespeare en haut-de-jardin, 140 pour Wittgenstein et 250 pour Kant en rez-de-jardin, par exemple), la précision dans le classement de chaque corpus perd beaucoup de son intérêt, dès lors qu’il s’agit de classer quelques éditions d’œuvres particulières, sans études critiques (cas fréquent en littérature contemporaine). L’application systématique de principes de classement très détaillés trouve là ses limites 12.

La séparation, dans la cote même, des oeuvres et de la critique autorise une connaissance fine du poids respectif de ces deux grandes catégories de documents. Le graphique 2

Illustration
Graphique 2 – Part des oeuvres dans les corpus

donne quelques exemples de cette répartition, généralement très favorable aux oeuvres, ce qui est normal. Les variations observées d’une discipline à l’autre n’ont pas une cause unique, et ne traduisent pas intégralement des choix de politique documentaire. La nature de la production éditoriale, la taille et le profil de chaque fonds jouent un rôle décisif dans l’équilibre oeuvres/études critiques, et contribuent à expliquer, par exemple, la part élevée des études dans un fonds de philosophie qui compte déjà plus de 11000 volumes en rez-de-jardin, ou les variations observées en littérature, qui sont fonction de la place plus ou moins importante dévolue à la littérature contemporaine, de l’existence ou non d’une tradition vivace d’éditions d’œuvres complètes, etc. Un faisceau de facteurs pèse sur ce rapport, dont les effets associés ne sont pas toujours maîtrisables, et que seule une étude détaillée (par siècle pour chaque littérature nationale, par exemple) permettrait de mieux cerner.

À ceci s’ajoute, pour d’autres disciplines qui sont absentes du graphique 2 ci-dessus, une difficulté dans la détermination du caractère – « oeuvres » ou « études » – des ouvrages à coter. Si les écrits des artistes, ceux des musiciens ainsi que les partitions, ne posent pas de problème particulier, il n’en va pas de même des inventaires, répertoires et catalogues d’œuvres picturales ou plastiques, qui présentent la particularité de les reproduire et de les commenter, et de relever aussi bien, selon le point de vue que l’on souhaite privilégier, de la partie « oeuvres » ou de la partie « études » du corpus de l’artiste.

Une alternative pour le libre accès

Pour conclure ce rapide panorama, la constitution de corpus d’auteurs représente une alternative intéressante au classement des collections en libre accès fondé unilatéralement sur le contenu (sujet) ou la forme (genres littéraires, formes musicales, disciplines artistiques), pertinente dans le traitement de certaines disciplines, et adaptée à des usages « savants », dans le cadre d’une bibliothèque d’étude et de recherche. Le classement en corpus favorise en effet un certain type de parcours et de recherche dans les collections (recherche d’un titre précis, du fonds consacré à un auteur, etc.) au détriment d’une recherche thématique. Ceci est particulièrement vrai en sciences humaines et sociales, ce qui justifie l’utilisation mesurée des corpus en sociologie ou en ethnologie, où le classement thématique l’emporte très largement sur le rassemblement des textes et de la critique classés par auteurs. Mais la littérature ou les arts n’échappent pas à des effets similaires : la recherche de textes poétiques ou dramatiques sans considération d’auteurs n’est pas possible dans une collection organisée géographiquement, chronologiquement, puis alphabétiquement. Le corpus, comme tout choix de classement, présuppose des aptitudes, favorise des usages, encourage des réflexes : l’opportunité de son emploi doit être étudiée à la lumière du niveau des collections constituées et des caractéristiques du public attendu 13.

Au-delà de ces considérations générales, on aura compris, au fil des exemples évoqués, que l’application dans le détail de ce mode de classement ne va pas sans difficultés, qui tiennent aux spécificités de chaque discipline, au cadre toujours contraignant que constitue une classification systématique, même amendée, à l’application de règles uniformes de sous-classement qui peuvent se révéler inadaptées dans certaines situations, mais aussi au fait que la constitution d’un corpus, sans être absolument subordonnée à l’existence d’une oeuvre close et d’études critiques, n’en est pas moins favorisée par ce contexte. Le suivi de la production la plus contemporaine se plie mal à cette logique, particulièrement dans les cas où le corpus constitue le seul (littérature) – ou presque (philosophie, psychanalyse) – mode de classement des ouvrages (hors les ouvrages de référence, naturellement), ce qui impose de décider de l’opportunité de faire figurer un auteur dans les collections en libre accès, là où l’on préférerait parfois se contenter d’acheter un titre pour lui-même. On retrouve là, sous un aspect qui tient cette fois à la nature des collections et non plus seulement aux usages des lecteurs, la pertinence déjà évoquée de ce mode de classement dans le cadre des bibliothèques de recherche dont les collections ont un caractère historique plus marqué. Ces réserves faites, le classement en corpus présente de nombreux avantages, dont la faculté d’insertion au sein d’un plan de classement systématique, moyennant quelques entorses, n’est pas le moindre.

  1.  (retour)↑  Propositions pour une charte documentaire, 1993, p. 11.
  2.  (retour)↑  La place précisément occupée par les corpus dans chacune de ces collections, et la part respective d’œuvres et d’études observée dans ces corpus, seront évoquées plus loin.
  3.  (retour)↑  « Auteurs » et « oeuvres » doivent s’entendre ici comme des qualificatifs génériques, qui recouvrent des réalités éditoriales aussi bien en littérature ou en sciences humaines que dans les disciplines artistiques ou scientifiques : écrivains, artistes, savants, sociologues, cinéastes ou théologiens relèvent de ce point de vue de la même logique, qui met en relation des « oeuvres » (ou leur reproduction imprimée) et des « travaux » critiques de toute nature.
  4.  (retour)↑  L’existence d’un fonds d’histoire des sciences permettait le traitement en corpus d’un certain nombre de savants et de scientifiques « historiques », qui ne figurent pas de ce fait dans les collections des disciplines qu’ils ont illustrées, consacrées à la science la plus contemporaine.
  5.  (retour)↑  Les corpus littéraires concernent également les titres d’anonymes (textes et études critiques), classés au titre.
  6.  (retour)↑  Ces listes ont été rassemblées en un fichier unique, destiné à compléter le fichier des cotes Dewey dans le module de catalogage du Système d’information de la BnF.
  7.  (retour)↑  Ces « doublons » sont rares. D’autres considérations peuvent conduire à opérer des doublements de titres, qui tiennent au statut des textes et non plus à celui des auteurs : textes d’histoire de la philosophie qui relèvent du corpus de l’auteur ou de celui du philosophe étudié (Deleuze sur Nietzsche), textes de quelques grands critiques ou théoriciens littéraires qui bénéficient d’un corpus propre (Barthes sur Racine).
  8.  (retour)↑  Toutefois, certaines options de classement, dans la mesure où elles négligent le contenu du document, ne sont pas sans analogie avec les corpus : le fonds de publications officielles est classé par collectivités éditrices, et non au sujet, ce qui constitue une rupture de même nature avec la Dewey. La remarque vaut également pour les musées, dont les catalogues sont regroupés en 708 (avec un sous-classement géographique), sans considération de la nature des collections.
  9.  (retour)↑  Les chiffres retenus pour les littératures d’Europe centrale et orientale, du Proche et du Moyen-Orient et d’Asie sont ceux du haut-de-jardin, les fonds du rez-de-jardin étant en cours de constitution.
  10.  (retour)↑  Pour les collections d’imprimés sur la musique, le poids des corpus est sous-estimé du fait de l’absence des partitions dans le décompte.
  11.  (retour)↑  C’est ce même classement simplifié qui est utilisé pour rapprocher des biographies ou des études des écrits d’un auteur, par exemple en économie, sous des cotes qui ne sont pas réservées à des corpus d’auteurs.
  12.  (retour)↑  Rappelons que le sous-classement pratiqué à la Bibliothèque publique d’information est beaucoup plus sommaire : première lettre des oeuvres particulières, pas de classement par auteurs des études critiques.
  13.  (retour)↑  Ainsi, la distinction couramment pratiquée en lecture publique, entre un fonds de fictions classées par ordre alphabétique d’auteurs, et un fonds de « classiques » et d’études critiques organisé selon la Dewey (par genres littéraires et par époques) constitue un exemple de classement adapté à d’autres usages (et sans doute plus complexe à mettre en oeuvre que l’application systématique du corpus, ne serait-ce que parce qu’il repose sur la partition d’une collection littéraire, sur des critères intellectuels autant que documentaires).