Citations et évaluation des périodiques

Principes, applications, perspectives

Jean-Pierre Cressent

Les fondements de l'analyse de citations élaborée par Eugene Garfield à l'Institute for scientific information sont exposés et une application de cette méthode à l'évaluation des périodiques de chimie est décrite. L'existence d'un noyau de périodiques cumulant les trois quarts des citations reçues est mise en évidence. L'accroissement du pourcentage de la littérature couverte et du coût correspondant des abonnements semble obéir à un rapport géométrique. Cette méthode fait ressortir la notion d'homogénéité des collections et suggère la définition de seuils ou niveaux. Elle pourrait devenir un outil d'évaluation à l'usage des plans de développement des collections et de la coopération documentaire.

This paper both presents the preliminaries of citation analysis as designed by Eugene Garfield of the Institute for scientific information and an application of this method to the evaluation of chemical journals. It points out that a restricted number of journals, or " core ", are cited in seventy-five per cent of the citations. The increase in the percentage of the items cited and in the subsequent cost of subscriptions seems to follow a geometrical ratio. This method emphasizes the necessity for homogeneity in collection selectivity and shows that thresholds or levels can be defined. It could become an evaluation tool valid for collection development policies and cooperation in documentation acquisitions.

Le travail ici présenté s'inscrit dans une perspective d'évaluation et constitue une tentative préliminaire, une exploration en vue d'appréhender avec une certaine objectivité la qualité des collections de périodiqués de la section Chimie-Recherche de la Bibliothèque interuniversitaire scientifique de Jussieu.

Il naquit d'une insatisfaction et d'un besoin croissant d'estimer le degré de cohérence des acquisitions, de marquer les choix d'une certaine rationalité. Puis les échos du séjour d'étude aux Etats-Unis de bibliothécaires français (dont le responsable de la BIUS Jussieu) découvrant les plans de développement des collections (PDC) 1 catalysèrent ce besoin et la quête d'un outil: la lecture nouvelle et assidue des Current contents, et particulièrement des Current comments, dévoila les richesses du Science citation index (SCI) et du Journal citation reports (JCR), autrement dit l'analyse de citations élaborée par Eugene Garfied et pratiquée à l'Institute for scientific information (ISI) 2.

L'analyse de citations

Depuis l'étude princeps de Gross et Gross en 1927 (1), le souci d'évaluer la qualité des périodiques scientifiques a été un constant sujet d'études et de controverses.

L'aube de la méthode

Ce travail fondateur manifestait la volonté d'établir objectivement la liste des périodiques (de chimie en l'occurrence) que la bibliothèque du collège de Pomona se devait de mettre à la disposition des étudiants et des enseignants-chercheurs. Il s'achève sur le double souhait d'en faire une liste d'autorité et de voir se généraliser la méthode adoptée.

Pour ces auteurs, l'enjeu disqualifiait d'emblée la pratique habituelle de compilation de titres de périodiques jugés indispensables, fortement déterminée en fait par les besoins, les goûts et les préventions de son auteur. A l'estimation subjective, Gross et Gross vont substituer une méthode quantitative, « mesurant » l'opportunité d'acquérir tel ou tel périodique, moyennant quelques modulations dont le coût n'est pas la moindre. Ainsi, dès l'origine, la problématique apparaît clairement, posée avec une pertinence toujours actuelle, même si les auteurs s'abstiennent de justifier explicitement leurs rejets et leurs options comme s'ils allaient de soi-même si les limites de la méthode et les quelques corrections proposées pour l'améliorer ne sont pas discutées mais simplement évoquées ou perçues par le lecteur.

Quelle est donc cette méthode à l'oeuvre avant même d'être nommée, dont le fondement semble si bien assuré à ses promoteurs, qu'il les engage à formuler des recommandations d'acquisitions précises, ce à quoi les études de ce type se risquent très rarement ?

C'est l'analyse de citations, analyse signifiant que le décompte brut est amendé par d'autres critères ou considérations, ou bien qu'il est le matériau de base d'études bibliométriques examinant le système de communication constitué par le réseau des périodiques scientifiques, et d'études scientométriques cherchant à évaluer l'impact d'un concept, la production d'un individu, d'une équipe, d'une nation, ou encore à repérer et délimiter des fronts de recherche (research fronts). En deçà de modalités d'applications différentes, l'idée originelle est simple : dans son expression la plus élémentaire, elle consiste à faire la somme de toutes les références bibliographiques qui citent un périodique donné.

Conçue pour traiter un problème bibliothéconomique, la méthode ensemença tout naturellement ce champ et celui des sciences de l'information, mais aussi celui de la recherche scientifique, selon une double polarité : bibliographique et d'évaluation.

Genèse d'une oeuvre

L'analyse de citations telle qu'elle est définie et pratiquée par Garfield à partir du SCI est le produit secondaire de l'élaboration d'un index bibliographique dont les entrées sont les références ou citations d'articles figurant dans un ensemble choisi de périodiques scientifiques. Quelques articles-clés et un ouvrage (2, 5, 6) montrent bien les préoccupations, les réflexions et les expérimentations qui, depuis 1951, aboutirent à sa mise au point en 1964.

Tout est parti d'un problème d'indexation et d'automatisation. En 1948, pour maîtriser la très forte croissance de la littérature scientifique consécutive à celle des crédits alloués à la recherche et pour en faciliter l'accès, l'ancêtre de la National library of medicine finança une étude connue sous le nom de Welch medical library indexing project, et réalisée à l'hôpital John Hopkins de Baltimore.

Il s'agissait de circonscrire le champ de la littérature biomédicale, de mesurer l'étendue de sa couverture par les services bibliographiques, d'examiner la diversité des descripteurs (subject headings) retenus, et d'imaginer comment des machines pourraient générer et compiler des index médicaux (5, 6). Intégré à l'équipe en 1961, Garfield 3 collabora à la réalisation de ce troisième objectif qui visait à éradiquer deux défauts majeurs des index alors disponibles : le décalage de plusieurs années séparant les index les plus récents de la littérature courante et l'absence d'une pratique normalisée des procédures d'indexation. A l'aide de cartes perforées, il devait être possible, par la création d'ensembles hiérarchisés et la multiplication des entrées et des renvois, de mettre fin au chaos régnant, en établissant une liste d'autorité de descripteurs contrôlés. Ainsi fut élaboré le thésaurus précurseur du Me SH (Medical subject headings). Parallèlement, une étude mécanisée portant sur 6 000 périodiques intéressant la médecine conclut que la couverture de ce domaine par les principaux services d'analyse et d'indexation souffrait de lacunes majeures, alors même que des chevauchements produisaient un vaste gaspillage (6).

Ces travaux et quelques autres prouvaient, selon Garfield, que l'indexation traditionnelle est frappée de deux défauts rédhibitoires liés: l'intervention d'indexeurs qui émettent des jugements relatifs au contenu intellectuel d'un document, et le fait qu'ils les expriment selon un point de" vue et une terminologie propres à une discipline, alors que l'interdisciplinarité s'étend. Cette conviction, et la nécessité qui en découlait d'imaginer de nouveaux outils bibliographiques, s'exprimèrent pour la première fois dans l'article de 1955 qui prône la création d'un index de citations (2). Le Shepard's citations 4 publié en 1953 avait d'ailleurs offert un modèle et prouvé que c'était faisable.

Indexation et citation

En substituant aux jugements de l'indexeur les citations des auteurs, les défauts inhérents à l'indexation seront singulièrement réduits. Opérant dans le champ circonscrit d'une discipline particulière et selon des schémas propres à cette discipline, effectuant des choix qui limitent le nombre des descripteurs, l'indexation est sélective et fragmentée (3). Contrainte pour des raisons matérielles (dont le coût), de ne retenir que les aspects principaux d'un document, elle oblitère des informations qui pourraient nourrir un autre champ de la recherche 5. De surcroît, elle est minée par de sérieuses limitations d'ordre sémantique : le sens des mots évolue, il est soumis à des interprétations. Même une armée d'indexeurs ne pourrait résoudre ce problème, pas plus que la difficulté de saisir les processus mentaux et la démarche du chercheur, qui ne s'ajustent pas nécessairement à la leur, comme le montre l'étude réalisée à partir d'un article de Selye (2).

Quels sont, en regard, les avantages d'une indexation par citations ? Chaque citation est une manière de descripteur, l'auteur indexant son propre article chaque fois qu'il en cite un autre (3). Les citations jouent le rôle de chaînons explicites reliant des articles qui partagent des points communs (5). La qualité et la finesse de l'indexation sont accrues puisque les jugements sont éliminés, et que le nombre de citations - 15 en moyenne par article constitue autant d'unités d'indexation, c'est-à-dire davantage que ne peut en offrir un index traditionnel (5). De plus, la citation étant une expression non-ambiguë d'un sujet conserve au cours du temps une stabilité sémantique et une précision qui affectent directement l'efficacité d'une recherche d'information. Un index de citations fournit une trace (trail) d'information qui chemine au travers des disciplines et du temps, dans un mouvement de va-et-vient 6. Grâce à sa structure, il est à même de rapprocher des matériaux que l'indexation traditionnelle n'aurait jamais rassemblés, et d'opérer une « fertilisation croisée » (cross-fertilization) de domaines singuliers, bénéficiant d'une véritable armée d'indexeurs constituée par l'ensemble des auteurs citant d'autres auteurs (5).

Pour éprouver ces convictions, exploiter les enseignements du Welch project et confirmer quelques tests restreints 7, une série d'expériences pilotes fut menée, qui consista à fabriquer de vrais index de citations par des procédés mécanisés et à les confronter à des index traditionnels 8.

Leur aptitude à dépasser les limitations imposées par l'indexation par matière, en identifiant des articles laissés dans l'ombre par une recherche effectuée à l'aide des descripteurs les plus évidents, en révélant des aspects d'un article ignorés de l'indexation classique, et en proposant un point de vue unifié de la littérature scientifique, affranchi des frontières inter-disciplinaires, sembla suffisamment établie pour déclencher la publication du Science citation index (6).

En définitive, il apparaissait qu'un index de citations multidisciplinaire était bien davantage qu'un outil de recherche bibliographique. Cette approche de la littérature éclairait des aspects essentiels et obscurs comme les limites et les interactions des disciplines, la structure du réseau des périodiques, la genèse et l'évolution de concepts, l'influence de travaux particuliers. Comme le montre la floraison des études s'y référant, l'analyse de citations et les données du SCI servent indéniablement la compréhension de ces phénomènes, et la recherche très actuelle d'indicateurs capables d'évaluer l'activité scientifique les utilise 9.

Premiers chiffres

L'application de l'analyse de citations à l'évaluation des périodiques figurant dans le SCI a été menée pour la première fois par l'ISI en 1971. Elle portait sur un million de citations recensées dans 2 200 périodiques scientifiques et techniques pendant le dernier trimestre de l'année 1969 (7). Parmi les nombreux enseignements apportés, quelques chiffres retiennent l'attention et aiguisent l'intérêt pour ce type d'investigation. Il apparaît que 25 périodiques reçoivent 24 % de l'ensemble des citations; 152, 50 %; 767, 75 % et 2 000, 85 %. Parmi les 2 200, 500 publient 70 % du total des articles, et 250 fournissent presque la moitié des 3,85 millions de citations traitées en 1969. Ces chiffres et quelques autres semblent identifier la présence d'un noyau (core) multidisciplinaire évalué à 1 000 périodiques, ce qui doit être à la portée d'un certain nombre de bibliothèques universitaires scientifiques françaises. Si ce dénombrement de citations mesure bien quelque chose, s'il constitue bien une mesure de l'« importance », de la « valeur », de la « qualité », de l'« impact », etc., d'un périodique, l'envie de découvrir des titres derrière ces chiffres semble plus que légitime. Mais quelle est donc la fonction de ces citations ? Pourquoi cite-t-on ? Que veut-on signifier par cet acte ?

Postulats et obscurités

Pour Garfield, lorsqu'un individu cite un article, il nous dit qu'il l'a lu et qu'il a quelques raisons de le soumettre à notre attention (8). En faisant référence à un matériau antérieur pour étayer, illustrer ou expliquer un point particulier, l'acte de citer est une expression de l'importance de ce matériau. L'addition de ces expressions est la mesure la plus objective qui soit de l'importance du matériau pour la recherche actuelle 10. En conséquence, plus la fréquence de citations d'un périodique est élevée, plus la communauté scientifique veut signifier qu'il est un bon vecteur de communication d'information (8).

Si l'on reconnaît à ce critère une objectivité certaine, quelques ambiguïtés s'y attachent, néanmoins, qui ne sont pas encore levées. Garfield l'admet, expose et discute les faiblesses dues à la méthode de compilation et au caractère intrinsèque des données (9). Il met en garde contre un usage erroné de l'analyse de citations, mesure relative qu'il faut rapporter à d'autres paramètres 11. L'examen de l'ensemble des critiques, arguments et réfutations relatifs à l'utilisation de la citation comme critère de mesure pourrait faire l'objet d'une étude particulière. Evoquons simplement quelques points sensibles, en rappelant au préalable que les critiques les plus vives visent un usage particulier de la méthode, à savoir l'évaluation de l'activité scientifique d'un individu ou d'un groupe. Néanmoins, en tant qu'« unité moléculaire 12 » (2), la citation constitue l'élément de base des divers types d'applications : en conséquence, ses défauts les affectent tous et il convient de les évoquer.

Les critiques sur la sélectivité des sources documentaires analysées ou sur la pratique de l'échantillonnage - lorsque les études portaient sur des ensembles plus restreints - sont, d'un point de vue statistique, plus ou moins disqualifiées aujourd'hui par la quantité de données à traiter. Les auteurs les plus sceptiques envers l'aptitude de l'analyse de citations à guider la constitution d'une collection de périodiques visant à couvrir une discipline (10) reconnaissent que le volume des données disponibles et la présence des listes établissant les relations entre les périodiques atténuent très sensiblement leurs réticences. Enfin, la sous-représentation de certains périodiques liée à leurs langues et alphabets (russe, japonais, chinois, etc.) s'avère plutôt minime.

Toutefois, les critiques appliquées à ce « quelque chose » (something) (9) qu'exprime et mesure une citation sont plus difficiles à lever. En effet, si les fonctions de la citation pour l'auteur cité semblent assez bien définies, allant de la reconnaissance-récompense à la reconnaissance d'antériorité qui assure la propriété et la protection de l'œuvre, en passant par la reconnaissance-puissance comprise comme instrument de persuasion à l'égard de la communauté, les motivations des auteurs citant semblent hétérogènes, ce qui semble affecter la fiabilité de ce matériau.

Des significations diverses

Indépendamment du manque de pertinence de certaines citations, imputable à la négligence ou à la rigueur défaillante d'un auteur citant, par l'entremise d'un autre, sans avoir pris connaissance du document cité, certains travaux sont cités pour des raisons tout à fait étrangères à leur contribution au progrès des idées, des concepts, des méthodes, de l'instrumentation. Ce peut être en vue de la revendication d'une priorité, pour annoncer indirectement une publication, parce qu'ils sont signés par un collègue ou par un chercheur renommé, parce qu'ils participent d'un sujet controversé, ou bien en raison de la notoriété du périodique qui les publie ou de sa diffusion. Inversement, des travaux importants demeurent dans l'ombre, car leur support est peu connu et peu distribué, ou le langage utilisé peu pratiqué. Un phénomène dit d'oblitération affecte certains travaux, si fondamentaux pour la recherche et si parfaitement intégrés que l'on néglige de les citer explicitement. De même, les contributions d'ordre méthodologique sont en général beaucoup moins citées que les autres, étant créditées d'un prestige moindre.

Pour clore ce catalogue partiel, il faut évoquer le phénomène de l'autocitation, qui peut être légitime (un individu ou une équipe étroitement spécialisés ou en avance), ou teinté d'abus. Selon Garfield (9), des études montrent qu'au moins 10 % des citations où le citant/cité apparaît comme premier auteur sont des autocitations, et que ce taux est plus élevé s'il s'agit d'une équipe citée. Sans entrer dans les détails, il semble, toutefois, que la pratique de l'arbitrage qui assure un contrôle de la qualité (facilité par le SCI) et l'impossibilité de dissimuler longtemps cet abus, sans que l'intention devienne évidente, contiennent le phénomène dans des limites qui ne biaisent pas significativement la méthode.

L'influence globale de ces éléments sur la fréquence des citations est réelle, sans que l'on sache encore la préciser. Garfield reconnaît qu'il reste beaucoup à apprendre sur la signification des taux de citations, sur les variations constatées d'un domaine à l'autre, l'apparente simplicité du dénombrement des citations masquant de nombreuses subtilités qui requièrent d'affirmer avec prudence et compétence (9). Dans son aspect le plus brut, la quantification neutralise des disparités ou des phénomènes singuliers : considérée isolément, une même fréquence de citations de deux ou trois périodiques peut masquer des réalités bien distinctes. L'analyse de citations pratiquée à l'ISI n'est donc pas une méthode absolue, capable d'évaluer parfaitement ses objets d'étude, puisque certains aspects susceptibles de la perturber demeurent incontrôlés, et certains faits inexpliqués. Pourtant ses apports sont patents et personne ne conteste radicalement la validité même de la démarche, l'intérêt de l'éclairage qu'elle projette sur des réalités qu'elle ne prétend décrire ni totalement ni définitivement. La caution apportée par des études concluant à un haut degré de corrélation entre cette méthode et le jugement des pairs (peers judgement) constitue pour son promoteur (9) un certificat de validation 13.

L'expérience de Jussieu

Les données qui ont été utilisées à Jussieu sont celles du Journal citation reports de 1983 14. Le JCR est une publication annuelle en deux volumes élaborée à partir de la base de données informatisée qui produit le SCI. Rappelons très brièvement que celui-ci est une publication bimensuelle (avec cumulatifs annuels et quinquennaux) constituée des références ou citations qui accompagnent les articles publiés par quelque 3 300 périodiques (en 1983), pour les sciences exactes et naturelles 15.

De quelques critères

Le JCR procède de 10,5 millions de citations émanant d'un million d'articles 16. Les données sont réparties en quatre ensembles (packages). Le premier présente huit classements (alphabétique, par nombre de citations reçues, par coefficient d'impact, etc.). Le second montre, pour chaque périodique, année par année, celle à laquelle il faut remonter pour atteindre cumulativement 50 % du total des citations reçues (cited) ou données (citing) par ce périodique en 1983. Le troisième et le quatrième présentent, pour chaque périodique, la liste de ceux qui le citent, et la liste de ceux qu'il cite, avec le nombre de citations par année. Précisons qu'un périodique cité deux fois ou plus pour un article singulier n'est crédité que d'une seule citation 17.

La section 8 du JCR distribue les périodiques par catégories et les classes, dans chacune d'elles, en ordre décroissant selon un paramètre nommé coefficient d'impact (impact factor). Ces catégories sont des divisions classiques des grandes disciplines 18. A Jussieu, ont été retenues : la chimie générale (69 périodiques), analytique (39), inorganique (32), organique (37), la chimie physique (55), l'électrochimie (9), les céramiques (8), les polymères (35), la science des matériaux (34). Deux catégories pourtant liées à la chimie ont été écartées, la chimie appliquée et les sciences de l'ingénieur, en raison de leur trop faible représentation à la bibliothèque.

Les différents classements proposés dans le JCR résultent de l'application de trois critères : le nombre total de citations, le coefficient d'impact et l'indice d'immédiateté (immediacy index). Ce dernier mesure la rapidité avec laquelle les articles d'un périodique sont cités. Il prend en compte les citations reçues durant l'année de publication des articles. Pour 1983, il est calculé, pour un périodique, en divisant le nombre de toutes les citations reçues pour des articles publiés en 1983 par le nombre total d'articles publiés cette même année. Deux facteurs relativisent cet indice : plus un article est publié tôt dans l'année, plus il est susceptible d'être cité; plus la périodicité de parution d'un périodique est élevée, plus il est théoriquement avantagé.

Le coefficient d'impact a été introduit pour réduire les disparités de taille, de périodicité, d'ancienneté, nivelées par le simple dénombrement. Il exprime un taux moyen de citations par article publié. Pour un périodique quelconque, c'est le quotient du nombre d'articles cités sur le nombre d'articles citables publiés. L'étude conduite en 1971 par l'ISI(7), ayant montré que la fréquence de citation d'un article est la plus élevée durant les deux années qui suivent l'année de publication, le coefficient d'impact est calculé ainsi : c'est le rapport de toutes les citations reçues par un périodique en 1983, pour des articles publiés en 1981 et 1982, sur le nombre total d'articles publiés par ce périodique en 1981 et 1982. S'il a publié 100 articles et qu'il est cité 20 fois, son coefficient d'impact est de 20/100, soit 0,2. L.M. Raisig (11) avait déjà introduit cette mesure (Index of research potential realized) en adoptant un mode de calcul un peu différent de celui de Garfield, mais de principe identique, et il l'avait appliquée aux classements de Gross et Gross, provoquant ainsi quelques modifications.

L'étude de 1971 montre que 75 périodiques seulement appartiennent à la fois à la liste des 152 les plus cités et des 152 ayant le coefficient d'impact le plus élevé. Ces 75 élus occupent des rangs très différents dans les deux listes : le Journal of the American chemical society passe, par exemple, de la première place pour le nombre de citations à la vingt-deuxième pour le coefficient d'impact, les Comptes rendus hebdomadaires de l'Académie des sciences, de la treizième à au-delà de la cent cinquante-deuxième.

Il apparaît, à l'observation de ces deux listes multidisciplinaires, et plus nettement encore lorsqu'il s'agit d'une catégorie, que les périodiques ayant le coefficient d'impact le plus élevé sont pour la plupart des publications de type Advances in..., Progress in..., Annual review of..., autrement dit ce que l'on nomme des séries, dont la périodicité est le plus souvent d'un volume par an, composé de 10 à 15 articles qui font le point des travaux sur une question, une méthode, etc. Les articles de synthèse favorisent naturellement la citation, pour peu qu'ils soient de qualité. Il suffit alors d'un article très cité pour que le coefficient d'impact soit un multiple de dix.

Dans cette étude de 1971, les six premiers titres du classement par coefficient d'impact sont des séries. Le premier, Advances in protein chemistry, obtient un coefficient de 23 pour 8 articles publiés, alors que celui du Journal of the American chemical society, par exemple, est de 5,6 pour 3 946 articles publiés.

Aussi, à défaut d'une réflexion et d'investigations plus approfondies, ce paramètre a-t-il été écarté pour conduire notre étude exploratoire, au profit du simple dénombrement des citations. Ce qui ne signifie pas qu'il ait été ignoré lors des décisions d'acquisition qui ont suivi l'étude - l'importance des séries n'est plus à prouver, comme le montrent la fréquence des prêts et l'impatience avec laquelle elles sont attendues -, mais il conviendrait peut-être de faire deux classements distincts, l'un pour les séries, l'autre pour les périodiques.

Homogénéité et constante

Pour chacune des catégories citées précédemment, un nouveau classement a été opéré, selon le nombre décroissant de citations reçues en 1981 et 1982, relevées dans la section 1. Ces deux années de référence ont été retenues de préférence à la totalité, de manière à pouvoir effectuer des comparaisons immédiates avec le classement selon le coefficient d'impact et en prévision de travaux ultérieurs. L'observation d'un petit échantillon a révélé une homogénéité à première vue satisfaisante entre deux classements obtenus en retenant ces deux années ou la totalité. Bien entendu, une vérification plus systématique s'impose. Les classements obtenus pour chaque catégorie sont présentés sous la forme d'un tableau de sept colonnes 19, soit, de la gauche vers la droite : le titre abrégé du périodique (selon les règles de l'ISI), le nombre de citations, leur cumul, le pourcentage de citations par rapport au total de la catégorie, ce pourcentage cumulé, le coût du périodique, le coût cumulé (en dollars, catalogue Faxon 1986). A supposer que cette mesure quantitative constitue bien une expression au moins partielle de la valeur relative des périodiques, chaque tableau montre l'état idéal d'une collection, soit le 100 % de citations de la littérature couvrant une catégorie.

Leur intérêt le plus immédiat fut de donner une image de l'état des collections de la bibliothèque au regard de cette collection exhaustive, d'apprécier les choix opérés jusqu'alors, de repérer les forces et les faiblesses. Ils fournirent une mesure brute du pourcentage de la littérature citée que couvraient les acquisitions, révélant par un simple pointage le degré d'homogénéité des collections, un pourcentage brut de 50 % par exemple ayant une signification tout autre, selon qu'il est obtenu par l'addition en continu des titres les plus cités ou par une addition discontinue de titres éparpillés dans le classement.

Cet aspect, qu'une connaissance intuitive ou empirique ne saurait saisir au mieux que grossièrement, et qui, par cette technique, ressort précisément, constitue peut-être l'apport le plus original et le plus fécond de l'analyse de citations appliquée aux périodiques. La force d'une collection réside dans son homogénéité, c'est-à-dire dans la complémentarité qu'entretiennent ses diverses composantes. Les périodiques formant, par les citations, un réseau d'information, il faut veiller, si le but est bien de procurer au plus vite le document primaire, à disposer de mailles connectées, c'est-à-dire d'une fraction groupée de périodiques qui renvoient les uns aux autres, plutôt que d'un ensemble hétérogène fait de titres disséminés çà et là dans le classement et faiblement liés.

De plus, même si les périodiques du haut du tableau renvoient les uns aux autres avec une fréquence élevée, le recours très recommandé aux listes établissant et chiffrant les relations périodique cité/périodiques citant, périodique citant/périodiques cités (ensembles 3 et 4), autrement dit l'environnement d'un périodique, du plus proche au plus éloigné, permet de satisfaire au mieux cette exigence d'homogénéité. Ces tableaux et l'examen des listes cité/citant (et vice-versa) semblent suggérer qu'il est préférable, pour un coût identique, d'acquérir les trois ou cinq périodiques les plus cités d'une catégorie, plutôt que de perpétuer une collection faite des quinze suivants ou de davantage encore, mais disséminés, même si les taux cumulés de citations sont similaires dans les trois cas, car ces quinze ou vingt renverront beaucoup plus fréquemment aux trois premiers, qu'inversement.

Une constante semble d'ailleurs caractériser ces périodiques de chimie : pour les neuf catégories traitées, on atteint très vite un seuil de citations cumulées de 50 % ou plus, et ce dès le deuxième titre : 50,4 % pour la chimie analytique (sur 39), 77,7 % pour l'électrochimie (9 titres), 83,7 % pour les céramiques (8 titres); dès le troisième titre pour la chimie organique (37 titres), inorganique (32), générale (69); dès le quatrième pour les matériaux (34 titres), le cinquième pour la chimie physique (55), le sixième pour les polymères (35). Trente titres sur 318 cumulent plus de 50 % des citations, ce qui confirme, en première analyse, pour la chimie, l'existence d'un noyau de périodiques observée par l'étude de l'ISI de 1971. En termes de coût d'abonnement, on peut remarquer par exemple que les trois premiers titres de chimie inorganique reçoivent environ 53 % des citations et coûtent près de 20 000 F; que les huit premiers en reçoivent 77 % et coûtent 40 000 F, la totalité des titres valant plus de 80 000 F, les 23 % du bas du tableau valant autant que les 77 % du haut. Pour l'ensemble des catégories, le passage de 50 % à 75 % des citations reçues signifie le doublement du coût, de même que le passage de 75 % à l'exhaustivité. Ou encore, l'exhaustivité reviendrait quatre fois plus cher que la couverture de 50 %, et deux fois plus que celle de 75 %.

Usage et mésusage

Bien que cette étude n'ait pas été conçue dans la perspective d'un véritable plan de développement des collections - ce mode d'approche étant alors encore bien flou -, elle a dépassé le simple constat pour guider l'accroissement des collections de la bibliothèque autorisé par un supplément de crédits 20. Dans l'ensemble, les collections étaient déjà bonnes, voire très bonnes, dans certaines catégories, et leur niveau (en termes de % de citations) n'a pas été mesuré précisément. Par contre, le niveau final, obtenu après le comblement (ratifié par l'accord des usagers) de quelques grosses lacunes (chimie physique, polymères), et celui de quelques absences, moins importantes mais qui altéraient l'homogénéité de l'ensemble, a été porté à 88,8 % en moyenne (il dépasse aujourd'hui les 90 %) pour 8 catégories. Celle des matériaux, très déficitaire au départ puisque la collection représentait 10 % des citations, a fait l'objet d'un redressement particulier qui l'a menée à 60 %. Si on la prend en compte, la moyenne générale s'établit à 85,6 %.

Un seuil de 85 ou 90 % pourrait peut-être constituer une définition de l'exhaustivité si l'on considère, d'une part, que le coût du passage de 85/90 à 100 % serait quelque peu disproportionné par rapport au gain documentaire, car il faudrait acquérir une multitude de périodiques très très peu cités (ou faire jouer la coopération), et, d'autre part, que certains périodiques, au dire d'utilisateurs qualifiés, sont d'une qualité scientifique moyenne.

Le préjudice dû aux grosses lacunes n'était pas vraiment ignoré avant l'établissement des classements, mais il fut très clairement confirmé par la lecture du rang que ces titres occupaient et par l'observation des relations qu'ils entretenaient avec ceux déjà acquis. Autrement dit, on n'assiste pas au fur et à mesure du développement d'un classement (et surtout des colonnes de cumul) à l'émergence d'une révélation de plus en plus massive, et définitive lorsque s'inscrit le 100 %. Les périodiques de grande valeur sont connus, et à portée d'un non-spécialiste ou d'un néophyte. Pour ceux-là les classements confirment les jugements des utilisateurs, les « discrépances » s'observant plutôt pour quelques périodiques de rang moyen 21.

Ce qui importe davantage qu'une distribution parfaitement ordonnée qui discrimine à la citation près (ce dont on a au mieux une vague idée, même pour les titres les plus cités), c'est le poids relatif de chacun, qui doit être affiné par l'examen déjà évoqué des listes décrivant les relations d'un périodique avec ceux qu'il cite et ceux qui le citent, d'autant que les citations inter-catégories sont abondantes pour le noyau restreint des périodiques les plus cités.

Ce travail effectué à partir des classements, l'attention portée aux autres critères ou indices selon le type de décision à prendre (sans négliger la catégorie dite multidisciplinaire où figurent des périodiques comme Nature, Science, La Recherche), enfin la confrontation à d'autres méthodes devraient avantageusement remplacer les pseudo-certitudes, la sujectivité, l'inertie qui pourraient parfois tenir lieu de critères de sélection ou justifier l'immobilisme.

D'ores et déjà utilisés conjointement aux autres critères proposés, ces tableaux offrent assurément des éléments de décision teintés d'objectivité pour procéder à l'évaluation des forces et des faiblesses d'une collection, pour la réorganiser, l'accroître, la réduire, ou pour en créer une. Cette méthode permet d'estimer le coût total ou gradué d'un développement des collections ou de la résorption de lacunes et de faiblesses, laissant apparaître simultanément (peut-être un peu brutalement au regard de nos habitudes) le coût et l'estimation de la qualité.

Peut-être ne conviendrait-il pas, inversement, de céder sans trop de résistance à la fascination exercée par les' tableaux et les chiffres, d'adhérer inconsciemment à l'équation rassurante : mesure = rationalité = réalité, et de s'en tenir rigidement aux périodiques rangés en bon ordre, mû par une espèce d'esthétisme bibliothéconomique, ou de facilité. Les besoins des usagers peuvent motiver l'acquisition d'un périodique que la consultation d'un classement et le souci d'homogénéité inciteraient, eu égard aux ressources disponibles, à ne pas retenir. Le rang du périodique est alors un élément de décision parmi d'autres, comme le recours à la coopération. Et puis, les nouveaux périodiques étant très peu présents dans le JCR lors de la première année de publication, ce dernier n'est alors d'aucun secours, ce qui n'excuserait en rien l'absence de Organometallics ou de Langmuir des présentoirs. Ceci pour renouer (au moindre risque) avec l'attitude de Gross et Gross, qui osaient des recommandations.

Citation, niveaux, PDC...

Un autre aspect de ces tableaux, incontournable tant il est prégnant, qu'une méfiance excessive ne pourrait même oblitérer, est la notion de seuil ou niveau, celle-là même que les promoteurs de PDC recherchent et qui semble s'imposer tout (trop ?) naturellement à la lecture de la colonne des pourcentages de citations cumulés. Comme on le sait, l'un des principes directeurs d'un PDC est la fixation de niveaux, ceux des fonds acquis et ceux que l'on se propose d'atteindre. Or, à ce jour, s'il est recommandé d'en distinguer cinq, aucune norme les définissant n'est satisfaisante 22. Ce déficit qui compromet la rigueur de l'évaluation et la fiabilité de la coopération, incite donc à éprouver des méthodes comme l'analyse des citations. La tentation est alors grande d'ériger de tels tableaux en normes et de définir des niveaux par des pourcentages qui, en l'état actuel de la réflexion et de l'expérimentation, ne pourraient être que conventionnels (du type 30, 50, 60, 75, 90 par exemple), et ne devraient leur choix qu'à une certaine familiarité d'aspect et une facilité de repérage. Cette prudence n'est ni une dérobade ni un renoncement. On tient peut-être là une méthode et des données 23 qui pourraient bien devenir sinon LA norme, du moins un instrument valide et opératoire d'évaluation. Mais plutôt que d'en faire prématurément la voie royale, poursuivons les investigations, notamment vers les autres disciplines, afin de déterminer si la distribution des citations est comparable à celle observée en chimie, et s'il est envisageable de définir une gamme unique de niveaux ou s'il faut prévoir une échelle spécifique à chacune.

Même s'il est déraisonnable d'attendre d'une méthode qu'elle résolve tous les problèmes, on peut se prendre à rêver, et imaginer qu'un jour prochain le problème de la documentation scientifique en France soit enfin convenablement posé et efficacement traité. L'observation des tableaux de chimie suggère une possible redistribution des acquisitions documentaires des universités. Dans le cadre d'un Service commun de la documentation, ne pourrait-on envisager, en fixant par exemple le seuil définissant le noyau à 75 %, d'en attribuer l'acquisition à la bibliothèque universitaire et de répartir la « queue » (tail) entre les différentes unités d'enseignement et de recherche ? Le coût de cette distribution mériterait examen. On peut s'attendre à ce qu'il soit inférieur aux dépenses globales actuelles, qui ne couvrent même pas la totalité des besoins, grevées par une fâcheuse déperdition. Il se pourrait même que, localement, l'exhaustivité ne soit plus inaccessible. Chacun y trouverait peut-être son compte. De plus, sur une telle base, il semblerait en première analyse, que l'édification des PDC puisse être considérablement simplifiée et allégée. Rêvons. Ou essayons.

Annexe - Chimie inorganique / Chimie physique