Statistiques d'utilisation des ressources électroniques
Le projet Counter
L’accès aux ressources électroniques se développe de plus en plus dans les bibliothèques et services de documentation français. La connaissance des statistiques d’utilisation des revues et bases de données en ligne devient un enjeu important pour l’analyse des besoins et les décisions d’achat. L’article présente les recommandations du projet Counter qui deviennent une norme internationale pour le recueil et le traitement de données chiffrées.Statistics on the use of electronic resources: the Counter project
The access to electronic resources in French libraries and documentation services is increasing rapidly. The knowledge of usage statistics of online serials and databases becomes more and more important for needs analysis and decisions on acquisitions. The article describes the recommendations of the project Counter, which will become an international standard for the collection and exploitation of these statistics.
In französischen Bibliotheken und Dokumentationszentren entwickeln sich die Zugriffsmöglichkeiten auf elektronische Ressourcen immer schneller. Die Kenntnisnahme der Gebrauchsstatistiken von online Zeitschriften und Datenbanken wird zu einem entscheidenden Faktor für Bedarfsanalysen und Einkaufsentscheidungen. Die Richtlinien des Projekts Counter werden hier beschrieben, die sich zu einem internationalen Standard für die Erarbeitung von zahlenmässig erfassbaren Daten entwickeln.
El acceso a los recursos electrónicos se desarrolla cada vez más en las bibliotecas y servicios de documentación francés. El conocimiento de las estadísticas de utilización de las revistas y bases de datos en línea se han convertido en un reto importante para el análisis de las necesidades y las decisiones de compra. El artículo presenta las recomendaciones del proyecto Counter que se han vuelto una norma internacional para la recolección y el tratamiento de los datos cifrados.
La connaissance précise de l’utilisation des ressources électroniques en ligne est un enjeu majeur dans les négociations avec les éditeurs et pour la répartition des coûts d’accès. La question du « qui utilise quoi, quand et comment » détermine de plus en plus la politique tarifaire des éditeurs et le prix des licences, en particulier à un moment où l’on commence à progresser des « big deals 1 » vers un achat plus sélectif des ressources (13).
Cette question influence également la répartition des dépenses et coûts entre organismes, unités de formation, laboratoires, facultés, services, etc. – un aspect crucial pour les consortiums et établissements multisites/multiservices.
Les chiffres d’utilisation ont aussi servi à justifier, surtout dans les premières années d’accès, les dépenses et demandes budgétaires pour les revues et bases de données en ligne. Mais comment mesurer cette utilisation, comment la suivre dans le temps, comment aussi comparer les chiffres donnés par les différents éditeurs, hébergeurs et autres agrégateurs ?
Vers un renouvellement des savoir-faire bibliothéconomiques ?
La conduite d’une politique documentaire au sein d’une bibliothèque se fait par la confrontation de considérations bibliothéconomiques (constitution, cohérence et suivi des collections, demande des usagers…) et de considérations économiques (budget d’acquisition et coûts de la documentation scientifique). Pour les bibliothèques universitaires et de recherche, compte tenu des coûts de la documentation scientifique, cette confrontation a souvent été source de crises budgétaires.
Peu de données sur la consultation des collections imprimées ont pu apporter un éclairage capable de mieux orienter les décisions de la politique documentaire. Dans le domaine des sciences, techniques et médecine (STM), la fourniture de documents a parfois livré des indices sur les tendances de la consultation, comme l’identification des titres les plus ou les moins demandés, en vue d’un réabonnement ou d’un désabonnement. Cette « méthode » d’évaluation de l’intérêt économique d’un réabonnement, répandue dans le milieu professionnel, est à l’origine de la question suivante : « Doit-on accéder ou doit-on acquérir ? » (9). La politique documentaire des bibliothèques a ainsi pu, dans certains cas, être mieux ciblée.
Aujourd’hui, la conduite d’une politique documentaire se fait en fonction des contraintes du cadre contractuel de licences qui se sont imposées comme modalité d’accès à la documentation scientifique. Les bibliothèques n’acquièrent plus des documents physiques, mais un accès à distance à des documents en ligne. Cet accès se fait par l’intermédiaire du réseau, qui devient un support d’enregistrement et de recueil possible des données de consultation. Cette reconfiguration laisse entrevoir la possibilité de recueillir des données chiffrées sur l’utilisation des ressources en ligne et de permettre leur exploitation statistique (17). Pour les bibliothèques, les enjeux de cette question sont de deux ordres, indissociables et majeurs : l’un relatif à la politique documentaire, l’autre aux ressources financières à investir dans le cadre de cette politique documentaire.
Il nous semble toutefois pertinent de préciser que les vecteurs de diffusion étant différents d’un domaine à un autre, les enjeux décrits ci-dessus ne revêtent pas la même importance selon le domaine concerné et, a fortiori, d’une bibliothèque à une autre ; le face-à-face STM-SHS, avec le droit et les sciences économiques en position médiane, en est une illustration typique (2). Les travaux de Christine Okret-Manville (11) et de Claude Jolly (7) concourent à pointer l’inégalité de la couverture documentaire électronique, d’un domaine à un autre et parfois d’une bibliothèque à une autre à l’intérieur d’un même domaine.
Ainsi donc, pour une bibliothèque, il n’est plus question de réajuster son périmètre documentaire avec de simples tendances, mais avec des données précises, qui permettent aux professionnels d’utiliser au mieux leurs budgets pour répondre à la demande de leurs usagers. De manière corollaire, ces données fournissent aux professionnels des bibliothèques des arguments concrets lors de leurs négociations avec les éditeurs, pour obtenir de ces derniers qu’ils infléchissent leurs prix.
La fourniture de données précises nous semble d’autant plus importante aujourd’hui que l’actualité des négociations des consortiums en Amérique du Nord et en Europe montre que les bibliothèques voient leur poids s’amoindrir dans le bras de fer inflexible des éditeurs.
L’Association of Research Libraries (ARL) tire la sonnette d’alarme et rapporte qu’en 2003 (3), « face aux renouvellements de contrats, sur les 57 bibliothèques interrogées, 5 ont déjà supprimé au moins un package, 22 bibliothèques envisagent de le faire et 16 autres bibliothèques pourraient le faire au vu des difficultés budgétaires qu’elles rencontrent ».
Le consortium de l’OhioLINK avait, pour sa part, publié une étude (14) faisant état de l’explosion de la consultation due à l’intégration massive des bouquets électroniques. Cependant, au bout de quelques années et une fois l’effet de nouveauté passé, les membres du consortium ont constaté les limites de leurs budgets, et, en 2005, le consortium a décidé d’entreprendre une politique d’évaluation des titres afin d’en améliorer la sélection (« unbundling »). Par ailleurs, des institutions prestigieuses et richement dotées, comme Harvard, envisagent de se désengager de certains de ces bouquets afin de se donner le temps de mieux penser leur politique documentaire.
Car, principale clientèle des éditeurs, les bibliothèques sont la première cible des augmentations des coûts des périodiques. Si elles souhaitent continuer à se regrouper pour acquérir leurs ressources électroniques, elles doivent être conscientes des enjeux de l’exploitation des données quantitatives concernant la demande faite à leurs collections.
En France, le dispositif d’acquisition de ressources électroniques le plus significatif du réseau universitaire, Couperin 2, du fait de l’absence de données de consultation, ne permet pas encore d’envisager une démarche d’évaluation similaire à celle des pays anglo-saxons. Un tel traitement de données exploitables permettrait d’identifier les tendances de la consultation et de se pencher sur leur signification.
Le cadre d’interprétation tiendrait à la fois des spécificités de l’offre du consortium, de la politique documentaire des services communs de documentation (SCD) et de leurs objectifs de couverture documentaire et de diffusion de l’information. Ceci permettrait aussi de dégager les insuffisances de l’offre électronique commerciale et de la réajuster aux priorités des SCD. Le but ultime serait de donner des arguments concrets aux professionnels des bibliothèques lors des renégociations de bouquets, en termes d’offre et/ou de prix.
Il est toutefois quelque peu surprenant de constater qu’en comparaison avec les débats et discussions animés dans d’autres pays, cette question reste peu soulevée dans la communauté professionnelle française. Quelques messages diffusés sur la liste Biblio.fr manifestent une préoccupation certaine, mais on ne rencontre pas encore de réflexion qui laisserait entrevoir une mobilisation nationale.
Soulignons que les acquisitions des ressources électroniques, particulièrement des périodiques en ligne, sont en accroissement : les résultats de l’enquête sur les ressources électroniques pour l’année 2001, repris dans l’Annuaire des bibliothèques universitaires de l’année 2001, montrent que le nombre des titres de périodiques en ligne dans le réseau universitaire français a augmenté de 148 % 3. En corollaire, les dépenses documentaires sont en augmentation : plus de 82 % entre 1998 et 2001, 19,4 % d’augmentation annuelle pour les périodiques (10). Comme le précise Claude Jolly, cette augmentation ne donne « qu’une image amoindrie de la réalité : on sait en effet que la facturation des périodiques électroniques ne prend le plus souvent en compte qu’un surcoût calculé en fonction de la charge des abonnements sur papier » (7).
Après avoir dirigé leurs efforts sur l’offre et sur l’intégration de cette offre dans leurs fonds, les bibliothèques devraient désormais prendre conscience des enjeux de son implication dans la compréhension de la demande. Aujourd’hui, le rôle des bibliothèques ne se limite plus à une offre de services. C’est aussi une confrontation de l’offre à la demande des communautés scientifiques, destinée à mieux cerner les exigences de leurs publics et à éventuellement savoir si elles peuvent ou veulent y répondre (5).
Approches pour une harmonisation des statistiques
En résumé, les professionnels de la bibliothèque ont besoin de statistiques pour quatre raisons : évaluer les différents produits et services en ligne, mieux argumenter les décisions d’achat, planifier l’infrastructure technique et promouvoir les services de la bibliothèque.
Or ces données sont livrées avec une périodicité, un format et un traitement variables, hétérogènes, parfois à l’état brut. En outre, leur présentation varie d’un éditeur à l’autre. Certains éditeurs ne communiquent tout simplement aucune information sur l’usage de leurs ressources. Et, quand cette information existe, est-on sûr de bien comprendre ce qui a été compté ? Quel est le sens exact de « search », « request », « turnaway », « full-text download » ou « session » ? Que faut-il entendre par « item » ou « article » ? Tous les éditeurs définissent-ils ces notions de la même façon, les comptent-ils de manière comparable ?
Pour être utiles, les statistiques doivent être crédibles, cohérentes et compatibles (= les « trois C » ; 16). Or, le plus souvent elles ne le sont pas. C’est pourquoi, au milieu des années 1990, une prise de conscience du problème a débouché sur des efforts d’harmonisation et de normalisation de la collecte et de la présentation des statistiques (5 ; 16).
Citons parmi les tentatives les plus significatives les recommandations de JSTOR pour mesurer l’usage des ressources sur le web et, en découlant, celles d’Icolc pour la collecte et diffusion de ces données (recommandations de 1998 mises à jour 2001), qui servent aujourd’hui encore de standard de facto pour les éditeurs – même si beaucoup d’entre eux ne les appliquent pas.
De son côté, l’association des bibliothèques de recherche américaines (ARL) a financé dès 1998 une étude sur les mesures pour évaluer d’une manière exhaustive et efficace l’usage des ressources électroniques (1).
D’autres démarches ont suivi, de portée plus limitée, parfois aussi au niveau d’un seul pays (12). Une seule initiative cependant a réussi à intégrer les différents projets et approches, à fédérer les principaux protagonistes et acteurs et à susciter suffisamment d’adhésion et de dynamisme pour devenir, en deux ans, une sorte de norme internationale pour les statistiques d’utilisation : le projet Counter (Counting Online Usage of Networked Electronic Resources).
Objectifs du projet Counter
Counter a vu le jour en mars 2002 4. La première année a été consacrée à faire connaître le projet, surtout auprès de l’industrie de l’information, et à préparer des recommandations. La version 1 du Code de bonnes pratiques de Counter (en abrégé, code Counter) a été publiée en janvier 2003 à l’adresse des bibliothécaires, éditeurs et autres fournisseurs d’information. Ce code donne des orientations sur les données à mesurer, leur définition, le contenu et format de leur présentation (rapports), ainsi que sur l’exploitation et l’évaluation des données.
L’information sur Counter est assurée principalement via le site du projet hébergé par l’Institut of Physics 5. Promotion du code et formation se font lors de conférences (en 2003 à New York, Munich, Nîmes, etc.), d’ateliers et de stages sur site. Il existe également une liste de diffusion 6. En 2003, afin de pérenniser le travail du projet, a été créé « Counter Online Metrics », une société à but non lucratif de droit anglais. Pour faire connaître ce projet en France et faciliter la compréhension des recommandations, l’Institut de l’information scientifique et technique (Inist) a traduit, avec l’accord du directeur de projet, les documents de référence en français 7.
Le projet Counter est conçu comme un « code de bonnes pratiques » unique, international, flexible, permettant de mesurer l’utilisation des produits et services en ligne d’une manière crédible, cohérente et compatible, en s’appuyant sur les données fournies par le fournisseur.
Le code Counter spécifie le format, le contenu, la périodicité et le mode de transmission des statistiques pour des revues et bases de données sous forme de sept « rapports d’utilisation » (« usage reports »). Le niveau de base pour mesurer l’utilisation des revues est le « journal report 1 » qui chiffre le nombre de requêtes réussies d’un article en texte intégral, par revue et par mois (cf. tableau).
Chaque revue est identifiée par son titre et son ISSN (print et/ou online). Le tableau indique également le cumul annuel pour chaque revue et le cumul mensuel pour l’ensemble des titres.
Les autres « rapports » incluent entre autres les interrogations sans accès au texte intégral, le format du document (HTML, PDF), ou le nombre de séances et les chiffres concernant les bases de données.
Pour la transmission des données, Counter préconise deux formats (fichiers .csv ou .xls), la mise à disposition sécurisée sur un serveur, une périodicité au moins mensuelle, une mise à jour dans les quatre semaines après la fin du mois et une information sur l’année en cours n et l’année n–1.
Bilan intermédiaire et perspectives
Aujourd’hui, le « Journal report 1 » est en train de devenir un standard pour les éditeurs. Les plus importants éditeurs et fournisseurs d’information produisent déjà des statistiques d’utilisation « conformes à Counter », ou se mettent progressivement en conformité avec le code : Elsevier, Blackwell, Wiley, OUP, Nature, Muse et HighWire figurent sur la liste, ainsi que l’American Chemical Society, ISI, Ebsco et, plus récemment, Swets 8. La production des éditeurs « conformes » représenterait 40 à 50 % des articles de revues à facteur d’impact.
En marge de la conférence annuelle de l’UKSG, fin mars 2004 à Manchester, Counter Online Metrics a tenu sa première assemblée générale. À cette date, la société comptait 114 membres dont 42 éditeurs et intermédiaires (« vendors »), 29 consortiums, 29 bibliothèques et 14 autres (associations professionnelles, lobbys…). L’objectif est d’atteindre 150 à 200 membres. Bien qu’il s’agisse d’une participation internationale, il n’y a pas encore de membres francophones.
Les principes d’audits ont été déterminés, une DTD XML pour les rapports d’utilisation a été publiée sur le site du projet en juillet 2004, et cinq sites sont en phase d’évaluation pour analyser comment le code Counter fonctionne et est réellement appliqué. La prochaine assemblée générale aura lieu en 2005 aux États-Unis.
La première version du code se concentre sur l’utilisation des revues et bases de données, produits qui représentent traditionnellement la majeure partie des budgets documentaires des bibliothèques. Les versions ultérieures élargiront le champ d’application de Counter à de nouveaux types de contenus, mais aussi à des niveaux plus détaillés de mesures pour chacun d’entre eux.
Une seconde version de ce code entrera en vigueur en 2006 ; le texte validé se trouve sur le site du projet depuis mars 2005. En fait, cette version n’apporte qu’une légère modification au premier code, tenant compte de l’évaluation en cours (ex. : ajout du nom de l’éditeur et de la distinction HTML/PDF dans le « Journal report 1 »).
Le document de travail d’un code pour des livres électroniques (« books and reference works »), accessible lui aussi sur le site du projet depuis janvier 2005, est ouvert à commentaires et critiques jusqu’en décembre 2005, pour devenir effectif en 2006 ou 2007.
Le principe d’une harmonisation et simplification des statistiques d’utilisation rencontre un vif succès. Les ateliers Counter figurent depuis 2003 parmi les formations les plus demandées des conférences annuelles du UK Serials Group. Début octobre 2004, la NFAIS a mis les statistiques d’utilisation à l’ordre du jour d’une réunion internationale à New York. Dans les négociations, la conformité avec les recommandations Counter est de plus en plus utilisée par les éditeurs comme argument de vente, et par les bibliothèques comme critère d’évaluation et de sélection.
En France, l’accès aux revues et bases de données en ligne progresse rapidement. Les négociations se poursuivent à un rythme annuel et trisannuel, et les éditeurs français commencent à « aller sur le web ». Dans ce contexte, les statistiques revêtent une importance grandissante et stratégique. Supposons que les professionnels des bibliothèques rattrapent très vite leur retard, prennent conscience des enjeux, organisent des formations aux statistiques et exigent des éditeurs et fournisseurs des données d’usage fiables et utiles. Espérons alors que les éditeurs qui, aujourd’hui, commencent à publier des revues en ligne, inclueront dès le début ces statistiques dans leurs cahiers des charges.
Février 2005