Archives ouvertes et logiciels libres

Une alternative à la subordination des bibliothécaires aux éditeurs numériques ?

Roland Pintat

La subordination croissante des bibliothécaires aux éditeurs numériques les conduit, par réaction, à remplir des fonctions d’éditeurs électroniques. Le développement des archives ouvertes et des logiciels libres risque pourtant de ne pas améliorer la position des professionnels des bibliothèques dans le champ de l’information scientifique. En effet, une insuffisante formation scientifique et technique les place à la merci des universitaires et des informaticiens.

The growing subordination of librarians to digital publishers leads them by reaction to fulfil some functions of electronic publishers.. The development of open archives and free software, however, endangers the possibility of improving the position of professional librarians in the field of scientific information.. In fact, insufficient scientific and technical training puts them at the mercy of academics and computer scientists.

Die den Herausgebern digitaler Dokumente in immer grösserem Ausmass untergeordneten Bibliothekare haben sich gewehrt und angefangen, diese Aufgaben selbst auszuführen. Die Entwicklung von frei zugänglichen Archiven und von freier Software wird die Position der Fachgruppe auf dem Gebiet der wissenschaftlichen Information allerdings nicht verbessern, denn auf Grund einer ungenügenden, wissenschaftlichen und technischen Ausbildung sind Bibliothekare den Wissenschaftlern und Informatikern ausgeliefert.

La subordinación creciente de los bibliotecarios a los editores numéricos los conduce, por reacción, a cumplir funciones de editores electrónicos. El desarrollo de los archivos abiertos y de los programas informáticos libres corre el riesgo sin embargo de no mejorar la posición de los profesionales de las bibliotecas en el campo de la información científica. En efecto, una insuficiente formación científica y técnica los ubica a la merced de los universitarios y de los informáticos.

Les bibliothécaires dépensent une part croissante de leur budget à acheter des logiciels informatiques, ou à souscrire d’onéreuses licences d’accès auprès d’éditeurs numériques internationaux. Ces groupes, que la constitution de consortiums tels que Couperin n’impressionne guère, dépossèdent les bibliothèques de leur mission de conservation de la connaissance scientifique, en substituant à une logique d’archivage durable une logique d’accès éphémère à la documentation achetée.

Ils vont jusqu’à priver les bibliothécaires de leur mission de sélection de l’information et de leur fonction pédagogique, en composant leurs propres bouquets d’information numérique, enrichie chez les agrégateurs de contenu de services bibliographiques. Le rôle des bibliothécaires à l’avenir se limitera-t-il à celui de consommateurs et de garde-barrières des multinationales du numérique ? Il s’agit au fond de savoir si l’emprise des éditeurs numériques sur la publication en ligne n’est pas en train d’éliminer le bibliothécaire de la sphère de l’information scientifique, à mesure que le support numérique se substitue au papier. Par quels moyens limiter la subordination des professionnels des bibliothèques aux éditeurs numériques ? On verra que si les bibliothécaires étrangers, qui commencent à faire des émules dans l’Hexagone, ont imaginé des parades à cette inquiétante évolution, comme le développement des archives ouvertes ou des logiciels libres, il n’est pas sûr que ces initiatives améliorent sensiblement la position des bibliothécaires dans la sphère de l’information scientifique.

La subordination des bibliothécaires aux éditeurs numériques

Les bibliothécaires doivent supporter l’augmentation régulière du coût des produits proposés par les éditeurs numériques, qu’il s’agisse de logiciels de gestion documentaire ou de licences d’accès à des périodiques électroniques vendus par des intermédiaires. Les logiciels de gestion de l’information documentaire utilisés par les bibliothèques doivent développer des fonctionnalités de plus en plus complexes pour répondre à des besoins sans cesse étendus : une interface web, une plateforme Z 39-50, bientôt des bases de données « XML natives » tendent à devenir des fonctionnalités indispensables. Les potentialités des logiciels documentaires se multipliant, leur coût s’élève proportionnellement, comme d’ailleurs le prix des abonnements aux périodiques électroniques, dans un contexte de bouleversement de l’économie politique des publications scientifiques, déjà étudié par Ghislaine Chartron 1. Si les titres publiés en ligne foisonnent désormais 2 (les agences d’abonnements proposent dans leur bouquet d’abonnements entre 2 000 et 3 000 revues 3), la concentration financière s’accroît dans le secteur, donnant naissance à des groupes internationaux gigantesques tels qu’Elsevier. Conséquence à la fois de ce phénomène de concentration capitalistique et de la crise parallèle de certaines revues papier, le prix des abonnements aux périodiques s’envole. En bibliothèque universitaire, le coût des abonnements aux publications périodiques étrangères dans les secteurs de la médecine a augmenté de plus de 581 % entre 1980 et 1998 4. Dans tous les secteurs disciplinaires, les abonnements numériques pèsent de plus en plus lourdement sur les budgets universitaires.

Parallèlement, les éditeurs numériques développent une politique d’accès, privant les bibliothèques de leur mission ancienne de stockage de l’information scientifique. Plus grave encore, ils se substituent progressivement aux bibliothécaires dans leur mission pédagogique d’aide à la sélection de l’information. Les agrégateurs de contenu, tels que NetLibrary, Ebrary, Questia ou XanEdu 5 qui commercialisent des accès à des livres numériques, sélectionnent leurs titres en fonction des programmes universitaires et offrent toute une gamme de services bibliographiques en ligne. L’évolution a atteint un stade si avancé que certains universitaires commencent à se demander si les chercheurs ont encore besoin des bibliothèques et de leurs professionnels pour accéder à l’information scientifique 6. Comment les bibliothécaires peuvent-ils réagir à leur subordination croissante et se repositionner dans la sphère de l’information scientifique numérique dont ils sont progressivement évincés ? Une double parade a été imaginée par les chercheurs anglo-saxons, qui comptent en France plusieurs zélotes : le développement des archives ouvertes et des logiciels libres.

Les premières initiatives d’archives ouvertes

À l’origine des projets actuels d’archives ouvertes 7 se trouvent les scientifiques anglo-saxons. Soucieux de profiter des possibilités offertes par Internet pour développer la diffusion de l’information scientifique, ils ont créé les premières bases d’archivage en ligne. Paul Ginsparg a conçu à partir de 1991 au laboratoire de Los Alamos une base de pré- et de postpublications d’articles de physique, d’informatique et de mathématiques, arXiv.org 8. Au Royaume-Uni, Stevan Harnad a, un peu plus tard, élaboré un réservoir numérique de publications en psychologie et neurosciences, hébergé par l’université de Southampton, Cogprint 9. L’universitaire britannique est aussi à l’origine d’un logiciel permettant l’auto-archivage en ligne par les scientifiques de leur production, e-print.org 10.

Chercheurs et bibliothécaires n’ont pas seulement constitué des bases d’auto-archivage de leur production scientifique, ils ont aussi favorisé la publication sur le web de revues libres de droit. L’association américaine SPARC (Scholarly Publishing and Academic Resource Coalition), qui réunit plus d’une centaine de bibliothèques et de centres de documentation, se propose de remettre en cause le monopole de certaines revues en finançant de nouvelles publications moins onéreuses et mieux appropriées aux besoins des communautés scientifiques. SPARC finance par exemple la revue PhyChemComm dont l’abonnement est vingt fois moins coûteux que celui à la toute puissante Chemical Physics Letters, commercialisée par Elsevier 11. La version européenne de SPARC, SPARC-Europe 12, née en 2001, a encore du mal à prendre son envol, malgré les efforts de la Ligue des bibliothèques européennes de recherche (Liber) pour la promouvoir. Pour le moment, seules des associations professionnelles britanniques et néerlandaises contribuent à la financer.

L’OAI

Dès la fin des années 1990, la question s’est posée de fédérer ces différentes bases et de les rendre interopérables et « ouvertes », c’est-à-dire interrogeables simultanément. Il convenait, pour ce faire, de définir des protocoles de structuration et d’interrogation des données qui prennent valeur de normes. Telle a été l’ambition de l’Open Archive Initiative (OAI). La première réunion de l’OAI, qui a rassemblé des administrateurs d’archives numériques à Santa Fe, au Nouveau-Mexique, en octobre 1999, a jeté les bases organisationnelles et techniques d’une plus grande interopérabilité des archives scientifiques en ligne. De grands réservoirs de métadonnées, conformes au protocole OAI, seraient constitués afin d’identifier et de localiser des documents appartenant à des bases distantes. Le protocole OAI définirait moins un modèle de métadonnées (la plupart des expériences actuelles d’archives ouvertes ont adopté le Dublin Core pour les décrire) que les critères de fonctionnalités que doivent remplir tant le logiciel de collecte des métadonnées (Service Provider) que les bases de données scientifiques référencées au moyen des métadonnées (Data Provider).

Désormais, lorsque des archives sont conformes aux standards définis par l’Open Archive Initiative, des moteurs de recherche et autres outils peuvent traiter des bases distinctes et distantes comme un seul et unique fonds d’archives. L’utilisateur n’a plus besoin de savoir où un document est localisé pour accéder directement à son contenu et l’utiliser. Le protocole OAI et les conditions d’interopérabilité font encore l’objet de plusieurs projets de recherche en vue de leur amélioration, tels que Opcit 13. Cette initiative, qui réunit l’université Cornell, le laboratoire de physique de Los Alamos et l’université de Southampton, se propose de développer les liens entre les différentes archives ouvertes compatibles avec le protocole OAI. Toute référence à un article dans un document scientifique doit comprendre un lien direct vers le document source en texte intégral. Le projet Opcit entend promouvoir des outils informatiques et documentaires permettant d’établir automatiquement de tels liens.

Très vite, sous l’impulsion de personnalités telles que Jean-Claude Guédon 14 ou Stevan Harnad 15 et à la suite des interventions très virulentes des scientifiques américains 16 contre les éditeurs numériques, les initiatives en faveur des archives ouvertes ont été investies d’une forte signification politique. Au début du mois de décembre 2001, les bibliothécaires et les scientifiques qui se sont réunis à Budapest pour étudier de quelle façon promouvoir l’accès libre à la publication scientifique, via les archives ouvertes, ont adopté une déclaration retentissante, L’Initiative de Budapest pour l’accès ouvert (BOAI : Budapest Open Access Initiative 17). Les participants ont invité chercheurs et bibliothécaires à tout mettre en œuvre pour favoriser la publication gratuite et sans restriction de l’information scientifique validée, de façon à garantir son libre accès via Internet. La seule contrainte sur la reproduction et la distribution doit être de garantir aux auteurs un contrôle sur l’intégrité de leurs travaux et le droit d’être convenablement cité.

La constitution d’archives ouvertes en France

Les initiatives conduisant à la création d’archives ouvertes ont commencé à se développer dans l’Hexagone, surtout dans le secteur des sciences dures, mais avec beaucoup de retard sur les autres pays européens. Le centre de données astronomiques de Strasbourg gère plusieurs bases d’archives ouvertes, où il recueille toute l’information scientifique disponible en astronomie. Il pilote un projet qui doit aboutir à la définition d’un protocole d’interopérabilité applicable à toutes les ressources documentaires de la communauté astronomique. Comme c’est le cas en astronomie, les projets d’archives ouvertes français rassemblent le plus souvent une communauté disciplinaire désireuse de partager les résultats de sa recherche. L’Enssib, l’Urfist de Paris et l’université de Paris VII ont mis en place une archive ouverte dans le secteur de l’Information-Documentation, avec l’intention déclarée de favoriser le développement et la structuration de cette communauté.

Le CNRS n’est pas de reste dans le mouvement actuel de création d’archives ouvertes. L’un de ses services, le CCSD 18 (Centre pour la communication scientifique directe), développe des archives ouvertes en physique et dans les autres sciences de la nature, sans s’interdire d’apporter éventuellement un appui à des projets extérieurs en lettres et sciences humaines. Dans ce secteur, plusieurs initiatives voient aussi le jour. Le projet européen Hypernietzsche 19 se propose d’utiliser l’Internet pour faire communiquer les sources concernant Nietzsche et mettre en relation les chercheurs : le projet doit aboutir à constituer une archive ouverte comprenant à la fois des traductions des œuvres du philosophe allemand et les études ou articles le concernant.

Les Français participent aussi au projet international OLAC (Open Language Archives Community) 20, qui œuvre à la constitution d’une archive ouverte en linguistique. Il convient aussi de mentionner la constitution de bases de mémoires et de thèses par plusieurs universités (Lyon II, Marne-la-Vallée, etc.) et le développement du projet Cyberthèses 21 qui s’inscrit également dans le mouvement actuel de création d’archives ouvertes. Ce très fort engouement pour l’ « Open Archives 22 » ne saurait toutefois occulter les difficultés auxquelles se heurte son essor.

Les obstacles au développement des archives ouvertes

Notons tout d’abord que les recherches dans des bases d’archives ouvertes n’aboutissent pas encore à des résultats très fins. Du fait de l’imprécision du Dublin Core le plus souvent utilisé pour décrire les métadonnées, les résultats obtenus au moyen de logiciels compatibles OAI contiennent encore beaucoup de bruit. La mise en place d’archives ouvertes soulève aussi d’autres séries de problèmes 23, notamment juridiques. L’auto-archivage en ligne par un scientifique est en général légal sauf dans deux cas : lorsque le copyright a été cédé à un éditeur pour un texte faisant l’objet d’un paiement et lorsque le copyright a été cédé sans transaction financière à un éditeur de revue pour une version validée par les pairs et évaluée par un comité de lecture. Dans ces deux cas, le chercheur doit demander à modifier l’accord de cession du copyright afin d’autoriser l’auto-archivage. Si les chercheurs restent les uniques titulaires de la propriété intellectuelle comme du copyright sur la pré-publication non encore validée, force est de constater que la plupart des éditeurs refusent la pré-publication et que les chercheurs n’ont aucun moyen de leur imposer leur point de vue – et ce d’autant plus qu’ils n’ont pas d’autre alternative que de publier dans les revues qui font autorité s’ils veulent faire carrière.

La seconde catégorie de problèmes soulevés par le développement des archives en ligne est de nature économique. La diffusion numérique d’un document scientifique n’est-elle pas plus coûteuse que sa diffusion sur support papier ? Diverses évaluations réalisées tant au Royaume-Uni qu’au Québec conduisent à répondre par la négative : le coût de diffusion dans une archive ouverte est moins élevé que dans une revue papier. Mais sera-ce toujours le cas lorsque les bibliothécaires et les scientifiques développeront des services en ligne identiques à ceux des éditeurs ?

Un troisième obstacle, de nature scientifique cette fois, se profile, à savoir la reproduction illicite du document sur le web. La mise en ligne de leurs découvertes par les chercheurs ne va-t-elle pas se solder par un pillage de leur production scientifique ? À vrai dire, la copie frauduleuse s’est déjà développée avec le support papier (mémoire, thèse, etc.). Et la mise en ligne, en élargissant le public touché, a au moins le mérite d’améliorer l’impact des articles, notamment des jeunes chercheurs. Mais il demeure que le support numérique facilite la reproduction illicite : les universitaires remarquent depuis quelques années la multiplication des mémoires de recherche composés par simples copier-coller.

En admettant que ces difficultés puissent un jour être surmontées, les archives ouvertes, qui constituent une réponse efficace à l’emprise des éditeurs numériques sur l’information scientifique, contribuent-elles à revaloriser le rôle du bibliothécaire ? Rien n’est moins sûr. La plupart des initiatives qui ont abouti ont été le fait d’universitaires. Le site de prépublication scientifique Mathdoc 24, qui associe autour de l’université Joseph-Fourier de Grenoble une trentaine de laboratoires et de départements de mathématiques français, a été développé presque intégralement par des professeurs et des maîtres de conférences.

Pourquoi cette quasi-absence des bibliothécaires ? La constitution et l’administration des archives ouvertes s’apparentent à un travail d’édition scientifique et requiert une très haute compétence dans une ou plusieurs spécialités universitaires. Or, en France, bibliothécaires et conservateurs sont recrutés sur une base Bac + 3 ou 4, et ne disposent que rarement d’une compétence scientifique de niveau doctoral. Dans le cas de Mathdoc, les enseignants et chercheurs de mathématiques n’ont trouvé que fort peu de bibliothécaires suffisamment compétents en mathématiques pour collaborer avec eux. Autant dire que le développement des archives ouvertes en France libérera peut-être les bibliothécaires français de la tutelle des éditeurs numériques, mais risque aussi de les placer sous l’autorité scientifique des universitaires. L’analyse des enjeux de l’utilisation des logiciels libres conduit-elle à une conclusion analogue ?

L’enjeu des logiciels libres

Devant la hausse générale des coûts des logiciels informatiques commerciaux, un certain nombre de bibliothécaires anglo-saxons ont opté pour le logiciel libre encore appelé « Open Source 25 ». Contrairement à ce que le terme laisse augurer, « logiciel libre » n’est pas synonyme de « logiciel gratuit », mais de logiciel dont le code source est librement accessible, ce qui permet une correction très rapide des bugs : une fois développés, les logiciels libres sont souvent plus stables que leurs homologues commerciaux. C’est pour cette raison que le système d’exploitation Linux est souvent préféré à Windows.

Autre avantage, il s’agit de produits sur lesquels ne pèsent à peu près pas de droits de propriété (notamment intellectuels) et qui, par conséquent, coûtent beaucoup moins cher à l’achat que les logiciels conçus dans un cadre commercial. Mais ils exigent le plus souvent de nombreux développements techniques pour satisfaire les besoins des bibliothécaires : les fonctionnalités des logiciels libres sont nettement moins nombreuses que celles de leurs concurrents commerciaux. Leur perfectionnement doit donc se faire dans un cadre coopératif, afin d’en limiter le coût. C’est dire que les logiciels libres définissent à la fois un état d’esprit (gratuité, libre accessibilité), un mode d’organisation du travail (la coopération), et un modèle économique (les coûts proviennent principalement des développements du produit initial ; ils peuvent être partagés).

L’administration française essaie de généraliser l’usage des logiciels libres depuis quelques années. L’Atica 26 (l’Agence pour les technologies de l’information et de la communication dans l’administration) propose en ligne toute une série de logiciels libres à télécharger. Beaucoup d’entre eux présentent un intérêt pour les bibliothécaires. Zope 27 est un serveur d’applications qui permet de créer et de gérer dans un cadre collaboratif des sites dynamiques, comme des portails Internet et des plateformes de publication sur le web. SDX 28 associe à une base de données native en XML une interface de consultation puissante. Ce logiciel de gestion documentaire développé sous l’impulsion de la Mission de la recherche et de la technologie du ministère de la Culture et de la Communication a été utilisé avec succès par la bibliothèque universitaire de Paris VIII pour l’établissement d’un portail documentaire en psychologie appelé « Upsy 29 ». Parmi les autres logiciels libres dont l’usage est conseillé par l’Atica figurent aussi des moteurs de recherche et des plateformes d’enseignement à distance (Ganesha).

En dehors de cette liste, d’autres logiciels libres, tels que Koha, sont aussi susceptibles d’intéresser les professionnels des bibliothèques. Le logiciel libre Koha, conçu initialement par un groupe de bibliothécaires néo-zélandais sans beaucoup de moyens, aidé par un informaticien, fait désormais l’objet de développements assurés par des bibliothécaires et des informaticiens du monde entier. Koha exploite une base MySQL grâce à des développements Perl. En France, Nicolas Morin, conservateur à la bibliothèque de l’université de Nancy I - Henri-Poincaré, s’efforce d’établir des collaborations pour développer une version française du logiciel. Le travail ne manque pas : Koha ne comprend pour le moment que quelques modules (gestion des prêts, acquisition, catalogage). Il reste à normaliser la base pour que toutes les données qu’elle contient soient conservées au format Marc, et plus généralement à améliorer les fonctionnalités du logiciel afin qu’il puisse faire jeu égal avec des produits commerciaux haut de gamme.

On notera que les obstacles au développement des logiciels « Open source » sont légion. Les temps de développement demeurent importants, d’autant que les développeurs doivent prendre généralement sur un temps de travail déjà bien rempli pour le mener à bien. Et il est impossible d’évaluer si les dépenses consacrées au développement ne dépassent pas le coût d’un produit commercial équivalent. En outre, le niveau de technicité exigé pour introduire des améliorations informatiques paraît très élevé : rares sont les bibliothécaires assez compétents pour contribuer efficacement à l’amélioration du produit. En somme, si les logiciels libres ont le mérite d’atténuer la pression financière pesant sur les bibliothèques, ils contraignent les bibliothécaires à se placer à la remorque des informaticiens.

Au total, si l’OAI et les logiciels libres contribuent à limiter la pression des éditeurs numériques sur les bibliothécaires, leur développement n’en remet pas moins en cause la culture professionnelle de ceux-ci. L’insuffisance de leur formation scientifique et informatique les place sous la tutelle des universitaires et des informaticiens. Les professionnels des bibliothèques seraient-ils condamnés à devenir de simples supplétifs dans la nouvelle économie politique de l’information scientifique ?

Décembre 2002