Série « Les 50 ans du Centre international de l’ISSN », n° 2/4 • Le pouvoir des identifiants dans un monde connecté

Carol Riccalton

Les identifiants font la loi !

J’ai un aveu à faire. Je suis une « geek » des identifiants. Soyons clairs : je ne suis pas un génie des mathématiques et je préfère de loin les mots à une série d’additions. Cependant, les identifiants occupent une place particulière dans mon cœur. Je les apprécie grandement, en particulier ceux qui sont utilisés dans le monde de l’édition et qui prennent la forme de suites de chiffres ou de chiffres et de lettres apparemment sans aucun sens.

Bibliothécaire de métier, j’ai passé une vingtaine d’années à travailler à l’Office des publications de l’Union européenne (OP). Pour rappel, l’OP est le service de publication des institutions, agences et autres organes de l’Union européenne (UE). En tant que tel, il est le « point central d’accès au droit de l’UE, ainsi qu’aux publications, données, résultats de recherche, avis de marchés publics et autres informations officielles » 1

. L’OP joue donc un rôle central dans l’information du public sur ce que l’UE fait, et il joue le rôle d’« éditeur » pour les informations produites par l’UE. Mon travail à l’OP m’a amenée à m’intéresser de près aux identifiants depuis plus de vingt ans, car ils jouent un rôle clé dans l’interconnexion des contenus diffusés par l’UE et la fourniture de services aux utilisateurs.

Il y a quelques années, j’ai eu l’occasion d’assister à PIDapalooza, une conférence dédiée aux identifiants. Les organisateurs, à savoir la Californian Digital Library, Crossref, DataCite, NISO et ORCID, s’étaient inspirés de Lollapalooza, un festival de musique estival californien, pour trouver le nom de la conférence. Le nom PIDapalooza était censé rappeler, en particulier pour les Nord-Américains, l’excitation d’un festival de musique pop, mais dont les têtes d’affiche étaient des identifiants pérennes (PID) plutôt que des stars du rock. J’ai été ravie d’avoir l’occasion d’assister à la première conférence, qui s’est tenue à Reykjavik. Lorsque j’ai fait part à un collègue de mon enthousiasme pour cette conférence, il a supposé que je me réjouissais de cette mission en Islande - oh, c’est bien là qu’elle se tenait ? Je n’avais pas noté le lieu de la conférence. Je ne pensais qu’à l’opportunité de me concentrer sur les identifiants pendant quelques jours. En toute franchise, le lieu de la conférence m’importait peu, seul le sujet m’intéressait.

Pourquoi faut-il aimer les identifiants ?

Selon moi, les identifiants jouent un rôle essentiel en reliant les métadonnées aux éléments qu’ils décrivent. Les identifiants sont les héros méconnus du monde de l’édition, car ils permettent de lier des informations avec précision, de les rendre faciles à découvrir et accessibles à ceux qui en ont besoin. J’apprécie particulièrement l’aspect communautaire des identifiants. Ce ne sont pas de simples clés informatiques. Ils sont gérés par des groupes d’individus passionnés qui se consacrent à leur développement, à leur maintenance et à leur amélioration. Ces communautés, composées de bibliothécaires, d’éditeurs, de chercheurs et de spécialistes des technologies de l’information, travaillent dur pour s’assurer que les identifiants restent pertinents, efficaces et adaptables au paysage en constante évolution de la création et de la diffusion de l’information. Leurs efforts de collaboration, motivés par une passion commune pour l’organisation, la normalisation et l’innovation, ont donné naissance aux systèmes d’identification robustes que nous connaissons aujourd’hui et qui sont à la base de l’écosystème des données et de l’information.

De quels identifiants parlons-nous ?

Dans cet article, je me concentrerai sur les trois principaux identifiants utilisés dans le monde de l’édition, c’est-à-dire le numéro international normalisé du livre (ISBN), le numéro international normalisé des publications en série (ISSN) et l’identifiant d’objet numérique (DOI). J’ai eu l’occasion de travailler avec ces trois identifiants, puisque l’OP est agence d’enregistrement pour ces identifiants respectivement depuis 2001, 2002 et 2004.

On entend parfois dire qu’il y a trop d’identifiants. À l’OP, cette question nous est parfois posée par les auteurs. Nous répondons alors que chaque identifiant possède ses propres atouts et est adapté à des formats et des types de contenu spécifiques. Lorsque nous attribuons des identifiants aux contenus publiés par les institutions européennes, nous n’avons pas une approche monolithique. Nous devons prendre en compte les caractéristiques spécifiques du contenu identifié. En utilisant le bon identifiant pour le bon usage, nous pouvons nous assurer que notre contenu est décrit avec précision, qu’il est facile à découvrir et qu’il est accessible par le public visé. N’oublions pas que les identifiants contribuent également à la conservation à long terme. Cette diversité d’identifiants doit être considérée comme une force, et non comme une faiblesse, car elle nous permet de fournir un cadre riche et détaillé pour organiser et relier nos contenus.

Au commencement était l’ISBN

Tous les amateurs de livres connaissent l’International Standard Book Number (ISBN) mais il est surprenant de constater que peu d’entre eux en comprennent pleinement l’utilité. Il est souvent sous-estimé et mal compris. Il y a quelques années, je discutais avec une amie qui venait de commencer à utiliser LibraryThing, un logiciel qui vous permet de gérer vos collections de livres personnelles. Elle m’avait contactée alors qu’elle ressentait quelque frustration au moment d’enregistrer dans le catalogue son premier livre, un de ses favoris. Le système ne cessait de lui proposer l’édition américaine au lieu de l’édition britannique. Essayant de comprendre le problème, j’ai exprimé ma surprise quant au fait que l’ISBN qu’elle utilisait pour enregistrer son livre donnait un résultat erroné. Elle a semblé embarrassée et a dû admettre que, même si elle connaissait l’ISBN, elle n’avait jamais pensé qu’il lui serait utile ici. Une fois qu’elle a commencé à l’utiliser, elle a pu télécharger l’ensemble de sa collection très rapidement. L’ISBN a identifié avec précision l’édition et le format corrects de chaque livre de sa collection, et a même récupéré les métadonnées pertinentes pour compléter tous les champs.

Cette anecdote peut sembler anodine mais elle illustre une idée fausse très répandue au sujet de l’ISBN. Nombreux sont ceux qui ignorent la puissance et la polyvalence de cet identifiant unique, qui sous-tend le commerce mondial des livres et qui est également utilisé par les bibliothèques, qu’elles soient publiques ou privées. L’ISBN ne reçoit peut-être pas toujours la reconnaissance qu’il mérite, mais son impact sur le monde du livre est indéniable.

Pour rappel, l’ISBN est un concept qui a vu le jour en 1966 et a été introduit par le libraire britannique W. H. Smith. Il s’agissait de résoudre un problème réel : l’entreprise était en train de mettre en place un entrepôt de livres informatisé et avait besoin d’un identifiant unique pour gérer sa chaîne d’approvisionnement. Ce projet a suscité un grand intérêt et l’Organisation internationale de normalisation (ISO) s’est impliquée, ce qui a abouti à la reconnaissance de l’ISBN en tant que norme internationale (ISO 2108) en 1970.

Au fil des ans, l’ISBN a évolué pour couvrir non seulement les livres dans leur intégralité, mais aussi les chapitres, les œuvres multimédias et d’autres contenus. Son succès durable peut être attribué à sa capacité à s’adapter de manière transparente à l’évolution du paysage de l’édition, tout en restant fidèle à son objectif principal : fournir un identifiant normalisé et unique pour le contenu publié. Alors que l’industrie de l’édition continue de changer et de se développer, l’ISBN a démontré sa polyvalence et sa résilience, consolidant sa position en tant que pierre angulaire du monde du livre.

Le système ISBN est géré par l’Agence internationale de l’ISBN, dont les activités sont supervisées par un conseil d’administration. Ces directeurs sont élus parmi les agences d’enregistrement responsables de l’attribution des ISBN dans leur pays et leur communauté. Les agences sont elles-mêmes issues du monde des bibliothèques et de l’édition, souvent représentées par des bibliothèques nationales ou des associations d’éditeurs. Cette combinaison de collaboration au niveau mondial et de compréhension approfondie des besoins du paysage éditorial national est ce qui rend le système si efficace, garantissant que l’ISBN demeure adapté aux besoins des communautés qu’il dessert. J’ai le privilège de siéger au conseil d’administration depuis plusieurs années et j’apprécie la diversité de mes collègues membres du conseil, qui viennent de différentes parties du monde et représentent des associations d’éditeurs et des bibliothèques nationales.

À l’Office des publications, nous attribuons un ISBN à toutes les monographies. Nous ne vendons pas de livres car le contenu de nos publications est mis à disposition gratuitement sur notre site web 2

. Même si nous ne sommes pas directement concernés par le commerce du livre, l’ISBN permet à nos publications d’apparaître sur les étagères des bibliothèques virtuelles du monde entier et dans les collections des services de recherche. Nous gérons les préfixes pour les éditeurs européens en fonction de leur production éditoriale au cours des cinq années précédentes. Dès qu’ils ont formellement enregistré leur travail (y compris le nombre de langues et de formats à produire) dans notre système de production, les ISBN sont attribués à leurs livres dans ce système de manière semi-automatique. Nous devons parfois contacter les auteurs pour obtenir des précisions sur le contenu car nous veillons à ne pas attribuer d’ISBN à ce qui pourrait être considéré comme des documents éphémères, y compris des prospectus et des articles. De manière générale, l’attribution des ISBN ne nécessite pas d’intervention humaine. Ce service est particulièrement apprécié par nos auteurs. Outre les avantages évidents que représente la présence de leurs ouvrages dans les catalogues et les bases de données aux côtés de ceux des éditeurs commerciaux, ils estiment que l’ISBN confère une certaine autorité à leur travail car il est perçu comme un gage d’authenticité.

Puis vint l’ISSN

Le numéro international normalisé des publications en série (ISSN, International Standard Serial Number) a une histoire intéressante, parallèle à celle du numéro international normalisé du livre (ISBN). Le besoin a émergé dans le monde de l’édition, qui cherchait un identifiant normalisé pour les publications en série, telles que les revues, les magazines et les journaux. En réponse, l’American National Standards Institute (ANSI) a élaboré une norme d’identification des publications en série, publiée en 1971 sous le titre ANSI Z39.9, également connue sous le nom de Serial Publication Number (SSN). Cette norme fournissait un identifiant unique pour chaque publication en série au niveau du titre, ce qui facilitait le catalogage, l’indexation et la diffusion de ces publications. À peu près à la même époque, l’ISO a commencé à rédiger une norme pour un identifiant international, qui allait devenir l’ISSN. La première édition de la norme ISO a été publiée en 1975 et a été régulièrement révisée et mise à jour depuis lors.

En ce qui concerne son organisation, un accord a été signé en 1974 entre la France et l’Organisation des Nations unies pour l’éducation, la science et la culture (UNESCO) pour établir le Centre international de l’ISSN à Paris. Le Centre a été chargé de coordonner l’attribution des ISSN dans le monde entier, de maintenir l’intégrité de la norme et d’apporter son soutien aux centres nationaux et aux éditeurs. Aujourd’hui, le Centre international de l’ISSN joue un rôle crucial en garantissant la cohérence et l’unicité des ISSN dans les différents pays et les différentes langues. Comme dans le cas de l’ISBN, l’agence centrale est soutenue par sa communauté d’utilisateurs, composée d’agences d’enregistrement qui attribuent des ISSN au niveau national. Grâce aux réunions annuelles de cette communauté et aux réunions régulières de son conseil d’administration, elle veille à ce que la norme reste adaptée à l’évolution du paysage. Au fil des ans, la norme a été révisée pour tenir compte de l’émergence des publications électroniques et des contenus en ligne.

Les informations produites par l’UE sont souvent mises à disposition par le biais de bulletins d’information et de revues. Grâce à notre stratégie de publication multilingue et à notre approche de production multiformat pour répondre aux exigences en matière d’impression, d’accès en ligne et d’accessibilité, le même contenu est souvent disponible dans 24 langues et dans deux ou trois formats. L’ISSN nous permet de relier toutes ces productions différentes afin qu’un utilisateur final puisse voir ce qui est produit dans différentes langues et différents formats. L’ISSN contribue non seulement à améliorer l’accessibilité mais aussi à faciliter la gestion globale de ces titres.

L’ISSN s’est avéré extrêmement utile au fur et à mesure que l’UE s’est élargie à de nouveaux États membres et, par conséquent, à de nouvelles langues. Il nous a permis de relier les titres des nouvelles langues à leurs titres « frères » et d’offrir ainsi à nos utilisateurs une expérience en ligne rationalisée, quelle que soit la langue dans laquelle ils effectuent leurs recherches.

À l’OP, nous avons l’habitude de créer des notices de métadonnées distinctes et individuelles pour chaque numéro d’une publication en série, plutôt que de créer une notice au niveau du titre, comme c’est le cas dans les bibliothèques. Nous utilisons ensuite l’ISSN figurant dans les métadonnées de ces numéros individuels pour créer un lien sur notre portail permettant aux utilisateurs de cliquer et de voir tous les autres numéros de cette publication.

Nous gérons l’attribution des ISSN via notre système de production et alimentons régulièrement le registre international de l’ISSN. Cette tâche peut s’avérer difficile car les auteurs n’apprécient pas toujours pleinement les avantages d’un titre clé stable, qu’ils modifient souvent par petites touches à chaque nouvelle publication. Toutefois, ils ont compris l’objectif de cet identifiant et ont amélioré petit à petit leur respect des règles concernant les titres.

Comme pour l’ISBN, l’OP contribue activement au réseau ISSN. Grâce à ce groupe, il est en mesure d’échanger les meilleures pratiques et son expertise avec les autres membres du réseau et de contribuer à l’évolution permanente de la norme ISSN.

Et enfin le DOI

Comme les deux identifiants précédents, le DOI (Digital Object Identifier) est né d’un besoin exprimé par l’Association américaine des éditeurs (AAP). Une citation de Tim Berners-Lee résume très bien la question :

« Qu’est-ce qui fait un URI cool ?

Un URI cool est un URI qui ne change pas.

Quels types d’URI changent ?

Les URI ne changent pas : ce sont les gens qui les changent. » 3

X

https://www.w3.org/Provider/Style/URI (URI = Uniform Resource Identifier.)

Lorsqu’Internet a commencé à se développer dans les années 1990, le problème de la publication du contenu et de son transfert vers un nouveau site ou une nouvelle page web s’est posé de manière très concrète. Le défi consistait à identifier ce contenu mobile d’une manière normalisée, à créer un identifiant pérenne et fiable pour ce contenu, quel que soit l’endroit où il était déplacé. Pour répondre à ce besoin, la Fondation internationale DOI a été créée pour gérer ce nouvel identifiant appelé Digital Object Identifier. Dès le début, il y a eu une certaine confusion quant à savoir si cet identifiant ne s’appliquait qu’au contenu numérique. J’ai eu la chance de rencontrer Norman Paskin, qui a été le moteur de la création et de l’adoption de ce nouvel identifiant. Il a toujours insisté sur le fait que le DOI était l’identifiant numérique d’un objet, et NON l’identifiant d’un objet numérique. L’idée était que le DOI pouvait être appliqué à n’importe quoi et, en effet, la réalité montre est qu’il est appliqué à un large éventail d’objets, des articles de journaux et des livres aux films, et même aux matériaux de construction.

Comme pour l’ISBN et l’ISSN, il existe une communauté active derrière cet identifiant, composée des différentes agences d’enregistrement qui forment le conseil d’administration de la Fondation DOI. Bien que ces agences proviennent souvent de domaines d’activité différents, elles sont unies dans leur engagement à développer des services basés sur cet identifiant pérenne en les partageant avec d’autres agences afin de construire des solutions centrées sur l’utilisateur. Toutes les agences partagent la responsabilité de maintenir l’infrastructure centrale, ce qui permet à la Fondation DOI de se développer en fonction des besoins de sa communauté.

L’OP a été l’une des premières organisations à adopter cet identifiant. Au début, nous l’avons appliqué à toutes les publications qui possédaient également un ISBN. C’est à peu près à la même époque que nous avons commencé à prendre contact avec les bibliothèques intéressées par l’intégration de notre collection dans leurs catalogues en réutilisant nos métadonnées. La présence d’un DOI dans les métadonnées que nous partagions avec elles leur donnait l’assurance que notre contenu électronique ne disparaîtrait pas du jour au lendemain et qu’elles pouvaient l’inclure dans leurs catalogues en toute confiance. Rapidement, des services de découverte ont également pris nos métadonnées pour les inclure dans leurs collections.

Le DOI a été essentiel pour nous lorsque nous avons fermé notre ancien site web, EU Bookshop, et ouvert notre nouveau portail. En théorie, tous nos DOI auraient renvoyé un message d’erreur 404 si nous n’avions pas mis à jour l’URL dans les métadonnées de tous nos DOI, de sorte que le jour du passage d’un site à l’autre, tous nos DOI ont également été modifiés et ont continué à mener les utilisateurs vers le contenu identifié. Notre expérience a prouvé que l’objectif initial du DOI, qui était de fournir une redirection transparente à toute personne possédant le lien, était atteint.

Cependant, certains ne comprennent pas le mécanisme du DOI et croient qu’il se passe quelque chose de magique dans les métadonnées. L’un de nos auteurs institutionnels a commencé à utiliser le DOI pour identifier les articles publiés dans sa revue en ligne. Nous lui avons fourni les capacités techniques pour qu’il crée lui-même ses DOI. Tout s’est très bien passé jusqu’au jour où il a transféré tout son contenu sur un nouveau site web. Il nous a alors contactés car aucun des DOI attribués ne fonctionnait. Comment cela était-il possible puisque nous lui avions dit que le DOI pointerait toujours vers le contenu qu’il identifiait ? Nous avons dû expliquer que l’aspect « magique » du DOI était que, pour l’utilisateur, le DOI pointait toujours vers le contenu, qu’il ait été déplacé ou non. Cependant, les métadonnées des DOI devaient être mises à jour par l’éditeur pour refléter ce changement. Comme il s’agissait d’une procédure relativement simple, les métadonnées de plusieurs centaines de DOI ont été mises à jour en une seule opération et le service a été immédiatement rétabli.

L’utilisation des DOI à l’OP s’est beaucoup développée et nous l’appliquons aux articles de revues, aux ensembles de données, et même aux subventions. Ceci nous permet désormais d’identifier les figures et les tableaux dans les publications et de les relier aux sources des données originales. Ainsi, le lecteur d’un rapport de l’UE peut voir un tableau présentant des statistiques et cliquer sur le DOI pour accéder aux données brutes.

Nous avons également travaillé avec d’autres agences d’enregistrement pour assurer l’interopérabilité entre nos DOI, de sorte qu’un utilisateur recherchant les métadonnées d’un DOI n’a pas besoin de savoir quelle agence d’enregistrement l’a émis, ce qui permet d’offrir un service transparent.

Pour finir

Ces trois identifiants ont tous résisté à l’épreuve du temps parce qu’ils étaient basés sur des besoins réels. De toute évidence, le fait qu’ils soient tous devenus des normes ISO a contribué à leur succès mondial mais je pense sincèrement que ce qui leur permet de rester pertinents, ce sont les communautés impliquées dans leur utilisation quotidienne.

Voici donc pourquoi je suis une mordue des identifiants. Les identifiants ne sont pas simplement des chaînes de caractères et/ou de chiffres. Pour ceux d’entre nous qui ont passé des années à travailler avec eux, ils représentent les héros méconnus du monde de l’édition. Le numéro international normalisé du livre (ISBN), le numéro international normalisé des publications en série (ISSN) et l’identifiant d’objet numérique (DOI) sont les clés qui permettent d’accéder à toute l’information.

En tant que bibliothécaire passionnée d’identifiants, j’ai pu constater l’impact qu’ils peuvent avoir sur la façon dont nous découvrons, accédons et partageons l’information. De l’ISBN comme solution à un problème réel dans la chaîne d’approvisionnement des livres au rôle du DOI dans la création d’un identifiant pérenne et fiable pour le contenu numérique, chacun de ces identifiants a une histoire unique à raconter.

Ce qui rend ces identifiants si spéciaux, ce sont les communautés qui les animent. Les agences d’enregistrement, les éditeurs, les bibliothécaires et les chercheurs qui travaillent ensemble au développement, à la maintenance et à l’application de ces identifiants témoignent de la puissance de la collaboration et de la normalisation. Ce sont eux qui veillent à ce que ces identifiants restent pertinents, efficaces et adaptables au paysage en constante évolution de la création et de la diffusion de l’information.

Si nous nous tournons vers l’avenir, il est clair que les identifiants continueront à jouer un rôle essentiel dans la manière dont nous gérons et partageons l’information, même en ces temps d’émergence de l’intelligence artificielle. Les connexions dans le monde de l’information ne sont pas « magiques » : elles sont étayées par des identifiants et les métadonnées qui leur sont associées. Chacun de ces identifiants a une force unique et un objectif spécifique, et ensemble ils fournissent un cadre riche et détaillé pour organiser et connecter nos contenus.

La prochaine fois que vous verrez l’un de ces identifiants, prenez le temps de regarder au-delà du numéro lui-même, de vous souvenir de l’histoire qui le sous-tend et de la communauté qui le rend possible. Ces identifiants peuvent sembler insignifiants mais ils sont les éléments constitutifs d’une infrastructure mondiale de l’information qui est essentielle à notre vie quotidienne. Et pour ceux d’entre nous qui sont passionnés par les identifiants, nous savons qu’ils ne sont pas seulement des chiffres et des lettres : ils sont les clés qui permettent de déverrouiller le pouvoir de la connaissance.

*

Article traduit de l’anglais par Gaëlle Béquet, directrice du Centre international de l’ISSN.