La numérisation des sources de l’histoire de l’art :

la bibliothèque numérique de l’Institut national d’histoire de l’art

Anne Weber

Préfiguration virtuelle de la future bibliothèque de l’Institut national d’histoire de l’art (INHA), qui regroupera en 2012, dans la salle Labrouste du quadrilatère Richelieu, la collection de son actuelle bibliothèque, constituée par Jacques Doucet, et celles de la Bibliothèque centrale des musées nationaux et de la bibliothèque de l’École nationale des beaux-arts, la bibliothèque numérique de l’INHA propose en ligne des sources numérisées de ces trois bibliothèques partenaires. Cet article explique le positionnement de cette base au sein du paysage numérique de l’histoire de l’art, les choix techniques et les évolutions à venir.

The INHA digital library is a virtual precursor to the future INHA library, scheduled to open in 2012 in the Labrouste Room at the Richelieu site, which will bring together the current library collection built up by Jacques Doucet together with the collections from the central library for the national museums network and the Ecole Nationale des Beaux-Arts. The digital library offers on-line digital resources for the three partner libraries. The article explains the library’s intended role in the field of digital art history, the technological decisions involved, and future developments.

Als virtuellen Vorgeschmack der zukünftigen Bibliothek des Nationalen Instituts für Kunstgeschichte, welches 2012 im Labrouste-Saal des Quadrilatère Richelieu die Sammlung seiner aktuellen Bibliothek, angelegt von Jacques Doucet, und jene der Zentralbibliothek der nationalen Museen und der Bibliothek der nationalen Kunsthochschule zusammenfassen wird, bietet die digitale Bibliothek der INHA online digitalisierte Quellen dieser drei Partnerbibliotheken an. Dieser Artikel erklärt die Positionierung dieser Datenbank inmitten der digitalen Landschaft der Kunstgeschichte, die technische Auswahl und die künftigen Weiterentwicklungen.

Prefiguración virtual de la futura biblioteca del Instituto nacional de historia del arte (INHA), que reagrupera en 2012, en la sala Labrouste del cuadrilátero Richelieu, la colección de su actual biblioteca, constituida por Jacques Doucet, y aquellas de la biblioteca central de los museos nacionales y de la biblioteca de la escuela nacional de bellas artes, la biblioteca digital del INHA propone en línea fuentes digitalizadas de estas tres bibliotecas socias. Este artículo explica el posicionamiento de esta base en el seno del paisaje digital de la historia del arte, las elecciones técnicas y las evoluciones por venir.

En 1908, Jacques Doucet, couturier reconnu, amateur d’art et de littérature et mécène visionnaire, fondait une bibliothèque destinée à faciliter la recherche en histoire de l’art, alors peu développée (cf. encadré ci-dessous). Cent ans plus tard, la collection, léguée en 1918 à l’université de Paris puis intégrée en 2003 à l’Institut national d’histoire de l’art (INHA), se compose de plusieurs centaines de milliers de ressources fort variées et prolonge son développement en proposant depuis deux ans aux internautes une bibliothèque numérique aujourd’hui riche de 210 000 images  1. Comment cette base se positionne-t-elle au sein du paysage numérique de l’histoire de l’art ? Quels choix techniques nécessite-t-elle ? Et quelles évolutions cet outil récent doit-il connaître compte tenu des constantes avancées de son univers virtuel ? À travers la présentation d’un contexte et de choix particuliers, les questions posées rejoignent les préoccupations de bien des bibliothèques d’art et d’autres disciplines.

Aux origines de la bibliothèque, le don de Jacques Doucet

En 1908, le couturier Jacques Doucet (1853-1929), collectionneur et mécène, décide d’ouvrir sa bibliothèque aux chercheurs et aux amateurs en histoire de l’art et en archéologie. Il recrute des bibliothécaires qui s’appuient sur les conseils de spécialistes de chaque domaine : universitaires, conservateurs de musées, galeristes, pour rassembler la documentation la meilleure et la plus complète.

Il acquiert aussi les sources de l’histoire de l’art tant manuscrites qu’imprimées. Il fait établir des fichiers, copier des documents d’archives et établir des dossiers par sujets. Il crée également une photothèque consacrée à l’art.

Il constitue une importante collection d’estampes, objet d’étude mais aussi source d’inspiration offerte aux artistes, et occasion pour lui d’exercer un mécénat souvent déterminant pour la carrière des graveurs.

Il promeut des programmes de recherche et s’investit personnellement dans la création de sociétés érudites dont il finance les publications. Pour diffuser les résultats de la recherche, il fonde le Répertoire d’art et d’archéologie.

En 1918, il donne la Bibliothèque d’art et d’archéologie à l’université de Paris qui l’installe en 1935 au sein de son nouvel Institut d’art.

En 1993, la bibliothèque est installée dans le quadrilatère Richelieu, comme première pierre de l’Institut national d’histoire de l’art.

 

Martine Poulain

Directrice de la bibliothèque de l’INHA

martine.poulain@inha.fr

    Place dans l’offre numérique en histoire de l’art

    On peut assigner maints objectifs à une bibliothèque numérique : recherche scientifique, diffusion de la connaissance au plus grand nombre, valorisation de fonds précieux, conservation de documents fragiles par leur mise à disposition en ligne. D’abord conçue pour les chercheurs, la bibliothèque numérique de l’INHA n’en répond pas moins à ces divers usages, tout en essayant de se positionner clairement dans un paysage numérique en histoire de l’art très diversifié.

    Qu’est-ce que la bibliothèque numérique de l’INHA ?

    Les sources de l’histoire de l’art, bibliographiques, manuscrites ou iconographiques, sont de plus en plus accessibles en ligne. Chercheurs et conservateurs concourent ensemble à une dématérialisation qui peut prendre diverses formes : bases textuelles ou illustrées (dictionnaires en ligne, inventaires, bibliographies, iconothèques), accessibles sur internet ou dans les salles de lecture des bibliothèques. Les bibliothèques numériques, encyclopédiques ou spécialisées, s’appuient sur un ou plusieurs fonds de bibliothèques, mêlant ainsi sources textuelles et iconographiques très variées : livres imprimés, manuscrits et fonds d’archives, estampes, dessins, photographies sur papier ou plaques de verre.

    La bibliothèque numérique de l’INHA, spécialisée en histoire de l’art, reflète la richesse de la collection constituée par Jacques Doucet, la première à avoir intégré l’INHA. Les écrits les plus précieux y côtoient les œuvres de dessinateurs (souvent architectes), graveurs et photographes majeurs de l’histoire de l’art français. Pivot de la bibliothèque numérique de l’INHA, cette collection est complétée par des documents conservés à la Bibliothèque centrale des musées nationaux et à la bibliothèque de l’École nationale supérieure des beaux-arts, toutes deux partenaires de la bibliothèque de l’INHA et destinées à la rejoindre, en tout ou en partie, pour former en 2012 une nouvelle bibliothèque située dans la salle Labrouste du quadrilatère Richelieu (cf. encadré ci-dessous). Préfiguration virtuelle de ce projet, la bibliothèque numérique de l’INHA se fonde sur un patrimoine séculaire dont la mise en ligne perpétue le vœu formulé par Jacques Doucet d’une mise à disposition libérale des ressources en histoire de l’art et du développement corollaire de cette discipline. En effet, c’est un des avantages du virtuel que de permettre de rapprocher des documents physiquement éloignés mais intellectuellement complémentaires et de faciliter ainsi le travail de l’historien d’art.

    L’Institut national d’histoire de l’art

    Créer une grande bibliothèque d’art en France

    L’une des missions principales de l’Institut national d’histoire de l’art est la préparation d’une grande bibliothèque de recherche en histoire de l’art et archéologie. Cette bibliothèque résultera de la fusion des trois plus grandes bibliothèques d’art françaises :

    • La Bibliothèque d’art et d’archéologie, fondée par le couturier et mécène Jacques Doucet au début du XXe siècle, est devenue depuis le 1er janvier 2003 la bibliothèque de l’Institut national d’histoire de l’art, collections Jacques Doucet, riche de 1,3 million de documents. Elle est actuellement située en salle ovale dans le quadrilatère Richelieu.
    • La Bibliothèque centrale des musées nationaux, développée essentiellement depuis les années 1920, aujourd’hui installée au palais du Louvre, offre 265 000 documents.
    • Les collections imprimées patrimoniales de l’École nationale supérieure des beaux-arts, (128 000 imprimés).

    Cet ensemble exceptionnel est riche au total de 1,7 million de documents. Il sera complété par la présence proche de la bibliothèque de l’École nationale des chartes, riche de 155 000 ouvrages.

    Cette bibliothèque sera déployée en salle Labrouste après la rénovation du quadrilatère Richelieu. Elle ouvrira à l’automne 2012.

    465 places de lecture et 265 000 livres et périodiques en libre accès seront à la disposition des lecteurs. La bibliothèque sera ouverte aux enseignants-chercheurs, aux conservateurs, à tous les professionnels du monde de l’art, aux étudiants à partir de la maîtrise.

     

    Martine Poulain

      Contenus et contours de la bibliothèque numérique de l’INHA

      Le principe fondateur de la bibliothèque numérique de l’INHA a été la mise à disposition – dans le respect des droits d’auteur – des ressources les plus variées possible. Pour l’heure, il s’agit essentiellement d’œuvres d’auteurs français, sélectionnées par les conservateurs de la bibliothèque de l’INHA et les historiens de l’art travaillant au département des Études et de la Recherche de l’INHA. Les ouvrages en trop mauvais état pour subir une manipulation assez longue sont écartés. Les programmes de numérisation, initiés en 2002, soit un an après la fondation officielle de l’INHA, ont d’abord été consacrés aux sources iconographiques et manuscrites des trois bibliothèques partenaires. Jusqu’à la fin 2003, l’imprimé a occupé une place modeste au sein des programmes. Toutefois, la numérisation, dès 2002, d’un premier lot de catalogues du Louvre antérieurs à 1920 laissait présager l’importance croissante qu’il revêtirait. En 2007, le dernier lot en a été numérisé et ce sont bientôt environ 400 catalogues qui seront consultables en ligne. Mais c’est un autre corpus d’imprimés, celui des classiques de l’histoire de l’art, qui constitue la colonne vertébrale de la bibliothèque numérique de l’INHA (cf. article de Dominique Morelon, « Une bibliothèque numérique pour l’histoire de l’art », dans ce dossier). D’ici à 2012, environ 900 volumes de classiques seront consultables. Au 31 octobre 2008, 6 974 documents de tous types, dont 1 167 recueils et 5 807 pièces, ont été mis en ligne.

      Si la bibliothèque numérique de l’INHA repose essentiellement sur les caractéristiques des trois bibliothèques partenaires et sur les choix des chercheurs, qui lui confèrent toute sa cohérence, elle doit se définir également en fonction des autres bases existantes. De fait, le paysage des bibliothèques numériques relatives à l’histoire de l’art est très diversifié et somme toute assez complexe. Certaines bibliothèques numériques généralistes comme Gallica  2 présentent un intérêt certain pour le chercheur en histoire de l’art, les périodiques spécialisés y côtoyant des ouvrages généraux, notamment sur l’histoire de la gravure ou la photographie, ou des récits de voyages. D’autres sont plus spécialisées, telle Architectura (mise en œuvre par le Centre d’études supérieures de la Renaissance) qui propose des livres anciens d’architecture  3. D’autres enfin intéressent l’histoire de l’art à la marge, mais peuvent s’avérer utiles. C’est le cas du Conservatoire numérique des arts et métiers (Cnum), qui permet la consultation des comptes rendus d’expositions universelles et notamment de leurs sections artistiques  4.

      La bibliothèque numérique de l’INHA occupe une place spécifique au sein de ce paysage. Il ne s’agit pas d’une bibliothèque encyclopédique, puisqu’elle se consacre à l’histoire de l’art et à l’archéologie, mais elle explore un grand nombre des spécialités de cette vaste discipline. Archéologie, architecture, sculpture et peinture, histoire des jardins, guides de Paris y cohabitent avec les livres de fêtes, les dessins d’architecture, les estampes, les photographies anciennes, les catalogues anciens du Louvre. La bibliothèque numérique de l’INHA n’est pas pour autant isolée dans sa catégorie, puisque des établissements étrangers ont créé de nombreuses bases du même type. Citons, entre autres, l’espace « Resourcen » du portail Arthistoricum.net  5, qui regroupe des périodiques et des ouvrages d’art numérisés par diverses bibliothèques allemandes et notamment la bibliothèque de l’université d’Heidelberg, les différentes bases (livres de fêtes, sources de l’art italien…) proposées par le Warburg Institute  6, ou enfin la bibliothèque numérique du Getty Research Institute  7.

      Public visé ou supposé

      Comme toutes ces bases, la bibliothèque numérique de l’INHA s’adresse avant tout à un public de chercheurs, et plus particulièrement aux historiens de l’art et de l’archéologie. Les historiens du livre peuvent également trouver un intérêt à la consultation des classiques de l’histoire de l’art de la période moderne dont les reliures ont été numérisées, ainsi que, le cas échéant, les ex-libris ou les notes manuscrites. Les spécialistes des disciplines connexes à l’histoire de l’art, et notamment les historiens, peuvent quant à eux consulter avec profit les guides de Paris ou les livres de fêtes. Plus largement, l’accès à la bibliothèque numérique de l’INHA étant libre et gratuit, tout internaute amateur d’art et de patrimoine peut la découvrir.

      Tel est le public visé, et le public supposé, en l’absence d’enquête de public à ce jour. Il est vrai que, si les programmes de numérisation ont commencé il y a six ans, la bibliothèque numérique n’a d’existence sur le web que depuis avril 2006 et ne s’accroît que progressivement. Une enquête de public est donc peut-être encore prématurée. Un constat s’impose toutefois : plus la bibliothèque numérique s’enrichit, non seulement par la quantité, mais par la diversité de ses ressources, plus ses statistiques de consultation augmentent  8. Il semblerait également, étant donné la jeunesse de cet outil, que les manifestations exceptionnelles qui lui sont liées, telle l’exposition qui s’est tenue l’année dernière dans la Galerie Colbert  9, aient un impact, permettant de la faire connaître et d’accroître le nombre de ses visiteurs potentiels.

      Le numérique appliqué à l’histoire de l’art : choix techniques

      Un programme de numérisation se pense avant de se réaliser. Sa définition intellectuelle et technique représente un travail sans doute plus important que la numérisation elle-même. De même, l’on ne peut se lancer dans une opération de numérisation sans vision à moyen terme du devenir de la collection numérique en matière d’enrichissements et de mise à disposition.

      Illustration
      BLOUET, Guillaume-Abel (1795-1853). [Ensemble de dessins réalisés lors de l’expédition scientifique de Morée]. Projet pour la page de titre du 3e volume. Cote NUM PC 7738 (85). Provenance : Bibliothèque de l’École nationale supérieure des beaux-arts

      La question des métadonnées et du signalement

      Après avoir examiné leur intérêt scientifique, leur valeur patrimoniale, leur état matériel, le bibliothécaire ne tarde pas à se poser cette éternelle question : les documents à numériser sont‑ils bien inventoriés et décrits ? Leur visibilité sur internet en dépend. S’assurer de l’existence de descriptions, les collecter si elles se trouvent dispersées dans différents catalogues, les compléter en cas de lacunes… autant d’actions qui viennent donc s’ajouter à la liste des préalables indispensables à une opération de numérisation.

      Les notices de la bibliothèque numérique de l’INHA sont structurées selon les principes de l’Unimarc. Les autorités (auteurs principaux et secondaires) sont renseignées à l’aide des listes de la BnF et de certains dictionnaires spécialisés. L’indexation matière est réalisée en Rameau. Cependant, à l’avenir, l’enrichissement de la bibliothèque numérique par la mise en ligne de fonds très spécialisés pourrait justifier l’emploi de thésaurus plus ciblés, par exemple le thésaurus iconographique de Garnier  10 ou le TGN  11, utile pour les images représentant des lieux et sites (notamment archéologiques) peu connus.

      Les métadonnées descriptives ne forment pas le seul vivier où puiser des éléments de recherche. On parle de métadonnées de structure pour désigner les composantes d’un document (ses chapitres et sous-chapitres, par exemple). Elles permettent de feuilleter plus facilement un document numérique et, si elles peuvent faire l’objet de recherches, constituent un point d’entrée efficace et direct dans les documents, en ayant pour avantage d’amener moins de bruit documentaire qu’une recherche plein texte. En histoire de l’art, la frontière entre ces deux types de métadonnées (descriptives et de structure) est perméable. S’il semble logique qu’une gravure illustrant un livre ancien fasse partie des métadonnées de structure, il est intéressant de la décrire en tant que document à part entière, pourvu de métadonnées descriptives complètes.

      La bibliothèque numérique, interface de consultation des documents numérisés, n’est pas pour autant le seul point d’accès vers ceux-ci. Ils sont également signalés dans le catalogue de la bibliothèque. Celui-ci revêt une grande importance pour une bibliothèque numérique de création récente car il permet de la faire connaître aux lecteurs de la bibliothèque de l’INHA. Les notices du catalogue ne sont pas conçues de la même façon que celles de la bibliothèque numérique. Alors que la logique de la bibliothèque numérique de l’INHA consiste à décrire les originaux, la logique de l’Opac de la bibliothèque de l’INHA consiste à décrire, même sommairement, les caractéristiques de l’exemplaire numérique, puisque c’est ce qui fera sa spécificité au milieu des autres ressources conservées à la bibliothèque. Il est à noter que les documents numériques catalogués ne donnent pas lieu à une simple exemplarisation mais à une création de notice afin de permettre le filtrage des recherches sur leur type.

      Indispensables points d’accès aux images, les métadonnées sont au cœur des stratégies de mise à disposition des documents.

      Exigences liées à la variété des documents numérisés

      Format, résolution, définition… Ce sont peut-être les choix liés à l’acquisition des images que craignent le plus les bibliothécaires. Ceux que la bibliothèque de l’INHA a faits s’expliquent par ses moyens matériels et les caractéristiques des documents numérisés. Ne disposant pas d’atelier de numérisation interne, elle a recours à des prestataires externes par le biais de marchés. Ceux lancés par l’INHA tendent à la pluri-annualité. Ils sont souvent divisés en lots techniques prenant en compte les différences des documents à numériser. Ainsi, l’actuel marché (2007-2010) a pour principal volet la numérisation des classiques de l’histoire de l’art du XIXe siècle, volet divisé en deux lots, l’un consacré aux documents non fragiles pouvant être numérisés chez le prestataire, et l’autre aux ouvrages les plus fragiles ou les plus lourds (in-folio et in-plano) nécessitant l’installation de l’atelier du prestataire à la bibliothèque.

      Le cahier des charges puis les fiches de travail associées à chaque volume fixent le détail de la prestation attendue. Jusqu’à présent, l’INHA n’a acquis de fichiers qu’en mode image étant donné l’importance des documents iconographiques et manuscrits ainsi que des imprimés anciens, tous impossibles ou très difficiles à convertir en mode texte. Cependant, une évolution est indispensable avec la mise en ligne des catalogues anciens du Louvre et la numérisation actuelle de classiques du XIXe siècle, documents dont le plein texte devra pouvoir être soumis aux requêtes des internautes.

      Le format prédominant d’acquisition, le JPEG  12, pourra sembler atypique. Il s’explique par sa maniabilité, son taux de compression étant facilement réglable. Ainsi, les images, acquises et conservées en JPEG 12 (on parle de « fichiers sources »), sont mises en ligne, après compression, en JPEG 7. Il est vrai que la conversion en JPEG des fichiers « bruts de scan » obtenus par le prestataire entraîne une compression causant la perte d’informations (très peu perceptible par l’œil humain). Mais, de ce fait, tout en restant d’excellente qualité, des fichiers JPEG occupent moins de place sur un serveur que des fichiers TIFF. Enfin, ce format, normalisé  13, fait partie des formats recommandés par la Direction du livre et de la lecture et les Archives de France  14.

      La numérisation d’illustrations nombreuses et essentielles à la recherche en histoire de l’art implique des choix spécifiques de couleur et de résolution. La numérisation en RVB  15 (24 bits par pixel), c’est-à-dire en couleur, est adoptée pour tout document ancien, afin de rendre au mieux les particularités du papier, pour toute page et spécialement illustration colorée, pour les reliures, ou pour tout document présentant un faible contraste entre papier et encre. De même, si une page de texte imprimé peut être numérisée à 200 ou 300 dpi, une gravure ou un dessin, en fonction de la finesse du trait, exigera une résolution de 400 à 600 dpi devant permettre des zooms suffisants tout comme pour certains manuscrits et photographies. Cette exigence se vérifie d’autant plus que la taille du document original est petite. La numérisation d’un microfilm d’estampes, par exemple, ne peut produire de résultats satisfaisants qu’à 2 400 dpi. Ces choix techniques induisent la conservation de fichiers plus lourds, ce qui a conforté le choix du JPEG comme format de fichiers sources. Le mode de numérisation doit donc avant tout s’adapter à la collection numérisée tout en respectant normes et usages.

      Système de consultation et d’administration

      Toute bibliothèque numérique repose sur un serveur permettant le stockage de ses données et sur un logiciel, progiciel ou ensemble logiciel plus complexe permettant leur organisation, leur gestion et leur consultation. Certains établissements possédant les moyens humains et techniques nécessaires décident de bâtir de toutes pièces un système propre sur la base d’un serveur leur appartenant. D’autres préfèrent la solution, moins audacieuse et plus coûteuse mais prête à l’emploi, de l’hébergement sur serveur externalisé entretenu par un prestataire et sur lequel est implanté un logiciel adéquat. D’autres encore choisissent un prestataire proposant un système standard mais paramétrable en fonction de leurs vœux et installé sur un serveur dont ils sont les propriétaires, la maintenance et les évolutions du système étant assurées par le prestataire. Enfin, la solution du logiciel libre tend à se développer.

      Depuis ses débuts, l’INHA a voulu se doter d’un système multimédia adapté à ses besoins. Ce système, appelé Agorha  16 et actuellement en cours d’élaboration, comprendra de nombreuses bases, dont la bibliothèque numérique. Il eût été frustrant d’attendre sa mise en œuvre pour mettre à disposition des internautes les images accumulées depuis 2002. C’est pourquoi la bibliothèque numérique s’est dotée d’un système de consultation provisoire dont les données seront rapatriées sous Agorha. Cette interface a été mise en œuvre par la société Arkhênum à partir du logiciel Picturelan. La même société possède et entretient le serveur sur lequel sont hébergées les données.

      La mise en place d’Agorha devrait garantir la réalisation d’évolutions majeures, tant en termes d’administration qu’en termes de consultation. Les -procédures de chargement seront allégées grâce au traitement automatique de certaines tâches, telles la compression des fichiers et la pose de la mention légale sur les images. Une indexation plus contrôlée – indispensable du fait de l’intégration de plusieurs autres bases sur le système – facilitera l’accès aux ressources. Des recherches transversales sur la bibliothèque numérique, les multiples bases en histoire de l’art conçues par les chercheurs de l’INHA, les inventaires des fonds patrimoniaux de la bibliothèque ou sur le Répertoire d’art et d’archéologie numérisé seront possibles. Les métadonnées de structure, saisies dans une base à part entière du système, seront interrogeables. Enfin, des projets, mis en veille tant que se maintient le système « provisoire », pourront se réaliser, notamment l’océrisation des imprimés du XIXe siècle qui rendra possibles les recherches en plein texte, ainsi que la mise en place de passerelles fondées sur le protocole OAI  17.

      Illustration
      DU RAMEAU, Louis-Jacques. Catalogue des Tableaux du Cabinet du Roi, placés à la Sur-Intendance des Batimens de Sa Majesté à Versailles. Fait en l’Année 1784 par l’ordre de Monsieur Le Comte d’Angiviller (1730-1809). Vue 11, 2e pièce du cabinet. Cote NUM 0032. Provenance : Bibliothèque centrale des musées nationaux

      Les problématiques actuelles

      On le voit, la bibliothèque numérique de l’INHA, à l’instar de bien d’autres, est aujourd’hui en pleine mutation. La reprise de ses données sous Agorha ainsi que l’accroissement de ses collections la poussent vers de nouveaux horizons.

      Le partage des données

      La bibliothèque numérique de l’INHA définit ses programmes en partenariat avec d’autres établissements afin d’éviter les doublons. En effet, si la notion de doublon a un sens pour les documents papier – il est évidemment heureux de pouvoir trouver la même édition d’un même ouvrage en plusieurs endroits – les doublons numériques se justifient plus difficilement. Certes, un même document peut avoir été numérisé différemment par deux établissements. L’un peut avoir choisi une résolution élevée pour une meilleure visualisation des illustrations, l’autre peut avoir privilégié la rédaction de textes de présentation et l’élaboration de métadonnées de structure plus complètes. Il n’en reste pas moins qu’un même ouvrage a été numérisé deux fois sur fonds publics. Si le dialogue entre établissements permet de faire émerger des complémentarités, la mise en œuvre de passerelles fondées sur le protocole OAI confère tout son sens à ce dialogue en permettant de donner aux ressources un accès réciproque afin de simplifier les recherches des internautes, contraints en l’absence de passerelles de visiter chaque site l’un après l’autre. En effet, le protocole OAI permet à l’établissement fournisseur de services de moissonner les données d’un autre (l’établissement fournisseur de données) pour y donner accès depuis sa propre base.

      Avant tout, il est nécessaire de définir les établissements à qui proposer une passerelle. Des exemples ont été cités plus haut, de la bibliothèque numérique encyclopédique à la bibliothèque numérique spécialisée. Il va de soi que la collaboration avec des établissements tels que la BnF doit être ciblée sur les seules disciplines devant faire l’objet du moissonnage. Concernant les questions techniques liées au protocole OAI, la réflexion de l’INHA n’est pas encore aboutie, car la bibliothèque numérique est tributaire de son installation sur le futur système multimédia de l’INHA. Le choix du Dublin Core non qualifié comme langage semblerait cependant la meilleure solution étant donné l’usage assez général qu’en font les bibliothèques et la relative simplicité d’adaptation de ses champs aux notices de la bibliothèque numérique de l’INHA, quels que soient les types de documents décrits.

      Illustration
      LE COMTE (Florent). Cabinet des singularités d’architecture, peinture, sculpture et graveure ou Introduction à la connoissance des plus beaux-arts, tome II. Paris : E. Picart, N. Le Clerc, 1699. Frontispice. Cote NUM 12 Y 31 (2). Provenance : Bibliothèque de l’INHA, collection J. Doucet

      L’accès du public aux ressources

      Si le protocole OAI facilite les recherches en offrant depuis une même interface des corpus plus vastes, quelles seraient les améliorations à apporter à l’actuelle interface de la bibliothèque numérique de l’INHA ? Il y manque sans doute un peu de personnalisation et de souplesse. La possibilité de créer des paniers de recherches accessibles sur mot de passe, de commenter les références mémorisées, de comparer deux images – fonction ô combien plébiscitée par l’historien de l’art – y remédiera dans le futur système. Téléchargement et impression restent des fonctionnalités fondamentales évidemment préservées sous Agorha. L’un et l’autre se limitent cependant à des versions dégradées des fichiers originaux afin d’éviter le piratage. De plus, une mention légale protège l’image. Parallèlement, l’accès payant aux fichiers sources est un service à développer, très attendu des auteurs et des éditeurs.

      Des possibilités de recherches toujours plus fines et pertinentes et la mise en place de fonctionnalités utiles aux chercheurs n’empêchent pas une mise en valeur plus générale des ressources proposées. Expositions virtuelles et dossiers thématiques – actuellement encore sous forme embryonnaire – peuvent être l’occasion de mieux faire connaître les collections numérisées et de toucher un autre public que le public scientifique.

      Conservation des données

      Longtemps, le numérique a été exclusivement conçu comme un formidable outil de diffusion de l’information, ce qu’il est assurément – à condition de bien encadrer et normaliser cette information. Il n’est apparu qu’assez récemment aux bibliothécaires que les documents numériques pouvaient se dégrader et devenir incommunicables, tout comme leurs homologues papier, et qu’un fichier pouvait s’effacer par mégarde, un CD se corrompre, une adresse URL disparaître. La bibliothèque numérique de l’INHA s’est trouvée confrontée à cette réalité puisque, avant l’achat d’un serveur de stockage fin 2006, ses fichiers sources se trouvaient sur des CD gold, dont quelques-uns commencèrent, quatre ans après leur production, à présenter des signes de dégradation. Heureusement, la grande majorité des images a pu être copiée sans difficulté sur le serveur (où elles occupent à ce jour 2 téraoctets), mais le péril est bien réel pour une bibliothèque patrimoniale dont une des raisons d’être est d’assurer la conservation de ses documents, quels qu’ils soient.

      La question de la conservation se pose avec d’autant plus d’acuité que les fichiers acquis sont nombreux. D’ici à la fin 2008, la bibliothèque de l’INHA aura atteint le cap des 300 000 images numérisées, nombre qui aura probablement doublé à l’horizon 2012, représentant environ 5 téraoctets de données. Dans ce contexte, il est impossible d’entretenir une collection de CD, d’autant plus que la numérisation de sources en histoire de l’art implique un taux élevé d’images « lourdes » (haute résolution et couleur). Aux problèmes de place s’ajouteraient en effet les coûts financiers exponentiels induits par la nécessité de regraver les CD environ tous les cinq ans (durée de vie estimée de ce support).

      À terme, il est assez probable que la bibliothèque de l’INHA abandonne le CD. Au préalable, il lui faut trouver le moyen d’assurer la pérennité de ses fichiers sources, ce qui passe par la duplication des données sur un autre support fiable conservé sur site distant, par la création de métadonnées techniques suffisantes, et par un effort de veille technologique permettant de prévoir l’obsolescence des formats de fichiers conservés. L’INHA peut mettre sur pied certaines mesures. Ainsi, en 2007, le service informatique a mis en place sur l’espace disque du serveur consacré au stockage des fichiers sources de la bibliothèque numérique une routine permettant de calculer l’empreinte MD5  18 de chaque fichier et de la comparer à l’empreinte créée initialement par le prestataire. Les modifications subies par les fichiers peuvent ainsi être repérées. De plus, Agorha prévoit la saisie des méta-données techniques des fichiers images sous une table spécifique, à usage exclusivement interne. Toutefois, la veille technologique et l’achat d’un serveur installé sur un site distant ne peuvent être réalisés, étant donné les moyens humains et financiers de l’INHA. C’est pourquoi le recours à un tiers archiveur spécialisé dans les problématiques de conservation apparaît comme une nécessité. L’INHA souhaite se tourner vers des établissements publics plutôt que privés, les seconds n’étant pas assurés d’une existence à long terme. La BnF et le Cines (Centre informatique national pour l’Enseignement supérieur) sont actuellement les institutions du monde des bibliothèques les plus avancées dans ce domaine. Toutes deux développent et sont ou seront bientôt à même de proposer un service de tiers-archivage respectueux du modèle OAIS  19. L’INHA s’applique actuellement à comparer les deux solutions pour définir l’établissement correspondant le mieux à ses besoins. Espérons ainsi que ses ressources numériques atteindront la même longévité que les collections constituées depuis cent ans par Doucet et ses successeurs.

      Illustration
      TOULOUSE-LAUTREC (Henri de). May Milton. [Paris] : [s. n.], [1895]. Cote NUM Toulouse-Lautrec-229-gdf. Provenance : Bibliothèque de l’INHA, collection J. Doucet

      La bibliothèque numérique de l’INHA doit affirmer sa place au sein du paysage des ressources numériques en histoire de l’art. La production de mode texte, la création de passerelles reposant sur le protocole OAI, l’archivage pérenne de ses données sont autant de défis à relever simultanément. La rationalisation de la production scientifique et documentaire au sein de l’INHA, avec le développement du système Agorha, influe également sur son devenir. C’est au moment où la bibliothèque de l’INHA, rénovée et agrandie, ouvrira ses portes en salle Labrouste (2012), que sa petite sœur numérique devrait avoir franchi ce cap majeur de son histoire.