« Collections », le moteur de recherches sémantiques du ministère de la Culture et de la Communication
Caroline Cliquet
En 2007, le ministère de la Culture et de la Communication a ouvert les portes de son patrimoine culturel numérisé au public, grâce à un moteur de recherches sémantiques appelé « Collections » *, qui permet de consulter plus de 4,4 millions de documents et plus de 3 millions d’images dans les domaines artistiques les plus divers : architecture, archives, bibliothèques, musées, monuments historiques, archéologie, documentation, préhistoire, objets mobiliers, peinture, sculpture, gravure, dessin, enluminures, arts du spectacle, ethnologie, plans, cartes, cartes postales, sceaux, photographie, patrimoine numérique, patrimoine industriel, patrimoine ferroviaire, patrimoine maritime et fluvial, voyages, théâtre, musique, danse, outre-mer, art africain, art océanien, art amérindien, etc.
Basé sur le principe d’une interrogation unique, le moteur consulte simultanément une quarantaine de bases de données (Agence Réunion des musées nationaux, Arcade, Archim, Bora, Cartolis, Capadoce, Enluminures, Eve, Gallica, Joconde, Louvre-Atlas, Médiathek, Mémoire, Mérimée, Musée national d’art moderne, Musées nationaux récupération, Musée des arts décoratifs, Musée du quai Branly, Napoléon, Palissy, Phocem, Patrimoine numérique, Portail de la musique contemporaine, PRIAM 3, Répertoire des arts du spectacle, Ulysse), des centaines d’expositions virtuelles (par exemple, les expositions virtuelles de la Bibliothèque nationale de France ou produites par des bibliothèques comme la bibliothèque Méjanes – Cité du livre d’Aix-en-Provence, portail Lectura, médiathèque de Chambéry, Interbibly), mais aussi des sites internet et des publications électroniques (par exemple : collection des célébrations nationales, dessins du musée Magnin, Grands sites archéologiques, Histoire par l’image, revue électronique In Situ, Itinéraires du patrimoine, PortEthno…) produits par le ministère, ses établissements publics (Musée du Louvre, Musée du quai Branly, Bibliothèque nationale de France, Réunion des musées nationaux…), des collectivités territoriales partenaires (archives départementales, bibliothèques municipales comme la bibliothèque municipale de Baud, services régionaux de l’Inventaire, musées…).
L’accroissement de « Collections » est constant : les bases de données du musée d’Orsay, de la Cité de l’architecture et du patrimoine, du château de Versailles, Revues.org, sont en cours d’intégration.
« Collections » est un moteur de recherches sémantiques et permet ainsi de retrouver un terme quelle que soit sa forme (plurielle, conjuguée, accentuée ou non, etc.) et d’étendre la recherche aux mots synonymes ou de même racine étymologique. La recherche s’effectue en plein texte quels que soient la base d’origine et le type de document. « Collections » donne accès au patrimoine national réparti sur l’ensemble du territoire, mais est aussi un des agrégateurs nationaux du portail européen Europeana.
La mise en œuvre de boîtes de dialogue interrogeant le corpus entier de « Collections » constitue une extension de la mutualisation et du partage de cet outil de diffusion et commence à être pratiquée sur de nombreux sites partenaires. De même, une adaptation régionale de cette boîte, permettant de limiter les consultations de données à des entités géographiques réduites ou à un ensemble d’institutions locales, et pouvant être hébergée sur les portails régionaux, est en cours de développement.