BABEL, un projet espagnol

Musées, bibliothèques et universités en coopération

Rosario López de Prado

Le projet BABEL, développé par le Groupe de traitement d’images de l’université polytechnique de Madrid, et qui s’inscrit dans le prolongement direct du projet RAMA, cherche à résoudre le problème de la recherche d’information à partir de bases de données multiples et hétérogènes. Tout en respectant la structure de l’information disponible, il propose une interface utilisateur unique, emploie des clés d’accès qui définissent des profils utilisateurs avec différents niveaux d’autorisation, et a recours à des outils de navigation qui permettent l’interrogation en langage naturel. Ses exigences techniques sont très réduites. Ce projet bénéficie de l’aide de la Commission européenne et de divers organismes officiels institutionnels espagnols.

The BABEL project, which is being carried out by a Group for Image Processing at the Polytechnic University of Madrid, and which is part of a direct sequel to the RAMA project, seeks to resolve the problem of information searching from multiple, heterogeneous databases. While respecting the structure of available information, it proposes a unique user interface, employs access keys that define user profiles with different levels of authorisation, and has recourse to navigation tools which allow interrogation in natural language. Technical demands are very much reduced. This project has the benefit of aid from the European Commission and from various Spanish official institutional bodies.

Das von der Forschungsgruppe über die Behandlung von Bildern an der polytechnischen Universität in Madrid gegründete Projekt BABEL, ein direkter Nachfolger des Projekts RAMA, versucht das Problem der Informationssuche mittels multipler, heterogener Datenbanken zu lösen. Unter Erhaltung der vorhandenen Informationen bietet es eine einheitliche Benutzeroberfläche an und gestattet verschiedene Arten des Zugangs anhand von Benutzerprofilen und unterschiedlichen Befugnisstufen. Ausserdem erlaubt sein Browser die Befragungen in natürlicher Sprache durchzuführen. Seine technischen Erfordernisse sind gering. Das Projekt wird von der europäischen Union sowie von verschiedenen spanischen öffentlichen Institutionen unterstützt.

El proyecto BABEL, desarrollado por el Grupo de Tratamiento de imágenes de la Universidad Politécnica de Madrid, y cuyo antecedente inmediato es el proyecto RAMA, trata de ofrecer una respuesta a la necesidad de obtener información a partir de la consulta de bases datos heterogéneas. Respetando la estructura de la información ya existente, emplea un interfaz de usuario único, utiliza de claves acceso que definen perfiles de usuarios con distintos niveles de autorización y emplea mecanismos de navegación basados en la interrogación en lenguaje natural; los requerimientos técnicos son mínimos. El proyecto está auspiciado por la Comisión Europea y diversos organismos oficiales españoles.

Si les problèmes posés par la disponibilité de l’information n’ont rien de neuf, le développement des systèmes de communication et leur croissante popularité ont en revanche généré d’autres obstacles, obligeant les professionnels à chercher de nouvelles solutions. Cette fois, ce n’est ni de la pénurie, ni des restrictions qu’ont surgi les difficultés, mais plutôt de leur contraire, la facilité d’accès et la globalisation de la demande.

Cette situation nouvelle est à l’origine d’une multiplication extrêmement complexe de profils d’utilisateurs, qui emploient une multitude de langages – naturels ou documentaires – pour exprimer leurs besoins d’information. La demande s’est accrue en quantité et en diversité, on recherche aussi bien une information précise sans en connaître les sources que l’inverse, et cela sur n’importe quel support ou sous n’importe quelle forme, qu’elle soit iconographique, graphique, audiovisuelle, textuelle ou mixte. Devant une telle pression, l’offre n’a pu que s’accroître, mais cette croissance même se trouve freinée, tant par l’incapacité d’adapter la réponse aux caractéristiques de chaque client que par la difficulté de gérer une telle masse – importante et complexe – de ressources documentaires. En outre, il faut prendre en compte le fait que les fournisseurs eux-mêmes sont non seulement constitués d’institutions très diverses, mais qu’ils utilisent eux aussi de multiples types de langages, des outils différents et qu’ils gèrent leur information sur des supports et avec des structures très variés.

La situation se trouve considérablement aggravée quand on est en présence de pays au riche patrimoine historique et documentaire, mais qui manifestent des carences en terme d’organisation, ou une insuffisance de moyens pour le gérer. Pour diverses raisons, l’Espagne réunit ces trois caractéristiques : elle possède un patrimoine historique d’une grande richesse, dont la gestion n’a pas toujours été adaptée et qui n’a pas bénéficié de tous les moyens nécessaires. Il est évident que le patrimoine historique d’un pays offre un intérêt qui va bien au-delà de ses frontières, argument auquel la Commission européenne n’est pas restée insensible, qui soutient différents programmes pour la protection et le développement de ce patrimoine, ainsi que des projets pour garantir la circulation de l’information et son accès à tous les citoyens européens.

Mais la nécessité de rentabiliser les investissements de la Commission et des États participants impose de rechercher des solutions qui prennent en compte les expériences préalables – compatibles entre elles – et à partir desquelles on peut explorer de nouveaux champs d’action. Parmi celles-ci on trouve le projet BABEL, qui tire précisément son nom de la nécessité de coordonner des réalités très hétérogènes. Il s’appuie par ailleurs sur la Commission interministérielle de sciences et technologie (CICYT) qui figurait déjà dans les programmes antérieurs.

Définition et historique

BABEL (cf.figure 1)

Illustration
Figure 1 - Logo du projet BABEL

est un projet qui profite du développement des systèmes de communication pour faciliter l’accès, via Internet, à l’information disponible dans diverses entités universitaires ou culturelles, tout en permettant à celles-ci, dans le même temps, d’échanger leurs données. Ce projet est conçu et dirigé par le Groupe de traitement d’images du département Signaux, Systèmes et Radiotélécommunications de l’École supérieure d’ingénieurs de télécommunications de l’Université polytechnique de Madrid. Il prend la suite du programme RACE (Research on Advance Communications for Europe), auquel ce Groupe avait déjà participé. Le programme RACE formait le cadre des projets EMN (European Museums Network) et RAMA (Remote Access to Museum Archives) sans lesquels on ne peut comprendre correctement les objectifs et spécifications de BABEL.

Le projet RAMA, à l’origine de BABEL, avait pour objectif d’offrir un accès à une information de qualité, dûment traitée, contrôlée et actualisée, à partir des ressources disponibles dans les bases de données multimédias provenant d’un ensemble de musées européens. Le projet se situait dans un environnement rendu complexe, tant en raison de l’hétérogénéité du matériel, des systèmes et logiciels que des différents modes de gestion utilisés. L’absence de normalisation des processus documentaires dont souffrent généralement les institutions muséographiques se trouve aggravée par la diversité des procédures – non seulement entre musées, mais aussi au sein d’une même institution –, ce qui constitue l’obstacle le plus sérieux à l’échange des données. On ne peut cependant attendre de disposer de normes universelles pour régler ce problème, qui ne semble pas devoir être résolu de sitôt. Aussi la Commission européenne cherche-t-elle de nouvelles voies qui permettraient au moins d’offrir à l’utilisateur un accès à l’information. Le projet RAMA envisage les trois solutions suivantes :

– la compatibilité des bases de données grâce à l’utilisation d’un langage d’interrogation unique ;

– le recours à un unique « Manuel de procédures » et à une unique interface utilisateur dotée des champs minimums et obligatoires, pour tous les musées européens impliqués dans le projet. La conception doit assurer le maintien des structures internes de chaque base de données et ne pas obliger à retraiter l’information, ressaisir les données, ou renumériser des images déjà existantes ;

– l’utilisation de clés d’accès définissant les profils d’utilisateurs et autorisant l’accès à l’information répartie en différents zones et niveaux. Ainsi, on peut réduire les transactions dans chaque base de données, identifier chaque type d’utilisateurs et limiter la navigation dans des zones protégées, tout en rendant possible l’ouverture de sessions simultanées et spécifiques de n’importe quel point d’accès à Internet.

Le projet RAMA, même s’il n’a pas atteint tous les objectifs fixés, a été appliqué avec succès dans différents musées européens (le Musée national d’archéologie à Madrid, le musée d’Orsay à Paris, le musée des Offices à Florence, le Beazley Archive à Oxford, le Musée Goulandris d’art des Cyclades à Athènes, le musée des Antiques à Berlin, le musée de La Haye, entre autres), et a même été exporté dans différents musées américains (comme la Fondation Paul Getty à New York, ou la Galerie nationale d’art à Washington). Il a aussi été présenté avec un succès notable dans de nombreux forums internationaux, et tout particulièrement dans des forums consacrés aux systèmes de normalisation documentaire des musées. Le plus grand atout de RAMA a résidé dans sa capacité à offrir des solutions au problème de la connexion de bases de données hétérogènes dans des environnements tout aussi hétérogènes.

De son côté, BABEL s’appuie sur le développement de deux axes fondamentaux : la mise au point d’une interface simple qui inclut les points d’accès minimums et communs, mais qui permet une navigation plus approfondie pour les professionnels, comme l’utilisation de moteurs de navigation autorisant l’interrogation des bases de données en un langage commun compris de tous les serveurs, et que les logiciels locaux se chargeront de traduire dans leurs langages respectifs.

Les objectifs

En se fondant sur les succès de RAMA et sur son expérience, le projet BABEL vise une série d’objectifs différents les uns des autres.

L’objectif général est la création d’un musée-bibliothèque virtuel conçu comme un service interactif et multimédia, pouvant être interrogé tant par des utilisateurs experts (professionnels) que par de simples utilisateurs (chercheur, étudiant et public en général), que ceux-ci connaissent ou non la source d’information.

Par ailleurs, les objectifs spécifiques s’articulent autour de quatre axes qui consistent à :

– utiliser et valoriser les résultats obtenus par RAMA (ce que les coordinateurs appellent « capitaliser l’expérience ») ;

– exploiter l’information traitée, de grande qualité, qui existe dans les musées et bibliothèques espagnols et la rendre accessible à tout citoyen ;

– unifier le système d’interrogation des différents types de catalogues grâce à une interface unique conçue pour des bases de données aux structures différentes, ceci afin d’assurer la circulation de l’information entre les institutions participantes au projet ;

– rentabiliser les moyens, minimiser les coûts – mais aussi les efforts –, et enfin utiliser au mieux toutes les ressources disponibles.

Les participants

La structure de BABEL a pris la forme d’un consortium regroupant cinq ensembles de participants, selon leur degré d’intégration et leur capacité d’action : groupe de développement, groupe usagers, groupe d’intérêt, membres promoteurs et observateurs, et enfin fournisseurs de services.

Le groupe de développement comprend les entités qui participent en tant que leaders et coordinateurs du projet, et dont on attend qu’elles créent les produits sollicités par les autres participants. Il s’agit ici du Groupe de traitement d’images de l’Université polytechnique de Madrid.

Le groupe usagers est constitué des organismes qui participent à la définition des spécifications et à la validation des résultats, produits et services. Ils fournissent surtout les catalogues qui constituent les bases de données du produit. En font partie le musée du Prado, le Musée national d’archéologie, le Centre national du verre, le Patrimoine national (Palais Royal et Bibliothèque royale), la bibliothèque de l’université Carlos III de Madrid et le service des musées de Catalogne.

Le groupe d’intérêt est formé par un ensemble d’organismes qui assurent des fonctions identiques à celles du groupe usagers, mais qui ne percevront pas d’aides financières tout en ayant le droit d’utiliser librement les résultats.

Les membres promoteurs et observateurs regroupent des institutions intéressées par le projet, qui y participent à des degrés différents – selon les caractéristiques et capacités de chacune. Toutes sont présentes dans le processus de validation des résultats. Signalons entre autres la Telefonica Sistemas (compagnie de téléphones) et le ministère de l’Éducation, de la Culture et des Sports. Ces membres se répartissent en trois catégories : les participants actifs au niveau des groupes de travail, les collaborateurs financiers et les cofinanceurs de matériels.

Les fournisseurs de services : cette fonction est exercée provisoirement par l’Université polytechnique de Madrid et, pour le développement ultérieur, par la Telefonica Sistemas.

La configuration et les spécifications techniques

La configuration de base de Babel, de même que les spécifications techniques, étaient déjà définies dans RAMA. L’objectif veut faciliter l’intégration de tout membre participant, tout en garantissant un accès sûr et efficace aux utilisateurs externes. Cela concerne cinq éléments : les bases de données (qui sont toutes contrôlées), le logiciel de communication (sous TCP/IP), le matériel de stockage (serveur sous UNIX) et les postes clients (PC sous MS-DOS et Windows), le matériel de communication (seulement des routeurs à multiprotocoles qui fonctionnent sous TCP/IP selon les standards RFC), et les systèmes de contrôle (sont contrôlés tous les systèmes employés par les diverses institutions fournissant l’information).

C’est une structure client-serveur, connectée à un réseau public (Internet) qui caractérise la configuration de BABEL, comme on peut le voir sur le schéma (fig. 2)

Illustration
Figure 2 - Le réseau BABEL. Source : Guillermo Cisneros, José M. Martínez, Jesús Bescós.

. Les musées et bibliothèques qui intègrent BABEL en qualité d’utilisateurs, sont forcément fournisseurs et consommateurs d’information, alors que les membres du Groupe d’intérêt peuvent exercer ces mêmes fonctions soit séparément, soit simultanément. Le système d’exploitation fonctionne sous UNIX et INFORMIX, bien qu’il permette l’utilisation d’autres logiciels, tandis que les postes clients sont des PC sous Windows, avec des navigateurs utilisés sur le web.

Pour l’échange des données, on utilise deux types d’application, l’une pour tout type d’utilisateur, basée sur la technologie web, et l’autre destinée aux spécialistes, sur le programme de télérecherche du système MIRA (Multimedia Information Remote Access – cf. fig. 3)

Illustration
Figure 3 - Logotype du programme MIRA.

développé par le Groupe de traitement d’images de l’Université polytechnique de Madrid. Le Système d’information MIRA est constitué par la plate-forme de développement des applications MIRA et par l’application client de Télérecherche, utilisée dans le projet BABEL 1. Les spécifications techniques concrètes du client-serveur sont détaillées dans les tableaux 1 et 2

Illustration
Tableau 1 - Configuration standard pour le serveur

Illustration
Tableau 2 - Configuration standard pour les postes clients

, et disponibles à l’adresse Internet indiquée en note.

Les étapes

Le projet définit trois étapes différentes de développement et d’exploitation du système selon les propositions émises par le groupe de développement, en sa qualité de concepteur et coordinateur.

Première étape

La première étape consiste à analyser des bases de données des membres utilisateurs (bibliothèques et musées), acquérir du matériel et installer le système d’exploitation, le programme MIRA et les navigateurs web, exporter des bases de données sur le serveur UNIX, et installer des segments d’accès WAN.

Deuxième étape

La deuxième étape consiste à intégrer le contenu des bases de données, à améliorer la flexibilité des passerelles, et à rechercher de nouveaux membres associés. C’est aussi la période d’essai et de valorisation du système, et celle où sont définis et spécifiés des modes communs de navigation.

Troisième étape

Le développement, l’installation et la mise en fonctionnement des services du musée-bibliothèque virtuel, la mise au point des accords nécessaires pour la protection des droits de propriété, l’accroissement des membres et les améliorations des services se déroulent pendant la troisième étape.

Aucune date butoir n’a été fixée au projet BABEL, car on le considère comme un point de départ vers l’intégration progressive de la plupart des musées et bibliothèques espagnols intéressés par le traitement, la circulation et l’accès à l’information multimédia, à des fins professionnelles, éducatives ou simplement de vulgarisation. Plus qu’un projet, il représente le début d’un ambitieux programme de coopération multimédia.

Problèmes, contraintes et conditions de réussite

La mise en marche du projet BABEL n’est pas exempte de problèmes, de diverse nature, mais les plus flagrants ne sont pas d’origine technique. Les coordinateurs de BABEL doivent faire face à des systèmes installés de longue date, à la diversité des concepts et à de multiples pesanteurs bureaucratiques, sans parler des conflits issus de la propriété intellectuelle ou [de l’absence] de normalisation. En fonction de leurs caractéristiques, on peut les répartir selon les catégories suivantes :

– l’absence de normalisation des processus documentaires des musées peut entraîner des situations dramatiques difficiles à régler à court terme (allant jusqu’à la présence de différents systèmes de catalogues à l’intérieur d’un même musée). Le projet RAMA avait suggéré de prendre pour modèle le format MARC utilisé par les bibliothèques afin de définir un système qui permettrait aux musées de développer un format normalisé d’échange. C’est un point sur lequel insiste particulièrement BABEL ;

– la résistance, de la part de certains professionnels, à communiquer les résultats de leur travail pour fournir des services à d’autres institutions ou à la communauté des chercheurs. Ce sont les séquelles d’un certain sentiment patrimonial que l’on n’a pu encore complètement éradiquer ;

– la pénurie relative (en regard à l’abondant patrimoine espagnol) des banques de données multimédias susceptibles d’être communiquées sur Internet, et les difficultés pour les développer ;

– les problèmes liés à l’emploi d’images et de catalogues documentaires auxquels peut ou pourrait s’appliquer le droit d’auteur. Si le projet RAMA confiait à son propriétaire la responsabilité du contrôle de l’information, le système web laisse ces problèmes de sécurité entre les mains des fournisseurs du serveur.

Conclusion

Si actuellement BABEL traverse une phase de ralenti en raison de problèmes à la fois économiques et bureaucratiques, il ne fait aucun doute qu’il s’agit là d’un projet tout à la fois ambitieux et extrêmement séduisant, à différents points de vue.

En premier lieu, ce projet tente de rapprocher les différents modes de gestion de l’information, souvent divergents, qui existent dans des organismes très différents. Malgré ces divergences, les objectifs, fondés sur le service public, sont souvent similaires, ce qui semble finalement contribuer au rapprochement des institutions elles-mêmes. En second lieu, BABEL facilite l’accès à une information complexe et hétérogène, pour n’importe quel type d’usager, sans exiger de celui-ci d’autre talent que l’emploi de son propre langage. La possibilité de récupérer facilement des documents textuels, graphiques, iconographiques ou encore mixtes constitue une excellente réponse aux exigences – toujours plus importantes et complexes – de la société.

Finalement, BABEL prétend limiter le gaspillage des ressources, investissements et efforts en suivant une double ligne de conduite : d’une part, l’exploitation exhaustive des bases de données déjà existantes – et celles que l’on pourra bientôt créer à partir de la documentation des musées et bibliothèques – et d’autre part, la mise à profit des expériences et résultats obtenus lors des précédents programmes. Si chacun de ces résultats est d’un grand intérêt pour nous, la combinaison des trois est tout simplement extraordinaire.

On accorde souvent peu d’importance au travail déjà réalisé ou, à l’inverse, par crainte, on s’arrête à une étape précise. BABEL s’appuie au contraire sur l’existant pour trouver de nouveaux moyens qui lui permettront de le valoriser et de le développer, et pour que ces résultats soient utiles au plus grand nombre possible d’usagers. Il mérite bien et sans aucun doute, la confiance des professionnels des musées et des bibliothèques, ainsi que l’appui des organismes et institutions, qui, espérons-le, ne lui feront pas défaut.