Numeric databases

par Bernard Marx
éd. by Ching-Chih Chen et Peter Hernon.
Norwood, NJ : Ablex-publishing, 1984. - 332 p., 24 cm. Bibliogr. Index. - ISBN 0-89391-2476.

L'objectif de l'ouvrage est de promouvoir l'utilisation des banques de données numériques dans les centres d'information et les bibliothèques. Le postulat de départ est que si la recherche de l'information dans les banques de données bibliographiques est maintenant bien intégrée dans l'ensemble des services de la bibliothèque, la recherche dans les banques de données numériques l'est beaucoup moins. La notion de nature numérique des données est variable suivant les secteurs d'activité, mais elle intègre souvent les données textuelles-numériques. Environ la moitié des banques de données entre dans cette catégorie et la proportion des utilisateurs issus des bibliothèques et des centres d'information n'est que de 19 %.

La plus grande partie de l'ouvrage est consacrée aux différents organismes américains qui produisent, exploitent ou diffusent des données numériques. Les derniers chapitres décrivent les expériences d'utilisation de ces données dans différentes universités américaines.

Une synthèse détaillée de banques de données numériques en sciences et technologie est faite par Gesina Carter (National academy of sciences), avec la présentation des différents niveaux de production: l'intégration du processus d'évaluation critique-validation des données est notée dans la recherche et le développement scientifiques. Les secteurs scientifiques sont détaillés : configuration et conditions d'expérimentation en physique et chimie, données indépendantes et peu compatibles en ingénierie et matériaux, différentes natures des données en sciences de la vie et santé, volume colossal des données d'observation - géoscience, atmosphère, météorologie, environnement. Les liens étroits entre les centres de données et les scientifiques sont soulignés. La diminution depuis plusieurs années du budget des instances de coordination au niveau fédéral est dénoncée, en particulier en ce qui concerne l'évaluation des données. Le rôle important de CODATA au niveau international est indiqué dans les différents secteurs d'activité Dans le domaine des géosciences, les programmes National waterdata storage and retrieval system et Geographic retrieval and analysis system sont analysés.

La gestion des données numériques au Battelle Columbus laboratories concerne des banques d'agences fédérales (carbon/carbon composites et propriétés mécaniques) et de centres industriels (cuivre, électricité). Les différents types de données sont exploités par les modules de BASIS, en particulier COMPUTATION pour les données numériques.

Les agences fédérales produisent un grand nombre de banques de données statistiques (agriculture, éducation, énergie, santé, etc.) avec une diminution des budgets dénoncée en 1982, qui rend difficile la liaison entre les différentes données. Les trois outils « incontournables » du secteur sont : Directory of Federal statistical files, NTIS Directory of computerized data files et Catalog of machine-readable records in the national archives of the United States. Le US Bureau of the Census est aussi une source très importante de données avec environ 1 500 fichiers issus du dernier recensement : données agrégées, individuelles et géographiques. L'exploitation des données de sondages a été demandée par la Bibliothèque du Congrès, sous la forme suivante : Public opinion legislative location database. La diffusion des banques de données numériques (au sens large) par DIALOG montre l'accès à des répertoires de sociétés, des séries économiques, des données financières.

Le reste du monde (hors des Etats-Unis) est représenté dans l'ouvrage par les seuls pays nordiques européens : banques produites ou exploitées au Danemark, en Finlande. en Norvège et en Suède, avec une seule référence française : Répertoire des banques de données en conversationnel de l'ANRT (Association nationale de recherche technique)

L'utilisation des banques numériques est étudiée dans les universités suivantes : North Carolina, University of Florida, University of Kentucky, University of Arizona et Yale. Un certain nombre de points communs se dégagent de ces utilisations : l'importance des données sur : sondages, élections, recensement, économie, santé, physique, astronomie; l'intérêt de données bibliographiques et « numériques » sur DIALOG; l'inaccessibilité des données par les documents imprimés: la nécessité d'un choix entre gestion locale (conversationnel ou différé) et accès à distance suivant l'importance de la demande; l'importance d'une connaissance préalable des outils de base par le spécialiste de l'information. On remarque également une politique de tarification qui n'est pas originale par rapport aux autres banques de données mais qui demande plus fréquemment, dans le cas des données économiques, le paiement d'un abonnement.

Enfin, le spécialiste de l'information sera de plus en plus sollicité pour de telles données; en liaison avec les utilisateurs/producteurs de son université, il peut répondre progressivement aux différents niveaux de demandes.

En conclusion, un ouvrage hétérogène puisqu'il est réalisé par seize auteurs tout au long de ses différents chapitres, mais un ensemble néanmoins cohérent et complémentaire entre production et utilisation, et un grand nombre de « bonnes adresses » (américaines). II reste à réaliser un travail similaire pour les données numériques produites, exploitées et utilisées « de l'Atlantique à l'Oural ».