La bibliothèque de l'Université de Nice et ses perspectives d'automatisation

Michel Meinardi

Alban Daumas

La Bibliothèque de l'Université de Nice a entrepris l'automatisation de ses divers services. Dans un premier temps les recherches ont porté sur l'automatisation des catalogues de nouvelles acquisitions. Parallèlement à l'élaboration de listes d'acquisitions réalisée sur machines à écrire automatiques produisant des bandes perforées susceptibles d'être utilisées sur ordinateur, a été publié en 1971 un premier catalogue collectif de périodiques généré sur ordinateur.

La Bibliothèque de l'Université de Nice est de création récente. En même temps qu'il a fallu construire les bâtiments 1, les équiper, constituer les collections des fonds de base, il nous a semblé souhaitable et possible de penser à l'automatisation, d'une partie au moins, de la gestion de nos services.

Localement, la situation était intéressante du fait de l'implantation à La Gaude d'un centre de recherches de la compagnie IBM, de l'existence à l'Observatoire d'un puissant ordinateur et d'un centre de calcul, puis de l'achat à la Faculté des sciences, d'un appareil moins important. A cette même faculté, un de nos collègues bibliothécaires a pu entreprendre des études d'informatique, cependant qu'à la section lettres était le siège social d'une association dite Collectif des utilisateurs de machines à des fins d'information et de documentation. Enfin, la section de Marseille-Luminy de la Bibliothèque inter-universitaire d'Aix n'est pas très loin, moins de trois heures en automobile. Nous avons pu y faire des stages et étudier certains programmes grâce à la courtoisie et au dynamisme de Mlle Kœst et de ses collègues.

I. Utilisation des machines à bandes perforées type Friden-Flexowriter.

Ces machines ont d'abord servi à la multiplication des fiches très nombreuses nécessaires pour cataloguer les milliers de livres achetés sur les crédits d'équipement. Mais leur intérêt principal est de pouvoir produire des bandes perforées (à huit canaux et en code IBM) assimilables par les ordinateurs à l'aide d'un lecteur auxiliaire.

Un voyage d'étude en République fédérale allemande, notamment à Bochum et à Francfort, puis la lecture du rapport de P. R. Brygoo 2, alors chef de documentation scientifique de l'Institut Pasteur, avaient montré une voie possible pour nos recherches. Un article paru dans la revue Documentaliste de septembre-décembre 1970 confirmait la crédibilité de cette orientation 3.

Cependant, avant de penser à utiliser un ordinateur, nous désirions réaliser nos catalogues de nouvelles acquisitions, notamment à la section lettres où les achats de livres sont les plus nombreux, d'une façon semi-automatique, c'est-à-dire faire accomplir par la machine, la frappe dactylographique des listes et la sélection des principales matières.

La succession des opérations est la suivante :
I° frappe manuelle d'une fiche avec bande perforée pour chaque ouvrage. La notice de la fiche de base y apparaît en clair;
2° classement manuel de ces fiches par ordre alphabétique auteurs;
3° création automatique d'une bande continue du catalogue alphabétique auteurs, représentant tous les documents entrés à la bibliothèque pendant une période donnée (deux mois en général);
4° sélection automatique par matières (39 catégories ou classes) avec, le cas échéant, une seconde interrogation plus poussée pour les matières très importantes et obtention de sous-classements par langue ou par pays (18 possibilités).

Une enquête menée avec persévérance auprès des enseignants a montré que les listes des nouvelles acquisitions de la section lettres ainsi obtenues étaient très appréciées. Multigraphiées sur le seul recto des pages, elles sont découpées et servent aux professeurs pour constituer des fichiers personnels.

Puisqu'une douzaine de bibliothèques en France disposent de machines à écrire automatiques, il semble qu'il pourrait être facile de rassembler dans un centre désigné les bobines des bandes perforées pour introduire les données dans un ordinateur et obtenir des catalogues collectifs, auteurs, matières, C.D.U., etc.

Quoiqu'il en soit, c'est par une entente régionale avec la bibliothèque inter-universitaire, section sciences de Marseille-Luminy que nous avons pu, à titre d'essai et pour les entrées à notre section sciences de Nice portant sur quelques mois, rédiger les mêmes bordereaux de catalogage que dans cette bibliothèque. Je rappelle que c'est désormais la seule opération nécessaire, l'ordinateur établissant l'inventaire, le catalogue alphabétique auteurs, le catalogue matières, une liste systématique des acquisitions. Les mises à jour des catalogues, mensuelles et cumulatives, aboutissent chaque année à un catalogue nouveau et complet.

En 1971, grâce au travail de M. Meinardi, nous avons pu sortir un catalogue commun (37 participants) des périodiques 4, établi pour la première fois sur ordinateur. M. Meinardi donne dans la suite de l'article toutes les précisions nécessaires sur le programme et les bordereaux.

II. - Automatisation du catalogue des périodiques

Ce catalogue a été réalisé en utilisant un matériel, somme toute, assez modeste. En effet, l'ordinateur IBM 1130 que nous avons utilisé a une mémoire centrale de 8 192 mots seulement et le disque 2315, sur lequel nous avons stocké les données relatives à chaque périodique, une capacité de 512 ooo mots de 16 bits. En clair, disons qu'un mot machine peut contenir soit 2 caractères alphabétiques, soit un nombre entier inférieur à 32 768. A cette faible capacité de la mémoire auxiliaire sont venues s'ajouter des contraintes dues au « hardware ». En particulier, il a fallu fixer au départ la longueur des enregistrements qui ne doivent en aucun cas dépasser 320 mots machines. Nous avons opté pour une longueur de 160 mots, ce qui permet d'enregistrer sur un même disque 2 ooo titres de périodiques.

Une analyse des renseignements qui doivent figurer dans un catalogue collectif des périodiques nous a permis de retenir, pour chaque titre, les éléments suivants :
- titre;
- sous-titre;
- ville d'édition;
- périodicité;
- renvois;
- statistiques;
- cote à la bibliothèque universitaire;
- sujets traités;
- numéro de la série (pour les périodiques en plusieurs parties);
- localisation.

L'ensemble de ces éléments constitue un enregistrement dont la longueur ne doit pas excéder 160 mots machines. Afin d'utiliser au mieux la place dont nous disposions, nous avons défini, pour chaque donnée, le nombre maximum de mots qu'elle pouvait occuper ainsi que la forme sous laquelle elle devait intervenir (en clair ou codée). Cette étude nous a permis de créer le bordereau de catalogage qui donne une image précise de l'emplacement des données sur les cartes perforées.

Le bordereau de catalogage

Pour chaque périodique, six cartes au maximum sont nécessaires. Les quatre premières sont obligatoires, les autres ne sont perforées que si le nombre des localisations l'exige. Le bordereau de catalogage va donc se décomposer en six ensembles préfigurant les 80 colonnes des cartes perforées. Les six premières positions indiquent sur toutes les cartes :
- le code « entrée cartes »;
- le numéro séquentiel d'enregistrement.
Le code « entrée cartes » est composé de deux chiffres :
- le premier sert, au moment de l'enregistrement des données, à indiquer à l'ordinateur quelles opérations on attend de lui. Si c'est :
- un I, il s'agit d'une création de fichier;
- un 2, d'une addition d'enregistrements au fichier préexistant;
- un 3, d'une correction de l'enregistrement désigné;
- le deuxième chiffre indique le numéro de la carte.

Le numéro séquentiel d'enregistrement du périodique est un nombre de quatre chiffres au maximum que l'on affecte au périodique quand on écrit les bordereaux.

Le reste du bordereau contient les éléments de la notice catalographique ainsi que les renseignements permettant d'établir des statistiques. Voici d'ailleurs le détail des différentes zones :

I. - Titre et sous-titre.

Une zone de 120 caractères est réservée pour le titre et le sous-titre. S'il y a dépassement des 120 caractères, le sous-titre est mentionné sous une forme abrégée.

II. - Édition.

Cette zone est composée de deux sous-zones :
- la première, de 18 caractères, permet d'indiquer le nom de la ville d'édition;
- la deuxième reçoit le code du pays de publication. On utilise le code automobile, donc, 3 caractères suffisent.

III. - Périodicité.

Le nombre de numéros paraissant chaque année est inscrit dans cette zone. Trois positions sont donc nécessaires afin d'avoir la possibilité d'écrire un nombre de 3 chiffres au maximum.

IV. - Renvois.

La zone « Renvois » se subdivise en quatre sous-zones.

I. Le code renvois qui se compose de quatre chiffres.

Les deux premiers correspondent aux combinaisons des cas suivants :
- pas de renvoi o;
- fait suite à 1 ;
- devient 2;
- cesse de paraître 3.

Les deux autres désignent :
- l'un le nombre n de parties du périodique précédent,
- l'autre le nombre m de parties du périodique suivant.

Si n ou m sont supérieurs à 9, on écrira 9 dans la position idoine, le programme se charge à l'impression d'inscrire « plusieurs » à la place de n ou m. Le tableau suivant résume les différents cas possibles.

Cette énumération n'est pas limitative, on peut, en effet, envisager la création de nouvelles combinaisons, par exemple, celle permettant d'utiliser le renvoi « voir 5 » qui n'existe pas dans le catalogue paru. Dans ce catalogue lorsqu'un périodique peut figurer sous plusieurs titres, une notice complète paraît à l'emplacement de chaque possibilité.

2. L'année où cesse la parution, ou l'année du changement de titre (4 chiffres).

3. Le numéro séquentiel d'enregistrement du titre précédent (4 chiffres).

4. Le numéro séquentiel d'enregistrement du titre suivant (4 chiffres).

Pour un périodique en plusieurs parties, on rédige autant de bordereaux qu'il y a de sections. Lorsque plusieurs numéros d'enregistrement peuvent être inscrits dans les sous-zones précédentes, on indique celui de la série qui est classé en tête par ordre alphabétique.

V. - Statistique.

Cette zone est utilisée pour les abonnements de la bibliothèque universitaire. Elle se compose de deux sous-zones :

I. La première de 3 chiffres correspond au « code B.U. ». Ce code est structuré comme suit :
- le premier chiffre indique la présence (valeur I) ou l'absence (valeur o) du périodique à la bibliothèque;
- le deuxième signale si l'abonnement est en cours (valeur I) ou non (valeur o);
- le troisième, selon sa valeur, désigne l'origine de l'abonnement :
- non spécifiée o;
- échange i;
- don 2;
- achat 3.

Exemple :

113 - Périodique reçu par la bibliothèque - abonnement en cours - achat

2. La deuxième sous-zone renferme le prix de l'abonnement en francs par année. Huit positions sont utilisées, permettant d'inscrire des nombres de 7 chiffres dont 2 après la virgule représentée par un point.

VI. - Cote à la Bibliothèque.

Cette zone se subdivise en 3 parties servant à signaler :
- le secteur;
- le numéro d'inventaire;
- et éventuellement, la série.

VII. - Sujets.

La structure de cette zone permet le classement des périodiques par matières.

La première sous-zone rend possible le tri des périodiques primaires et secondaires. Elle comporte 2 chiffres :
- le premier indique si le périodique est bibliographique;
- le second, s'il existe des résumés des articles dans le périodique.

On obtient les codes suivants :
II. Bibliographie avec résumés des articles signalés;
10. Bibliographie sans résumé;
oI. Périodique primaire avec résumés des articles;
oo. Périodique primaire sans résumé des articles.

Les deux autres sous-zones donnent la possibilité d'indiquer 2 sujets au moyen d'un indice C.D.U. de 4 chiffres au maximum. Cet indice est cadré à gauche et le point est supprimé. Suivant la précision du concept de classement désiré, le programme de tri utilise 1, 2 ou 3 chiffres de l'indice C.D.U. On obtient alors des listes de périodiques appartenant à une même discipline.

VIII. - Numéro de la série.

En raison de la faible capacité de la mémoire centrale, le tri alphabétique ne s'effectue que sur les 24 premiers caractères du titre. Dans la majorité des cas, le numéro indiquant la série des périodiques en plusieurs parties n'est pas considéré ; le classement n'est donc pas rigoureux. Nous avons donc créé une zone qui reçoit le numéro de la série ou, pour les sections différenciées à l'aide d'une lettre, le numéro correspondant à la place de la lettre dans l'alphabet. Cette zone est prise en considération au moment du tri et le classement alphabétique est alors correct.

IX. - Localisations.

Pour chaque localisation, les renseignements suivants ont été retenus :
I° Le « code localisation ». C'est un nombre compris entre o et 999 qui désigne les différents établissements. (Les sigles employés par l'I.P.P.E.C. n'ont pas été utilisés car, étant alphanumériques, ils occuperaient trop de place sur le disque).
2° L'année de départ de la collection.
3° L'année de fin d'abonnement, s'il y a lieu.
4° La présence de lacunes dans la collection, signalées par la lettre L.

Chaque enregistrement comprend au maximum 18 localisations.

Trois cartes sont alors nécessaires pour les représenter toutes, mais, comme le nombre 18 n'est pratiquement jamais atteint, une ou deux cartes suffisent. Aussi une zone de 2 chiffres est prévue au début de chaque carte afin d'indiquer le nombre de localisations à enregistrer. A partir de cette valeur, l'ordinateur sait après quelle carte il doit passer à l'enregistrement suivant.

Fonctionnement du système

Différents catalogues peuvent être obtenus à partir des mêmes données. Ce sont des catalogues soit alphabétique, soit topographique, soit matière. Dans tous les cas la chaîne des opérations est la suivante :
I° rédaction du bordereau ;
2° correction du bordereau;
3° perforation des cartes;
4° lecture des cartes par l'ordinateur;
5° détection des erreurs;
6° obtention de la liste des erreurs;
7° correction des erreurs;
8° vérification et écriture sur disque des données portées par les cartes correctes;
9° traitements;
10° impression des catalogues.

Les 8 premières opérations sont réalisées une fois pour toutes, les 2 dernières varient selon le type de catalogue désiré.

On constate, en consultant l'ordinogramme résumant le fonctionnement du système, que l'homme intervient dans les opérations I, 2, 3 et 7, c'est-à-dire surtout dans la phase initiale. Une fois les données collectées et vérifiées, l'ordinateur effectue le classement et l'impression des notices. Il exécute ce travail d'une façon extrêmement rapide, mais cela a demandé au préalable l'élaboration d'une série de programmes écrits en FORTRAN.

Quel est le rôle de chaque programme dans la chaîne des opérations?

Tout d'abord, le programme « Erreur » édite un « listing » des données et signale certaines erreurs. En particulier, il signale les erreurs relatives aux dates et aux codes numériques lorsque ceux-ci sont supérieurs à leur valeur maximale. Par contre il ne décèle pas les erreurs de transcription ou les fautes d'orthographe. Pour éliminer ce type d'erreur, il faut relire attentivement le « listing » puis, si des erreurs ont été démasquées, perforer de nouvelles cartes.

Lorsque toutes les données ont été vérifiées et corrigées on peut passer à la création du fichier sur disque. Pour cela, nous avons établi un programme qui, suivant la valeur du code « entrée cartes », crée le fichier principal ou le modifie. Nous avons vu que, si le premier chiffre est un I, il crée le fichier, si c'est un 2 il ajoute le nouvel enregistrement et si c'est un 3 l'enregistrement considéré est corrigé. A ce stade, la phase de stockage est terminée; il faut alors traiter les données, c'est-à-dire effectuer les différents tris. Pour cela plusieurs programmes sont nécessaires.

I. Le programme de tri alphabétique.

Le classement est réalisé en tenant compte des 24 premiers caractères du titre et de la zone « numéro de la série » ; pour cela, le programme utilise le sous-programme J2 TRI. Il crée, un « fichier adresse » dans lequel les adresses des enregistrements sont rangées dans l'ordre du classement alphabétique des titres. Lorsque le tri est terminé, on utilise le fichier principal en accès direct, c'est-à-dire que l'ordinateur lit l'adresse des enregistrements dans le « fichier adresse » puis à partir de celle-ci va rechercher sur le disque l'enregistrement considéré.

2. Le programme de tri topographique.

Le principe général de ce programme est en tout point identique à celui du programme précédent, la seule différence vient du fait que le tri s'effectue non pas sur le titre mais sur la cote.

3. Le programme de tri matière.

Ce programme utilise le « fichier adresse alphabétique » pour appeler les enregistrements dans l'ordre alphabétique. Ensuite, il teste les valeurs contenues dans la zone sujet et, suivant le résultat, il classe le numéro d'enregistrement dans des « fichiers adresses » qui correspondent aux différentes disciplines considérées.

4. Les programmes de mise en pages.

Enfin, pour faire apparaître les renseignements stockés sur disque sous une forme facilement utilisable, nous avons créé trois programmes de mise en pages adaptés au type de catalogue que nous désirons éditer. Ces programmes se différencient surtout par les modalités d'appel des « fichiers adresses », pour le reste, c'est-à-dire la partie mise en pages proprement dite, ils sont pratiquement identiques

Six mois environ ont été nécessaires pour l'étude complète des programmes et la réalisation du catalogue des périodiques de la section sciences. Il est évident que ce catalogue comporte certaines imperfections, que manque en particulier le renvoi « voir ». Mais nous l'avons tout de même publié, afin de voir, à partir d'un échantillon assez important (à peu près 600 titres), les améliorations que nous pouvons apporter à ce système.

En 1972 et 1973, nous pensons pouvoir éditer le catalogue des sections lettres, droit, médecine et à nouveau de la section sciences (mis à jour). Quant à nos recherches, elles porteront d'abord sur l'automatisation de la gestion des périodiques suivant le plan de travail que voici :

I° analyse du système existant, c'est-à-dire des différentes opérations précédentes et enfin, inventaire des données nécessaires;

2° critiques et améliorations à apporter à ce système;

3° étude d'un système automatisé, étude de sa structure générale : fichiers sur disques, jeu de cartes perforées, périodicité de la mise à jour, production des documents nécessaires (listes, réclamations, catalogues imprimés, statistiques);

4° organigramme général, conception des documents d'entrée, programmation. Il sera ensuite possible de penser à la gestion automatisée pour les commandes de livres.

Illustration
Tableau 1

Illustration
Tableau 2

Illustration
Sujets

Illustration
Annexe 1

Illustration
Annexe 2

Illustration
Annexe 3

  1. (retour)↑  La section droit et sciences économiques se termine à peine. Cette bibliothèque de 4.6oo m2 de planchers pourra être ouverte aux lecteurs au mois de septembre 1972.
  2. (retour)↑  BRYGOO (P. R.) - Application de la machine Flexowriter (Friden) à l'enregistrement des données dans les bibliothèques et centres de documentation. - Paris, 1966. (Rapport de la convention de recherche 62-FR-176 de la DGRST) et annexe 1 Essai d'édition d'un prototype de bulletin signalétique.
  3. (retour)↑  LE Dû (Jacques) et DERIBÈRE-DESGARDES (M. L.). - Le Support physique d'informations pour les différentes opérations mécanisées d'informatique documentaire et de gestion des bibliothèques. Exemple basé sur l'emploi de la bande perforée. (In : Docuinentaliste. Revue d'information et de technique documentaires, vol. 7, n° 3-4 sept.-déc. →1970, pp. 17-25.)
  4. (retour)↑  BIBLIOTHÈQUE DE L'UNIVERSITÉ DE NICE. Section sciences. - Catalogue des périodiques. - Nice, décembre 1971. - 81 p.
  5. (retour)↑  Une étude est en cours afin d'utiliser ce renvoi dans les prochains catalogues.