Frantext

autour d'une base de données textuelles, témoignages d'utilisateurs et voies nouvelles

par Philippe Hoch
publ. Institut national de la langue française, éd. par Eveline Martin
Paris : Didier Erudition, 1993. - 357 p. ; 24 cm. - (Dictionnairique et lexicographie ; 2).
ISBN 2-86460-193-1 : 180 F

La réputation de la base de données textuelles Frantext n'est certes plus à faire. Sa renommée, de surcroît, ne se limite pas à la France, où elle a vu le jour, mais s'étend également à de nombreux pays étrangers - de la Suède au Japon, en passant par la Lituanie et le Canada -, auprès des spécialistes des domaines littéraire et linguistique aussi bien que des professionnels de la documentation. Dès lors, il n'est guère surprenant que sa conception, son utilisation et son évolution prévisible aient pu donner lieu à une copieuse étude collective, à laquelle une vingtaine d'auteurs, en majorité universitaires, ont pris part. L'ouvrage expose successivement le point de vue, plutôt succinct, des concepteurs de cet instrument de recherche, puis celui, beaucoup plus développé, de ses différents utilisateurs (bibliothécaires ou documentalistes, professeurs de l'enseignement secondaire et supérieur, chercheurs en linguistique et en littérature, historiens, juristes, sociologues...). Enfin, trois contributions s'efforcent d'avancer des éléments de prospective et de suggérer quelques améliorations souhaitables.

Dans l'avant-propos de l'ouvrage, Bernard Quemada, en sa double qualité de directeur du Trésor de la langue française et de responsable de la collection « Dictionnairique et lexicographie », entreprend de situer la création et le développement de la base dans le contexte historique des recherches en lexicographie, depuis l'Inventaire général de la langue française entrepris en 1936 par Mario Roques, jusqu'à la création de l'Institut national de la langue française (1977), au sein duquel est né Frantext, en passant bien sûr par le projet du Trésor de la langue française mis en œuvre à Nancy par le recteur Paul Imbs à partir de 1964, et dont la publication est désormais achevée.

La brève contribution introductive des concepteurs de Frantext prend la forme d'un descriptif de la base, laquelle regroupe quelque cent soixante millions de mots-occurrences, formant deux mille cinq cents textes, de François Rabelais à René Char. Interrogeable grâce au logiciel Stella, Frantext est géré par un serveur lorrain, Ciril (Centre interrégional d'informatique de Lorraine). Cet instrument, nous disent les experts qui l'ont mis au point, « a très vite conquis ceux qui, familiers des nouveaux modes de transmission de l'information, savent fort bien que les données textuelles sont des données comme les autres ».

Envie de lire

Un succès dont témoignent avec autant d'ampleur que d'éloquence les utilisateurs, unanimes à vanter les vertus de la base, parfois non sans quelque emphase. S'exprimant au nom des « médiateurs », une documentaliste, Christine Ducourtieux, met l'accent sur la dimension « stimulante » de l'interrogation de Frantext, grâce à laquelle - et ce n'est pas là un mérite négligeable - « l'envie de lire revient au bibliothécaire », tandis que Jacques Lemarignier, se fondant sur son expérience à la Bibliothèque publique d'information du Centre Georges-Pompidou, constate que Frantext, « la base littéraire et linguistique de loin la plus appréciée », séduit en définitive « aussi bien le grand public que les chercheurs ».

Disponible dans les bibliothèques universitaires, où étudiants et enseignants ne se privent pas de tirer parti de sa richesse, l'outil informatique de l'INLF peut également intéresser les élèves de l'enseignement secondaire, comme le prouve l'expérience menée durant l'année 1987-1988 par Annie Besnard dans différents établissements de l'académie Nancy-Metz. Il s'agissait d'exploiter « les possibilités de la base de données pour renouveler l'approche de la littérature », par exemple en réalisant une plaquette imprimée, sans oublier de préparer efficacement l'épreuve de français du baccalauréat !

« Domotique culturelle »

Très utilisé en milieu scolaire et surtout universitaire, Frantext devrait aussi, à terme, être accessible chez soi. C'est du moins la perspective qu'entrevoit Gabriel Otman, aux yeux duquel « le développement de Frantext est à envisager sous l'angle de la domotique culturelle, c'est-à-dire l'accès des biens culturels (écrit, son, image) à son domicile par voie télématique ou disque optique numérique ».

Il revenait en vérité aux spécialistes (linguistes, lexicographes, stylisticiens...) de mettre en évidence toutes les possibilités de recherche offertes par la base. Robert Martin souligne ainsi quel rôle « déterminant » joue Frantext dans le projet de Dictionnaire du moyen français, offrant un corpus de six à huit millions d'occurrences pour la période 1330-1500. Pour sa part, Danielle Bouverot propose des exemples d'investigations menées grâce à Frantext dans les domaines de la stylistique, de la linguistique et de la sémiotique, tandis qu'Olga Ozolina place l'accent - comme, du reste, plusieurs autres collaborateurs du volume - sur le rôle irremplaçable du chercheur, dont le travail, bien que considérablement facilité par la machine, ne disparaît pas pour autant.

Non moins que les linguistes, les « littéraires » sont en droit d'attendre que l'outil mis à leur disposition leur rende d'importants services. Henri Béhar, présentant un travail mené par quatre chercheurs sur A rebours, le roman de J.-K. Huysmans inscrit au programme de l'agrégation de lettres, explique comment, en moins de trois mois, a été possible l'élaboration d'un ouvrage fort utile aux étudiants. Et, pour H. Béhar, « il n'est pas loin le jour où le candidat admissible, entrant dans la salle de préparation, demandera à consulter un terminal d'ordinateur avant d'établir la liste des œuvres que l'appariteur viendra lui apporter ». Appartenant tous trois à l'INLF, Patrick Rebollar, Liliane Pouzadoux et Michel Bernard livrent des « variations sur l'usage de Frantext », qui sont comme des feuilles arrachées au « joumal de bord du laboratoire ». Explorant « l'ouest romantique », Etienne Buret invite, lui, à un « voyage autour des mots » et Gérard Gorcy expose comment l'ordinateur permet, parmi tant d'autres choses, la constitution d'une sorte d'anthologie personnalisée de citations.

Art et technique

Il est tout aussi aisé, si l'on en croit Hiltrud Gemer, d'établir « l'inventaire des emplois plus ou moins fidèles d'une expression », depuis la Brble jusqu'aux auteurs contemporains ! N'allons point imaginer, cependant, que le recours à l'informatique dispense l'utilisateur de tout travail préliminaire. Tout au contraire, Frantext, dit Armand Rykner, « oblige le chercheur à clairement définir l'objet de sa recherche ». Cette conclusion est du reste aussi celle d'Elisabeth Coss-Humbert qui, à propos d'Exil de Saint-John Perse, souligne que l'ordinateur « ne remplace pas l'approche personnelle et sensible des textes ». Josef Häfner, dont le propos conceme la place de la poésie dans la base, estime pareillement que « technique et art ne s'excluent pas obligatoirement ».

Destinée au premier chef à tous ceux qui, d'une manière ou d'une autre, font de la langue française l'objet privilégié de leur investigation, Frantext est cependant susceptible d'intéresser aussi les représentants d'autres disciplines. Un historien (Daniel Teysseire), un normalien engagé dans des travaux d'anthropologie politique (Alain Dewerpe), une juriste (Nathalie Poujol), ainsi qu'un spécialiste de la toxicologie (Christian Bulart), ont tenu à le souligner, exemples à l'appui.

Les trois dernières contributions de l'ouvrage s'avancent sur le terrain des « prospectives », traçant des « voies nouvelles ». Eveline Martin soutient que « l'optimisation de Frantext est la préoccupation permanente et prioritaire » de ceux qui travaillent à son amélioration, qu'il s'agisse du corpus, des procédures d'interrogation ou du système d'exploitation. Avec une étude fouillée du thème du miroir, Evelyne Bourion soumet à la communauté scientifique un état provisoire de la recherche sur Frantext, dans l'attente de remarques et de critiques. Enfin, Daniel Candel plaide pour la constitution d'une base spécialisée se rapportant aux « fonds textuels d'origine scientifique et technique ».

Fort riche, on le voit, ce volume destiné d'abord aux spécialistes des sciences du langage et de la littérature, sera également lu avec profit par les bibliothécaires appelés à jouer leur rôle de « médiateurs » et, à ce titre, conduits à interroger pour le compte des usagers de leur établissement cette base vraiment pas comme les autres qu'est Frantext.