Le vocabulaire français de 1789 à nos jours

d'après les données du Trésor de la langue française...

par Pierre Barkan

Étienne Brunet

préf. de Paul Imbs. - Genève : Slatkine ; Paris : Champion, 1981. - 3 vol., XII-852 + 518 +454 p. ; 25 cm. - (Travaux de linguistique quantitative ; 17.)
ISBN 2-05-100361-0.

La mise en œuvre du magistral Trésor de la langue française (manuelle, dès 1962, puis mécanique à partir de 1971), en cours d'achèvement pour la partie proprement lexicographique, grâce au stockage sur ordinateur de sa riche matière (soixante-dix millions de mots-occurrences), a ouvert la voie à d'innombrables travaux de recherche, allant du lexique, avec tous les nuancements de ses catégories grammaticales et stylistiques, jusqu'à la linguistique quantitative (fréquences selon l'époque, le genre, l'époque dans le genre).

Le présent ouvrage en est une brillante illustration pour cette dernière discipline. C'est donc essentiellement de statistique linguistique qu'il traite, et d'abord des diverses méthodes pour l'établir (loi hypergéométrique et loi normale). L'auteur précise ensuite quelques notions qu'il dénomme « inflation lexicale » et « classes de fréquences ». Enfin il traite les divers aspects qu'il a envisagés : la distribution des lettres, la longueur du mot, la ponctuation, les catégories grammaticales (les parties du discours), les mots grammaticaux (variables et invariables), les suffixes, les préfixes, l'évolution des mots (croissance et décroissance) et les genres littéraires (principes de distinction, vocabulaire caractéristique, structure, contenu et croisement du genre et du temps), avec chaque fois les analyses factorielles qui en découlent.

Le tome II donne la liste alphabétique des mots de fréquence supérieure à 500 (6 700 unités, de « à » à « zone »).

Le tome III donne les courbes des mots (907 sur 71 640 vocables recensés) les plus fréquents (plus de 7 000 occurrences), avec la distinction des genres dans chaque tranche de temps.

Malgré son importance considérable, le présent travail n'épuise pas le sujet, comme le fait remarquer le préfacier qui souhaite que « l'étude du corpus du Trésor de la langue française suscite d'autres analyses et d'autres découvertes en vue d'une connaissance renouvelée de l'économie du langage. »

Nous ne saurions mieux faire que de nous associer à ce vœu.