Traduction automatique et linguistique appliquée

Émile Delavenay

La linguistique appliquée, science en plein essor.

Il apparaît aujourd'hui de plus en plus clairement que l'application de l'automatisme aux mécanismes de la pensée nous achemine vers une révolution des moyens de communication et de conservation du contenu exploré et conscient de l'esprit humain, comparable à la révolution de l'imprimerie au seizième siècle. Pour tous ceux dont la vie professionnelle et intellectuelle gravite autour de l'écrit ou du parlé, ou dont les communications avec leurs contemporains ou avec l'avenir dépendent de l'écrit, cette révolution du vingtième siècle appelle un réexamen des méthodes et des fins de leurs communications. Pour ceux enfin qui à des degrés et dans des buts divers s'intéressent à l'étude du langage, une nouvelle constellation de disciplines prend forme aux confins de la cybernétique et de la linguistique nouvelle : son contenu et ses frontières varient encore selon les pays et les écoles, mais à Moscou comme à Washington on lui donne le même nom, celui de linguistique appliquée.

Les sciences appliquées naissent pour la plupart des besoins de la société où elles se développent. Sans doute est-il peu d'exemples d'une science pure conduisant à elle seule, sans l'impulsion d'un besoin social, à la naissance d'une science appliquée. C'est le besoin qui, de notre temps, permet de dégager les moyens financiers indispensables à une recherche tant soit peu complexe et donc vorace de temps et de talent. Tel est bien le cas de la linguistique appliquée. Ni la curiosité scientifique ni l'ingéniosité des phonéticiens n'ont fait davantage pour l'étude de certaines lois du langage susceptibles d'applications pratiques, que, par exemple, la recherche des meilleures conditions des transmissions téléphoniques; les études des ingénieurs des télécommunications sur la transmission des signaux ont abouti à la théorie de l'information, où la linguistique trouve de nouvelles idées et de nouveaux moyens pour l'étude désintéressée et même philosophique du langage. Ce ne sont là que des commencements.

Multiples et divers en effet, les besoins de notre temps qui nous imposent de mieux connaître les lois fondamentales du langage correspondant à la complexité croissante des relations entre groupes humains à la surface de notre planète, bientôt peut-être dans l'espace inter-astral. L'expansion de ces besoins coïncide en outre avec la maturation des peuples ayant récemment accédé à l'indépendance, avec la multiplication des relations internationales, créatrice d'immenses besoins de traduction; avec l'expansion de nos connaissances, demandant un nombre croissant de mots pour les désigner; comme aussi avec la nécessité où se trouve l'homme, face à face avec ses propres inventions, de donner à son langage une rigoureuse exactitude dans l'expression, parce que ce langage doit servir aussi et de plus en plus à établir une communication entre le cerveau humain et des machines. Celles-ci, ne pensant pas, étant comme des corps, des muscles et des nerfs artificiels s'ajoutant au corps humain, doivent recevoir des signaux dépourvus d'ambiguïté, soit pour agir instantanément, soit pour être à même d'interpréter correctement des signaux ambigus grâce à un travail logique, admirable certes, mais tout de même limité. La machine nous invite à nous débabéliser; or Babel est partout, même là où l'on a l'illusion de parler une même langue. L'anti-babel est une nécessité de notre civilisation; le langage un outil dont la précision doit s'accroître si notre civilisation veut conserver sa cohésion et pouvoir se communiquer par les voies de l'intelligence et non par un traditionalisme plus ou moins instinctif.

Linguistique synchronique et étude des signaux.

Autour du système de signaux conventionnels qu'est tout langage, s'est donc organisée toute une gamme de recherches éclairant chacune l'un des aspects multiples et mutuellement enchevêtrés de systèmes de communications propres à l'homme, allant des premiers cris poussés par le nouveau-né pour attirer l'attention maternelle, jusqu'aux plus complexes expressions des relations tribales et familiales, aux structures abstraites de la plus haute philosophie, aux euphémismes ou mensonges de la plus basse politique. Et qu'on le souhaite ou non, les significations, depuis celle de la voile noire de Thésée jusqu'à celle de la "Vernunft" kantienne, depuis celle du phare qui clignote, du signal en morse de la radio, de la première syllabe balbutiée par l'enfant, jusqu'à la formule einsteinienne E = mc2, seront le légitime sujet d'étude de la linguistique appliquée, comme le seront tous les divers aspects des rapports entre signifiant et signifié. La question qu'est-ce que cela veut dire? posée par la mère anxieuse cherchant à comprendre les cris de son bébé, par le radio qui vient de capter un signal indéchiffrable, par Champollion devant la pierre de Rosette, par le traducteur devant une phrase renfermant un message hermétique soit en lui-même, soit parce qu'il n'est pas dans le bagage intellectuel de ce traducteur, cette question se situe au centre des problèmes de toute linguistique appliquée, elle est la raison d'être de cette science.

Mais il n'est pas de réponse à ce pourquoi si l'on ne tient pas d'abord la réponse à d'innombrables comment. Autour de ce problème central de la signification, auquel nous ramènent tous les autres, s'étagent et s'organisent des recherches étroitement reliées à lui comme entre elles. Toutes les ressources de la linguistique pure entrent en jeu, sauf peut-être ses ressources historiques : les études linguistiques de notre temps sont placées sous le signe de la synchronie, contrairement à la linguistique diachronique de naguère. Le passage des signaux du langage dans des machines pose toutes les questions sur les matérialisations de la pensée par des sons et des signaux visuels. Phonèmes et graphèmes, et leurs complexes relations, doivent faire l'objet d'études rigoureuses. Il en est de même des morphèmes et syntagmes, des sèmes et de leurs significations dans le présent. Car c'est tout le système complexe de signification du langage qui est en cause; chaque étude séparée touche à une autre étude voisine, mais qui doit rester distincte pour que l'analyse progresse. Même les études de stylistique ne pourront pas rester étrangères à la linguistique appliquée. Bien qu'elles doivent porter sur des aspects non strictement cognitifs du langage, il importera de tracer nettement la frontière entre ces aspects cognitifs et les domaines voisins et parfois chevauchants propres à l'esthétique du verbe. Si le langage est en effet une matière plastique moulée à leur gré par les artistes - poètes ou prosateurs - c'est sur un double jeu portant sur le cognitif et l'esthétique, que se fonde leur art, dans lequel, comme le rappelle Roman Jakobson, règne le jeu de mot ou paronomasie.

Rôle privilégié de la traduction.

Si la traduction est redevenue d'actualité, c'est entre autres raisons parce qu'elle se situe au cœur même de ce nœud de problèmes, jamais encore tout à fait séparés par une analyse définitive. Or les recherches entreprises en vue d'automatiser la traduction des textes scientifiques et techniques permettent, et elles exigent, d'isoler dans le discours les éléments divers du message transmis - éléments phoniques, graphiques, lexico-sémiotiques, esthétiques, etc. Elles exigent, tout au moins au début, que l'on étudie les graphèmes indépendamment des phonèmes, et que l'on prenne pour base le langage écrit - même si cet effort doit souligner les inconséquences des transcriptions alphabétiques de certaines langues, écrites depuis trop longtemps pour la simplicité de leur orthographe. Puis, par delà ces distinctions effectuées au niveau des signaux constitutifs du message, il en est d'autres qui deviennent nécessaires et possibles : les travaux en vue de la traduction automatique ont mis en train des analyses et des expériences permettant d'isoler les éléments cognitifs du discours, des éléments stylistiques ou esthétiques; on devra donc distinguer entre les signaux, la signification cognitive, et ces aspects additionels de la signification qui sont du ressort de la suggestion esthétique plutôt que de l'information. Les méthodes d'expérimentation analytique exigées par l'automatisation du langage apportent à la linguistique des moyens d'investigation scientifique permettant une plus rigoureuse séparation entre l'information et la poésie, dans l'analyse des messages écrits. De même elles comportent une application rigoureuse de l'analyse logique pour la détermination du contenu d'information authentique d'un message.

Il est d'autres raisons profondes qui donnent un rôle particulier à la traduction automatique au cœur des problèmes de la linguistique appliquée. L'homme n'a jamais inventé de système d'expression plus riche ni plus varié que le langage. Les artistes plastiques et les musiciens me pardonneront si je souligne que la valeur sémiotique de leurs œuvres peut être décrite par des mots, plus souvent et plus fidèlement que leur art ne peut par ses moyens propres évoquer tout ce qu'exprime le langage. Et le système sémiotique qu'est le langage est essentiellement cognitif et descriptif, dans la mesure où il est avant tout social. Pour le milieu concret de l'homme, le langage constitue un miroir; il fixe le milieu abstrait et les structures de l'esprit, le dynamisme du devenir; il sait aussi épouser et évoquer ce dynamisme, comme peut le faire la musique. L'univers de l'expérience et l'univers du discours tendent à s'équivaloir et à se confondre. Chercher à mécaniser la transposition de l'expression écrite ou parlée d'une langue dans une autre, c'est donc chercher à établir une double équation entre l'univers de l'expérience, et deux univers du discours qui le reflètent tous deux, mais avec des chatoiements différents. Réussir partiellement, c'est affirmer et démontrer la fonction du langage comme outil de notre civilisation humaine, c'est étendre son utilité et accroître sa valeur comme moyen de compréhension entre les hommes.

La machine une fois en mesure de traduire des phrases d'une langue dans une autre, et douée de mémoires suffisantes pour le faire de façon massive, sera aussi en mesure de retrouver et de classer les concepts, c'est-à-dire de retrouver de l'information sans passer par des codages artificiels et plus ou moins arbitraires comme on en cherche actuellement un peu partout pour les besoins de la documentation. La machine à traduire apportera indubitablement un moyen fécond de dépouillement et de classement des connaissances, ayant pour base les mots du dictionnaire. Dans la traduction, automatique ou humaine, le mot ou l'unité sémantique évoque l'idée, qui évoque à son tour le mot de la langue de sortie. Ce mécanisme présuppose une mémoire bien agencée, qui peut servir au classement des titres d'une bibliothèque, comme à celui de l'analytique des ouvrages répertoriés dans une bibliographie. L'univers du discours bien classé servira ainsi de guide au lecteur à travers les rayons d'une bibliothèque. La traduction nous achemine vers des solutions complètes du problème de la recherche d'information.

Programmes de traduction automatique améliorés par voie cumulative.

Où en est aujourd'hui la traduction automatique ? Quant à ce qui s'est fait de 1946 à 1959, on me permettra de renvoyer le lecteur à mon livre récent 1, à une conférence publiée dans la revue Impact 2, aux deux articles de Michael Corbe dans la revue Automatisme 3 faisant le point des travaux russes et américains, et aux études de M. A. Sestier dans Ingénieurs et techniciens 4. Que l'accent soit mis par les uns sur la syntaxe ou les structures, par d'autres sur le lexique, des traductions partielles sortent aujourd'hui de machines qui n'ont pas été spécialement construites pour cet usage. Ces traductions sont revues et raffinées par des « éditeurs » qui inscrivent dans la mémoire de la machine les équivalents sémantiques et les règles de syntaxe ou de traduction dont la comparaison de l'original et de sa traduction révèle la nécessité. Ainsi se poursuit un processus d'amélioration progressive et cumulative des programmes. Cependant beaucoup dépend, et dépendra de plus en plus, des conceptions de base de ces programmes. Tel système de traduction qui donne des résultats assez encourageants à première vue, peut fort bien devenir inopérant et comme paralysé par l'accumulation de ses propres raffinements. En effet chaque nouvelle règle ajoutée pourrait, en raison d'une erreur de conception initiale ou d'une analyse insuffisante du problème de la traduction, devenir une cause de ralentissement dans l'exécution du programme. Tant et si bien que le programme parfait auquel on pourrait théoriquement aboutir coûterait plus cher que le meilleur traducteur humain. Si des traductions automatiques, imparfaites mais immédiatement utilisables par des spécialistes du sujet traité, sont dès maintenant possibles, la traduction pleinement automatique et de haute qualité, pour reprendre l'expression de Bar Hillel, ne l'est actuellement nulle part et elle ne le deviendra sans doute que grâce à une recherche fondamentale portant sur les assises profondes du langage comme système sémiotique.

Le double chemin de la découverte.

Ainsi se dessine pour la découverte une double voie : d'une part on devra poursuivre et approfondir les études plus ou moins empiriques d'analyse lexicographique bilingue et d'analyse structurale comparée qui ont rendu possibles les travaux actuels d'équipes soit américaines comme celles de Rand Corporation, de Ramo-Wooldridge, de Seattle, de Harvard, et de Georgetown; soit russes comme celles de l'Institut Steklov de mathématiques et de l'Institut de calcul numérique et de mécanique de précision. Sans de telles études, on ne saurait espérer aboutir à emmagasiner dans les mémoires des machines électroniques des quantités de faits linguistiques suffisantes pour permettre d'atteindre l'étape suivante. Cependant il est d'autre part indispensable de pouvoir envisager l'ensemble des recherches de linguistique appliquée d'un point de vue synthétique, et de mettre au travail des chercheurs susceptibles d'aboutir à une théorie générale de la signification linguistique, pour jeter les bases d'un programme universel de traduction. Il est difficile de contester l'utilité à long terme de telles recherches, et l'on ne peut vraiment discuter que de leur échelonnement dans le temps et de leurs points de départ théoriques. Mais ce n'est en rien diminuer le rôle important de la logique et des mathématiques, dans un ensemble de travaux dont le langage reste l'objet, que de souligner que les positions théoriques de ces sciences seront sans point d'appui tant que n'existera pas la somme d'observations précises des faits linguistiques sur lesquelles elles pourront vraisemblablement opérer. Il faut traduire à la machine, le plus vite possible et le plus possible, pour recenser les faits qui permettront de le faire mieux, et peut-être de découvrir des programmes universels plus économiques que les programmes bilatéraux.

Mais quel chemin à parcourir pour arriver à ce point de départ! Et combien de choix s'imposent dès l'abord, chacun d'entre eux limitant les possibilités de choix ultérieurs et conditionnant les solutions de l'ensemble des problèmes.

Former des hommes pour utiliser les machines.

Il ne faudrait pas se laisser influencer à l'excès au départ par les considérations relatives au type de machine qui sera éventuellement utilisé pour traduire. Il existe aujourd'hui des calculatrices électroniques nombreuses et aux caractéristiques diverses. Le fait que la machine à traduire sera probablement une machine dotée d'une mémoire fortement développée (à grande capacité et d'un accès ultra-rapide) et d'un appareil logique relativement moins puissant, ne nous empêchera pas de nous servir provisoirement des machines existantes, faites pour résoudre des problèmes administratifs ou scientifiques d'une tout autre nature que ceux de la traduction. Il importera surtout de s'assurer que les machines employées font partie d'ensembles adaptables à des fins diverses et dont les parties peuvent être combinées à volonté pour répondre à ces fins - préoccupation qui coïncide d'ailleurs avec celle des grands constructeurs soucieux d'étendre les applications de leur matériel. Il faudra surtout utiliser du matériel largement et aisément disponible, de façon à pouvoir développer au maximum selon un plan d'ensemble les travaux préliminaires, ceux dans lesquels la collaboration étroite de l'homme et de la machine demande l'emploi de machines pouvant attendre leur partenaire plus lent.

Le nombre d'heures de patiente préparation consacrées à la compilation de dictionnaires bilingues et de relevés de structures, et à leur mise en forme pour le traitement automatique par des machines, sera considérable par rapport au temps demandé pour faire une traduction de quelques centaines de lignes sur une IBM 704 ou sur une Gamma 60. Il sera possible de travailler sur des tronçons de programmes, par équipes séparées, ayant accès d'abord à des machines à cartes perforées puis à des calculatrices, à condition que les données générales et techniques du problème aient été définies d'avance et que chaque équipe se conforme strictement au plan général, lequel peut très probablement être conçu pour n'importe quelle calculatrice électronique plutôt que pour un modèle donné de calculatrice. Il sera en tous cas essentiel de permettre aux linguistes de travailler à l'abri de toute préoccupation technique relative aux programmes de la machine ou au type même de machine, dans un cadre où ils puissent utilement appliquer leurs connaissances en préparant le langage pour son traitement automatique. Pour une très large partie du travail préparatoire, ni le type de machine utilisé, ni le type de programme conçu pour cette machine, ne seront d'une importance quelconque dans l'analyse de la langue.

Mémoire et logique, deux aspects du langage préparé pour la machine.

Par contre il est certain que la machine aura une mémoire et un appareil logique lui permettant non seulement de rechercher dans cette mémoire les mots et les règles de traduction, mais aussi de modifier l'ordre et la nature de ses sous-programmes selon les indications trouvées dans la mémoire. L'importance relative des données mises en mémoire de façon statique, et des programmes et sous-programmes d'analyse et de synthèse, pourra varier, ainsi que les méthodes selon lesquelles les indications fournies par les linguistes sur la langue d'entrée et la langue de sortie seront ordonnées dans les diverses parties de la machine. Les décisions définitives sur ces points-là dépendront du type de machine adopté, et dans une large mesure du vocabulaire et de la structure des deux langues sur lesquelles on travaillera, comme de leur morphologie, bref de ce qu'Andreev appelle leur « congruence ».

Une des premières tâches consiste à énumérer toutes les indications devant être notées dans la ou les mémoires à propos de chaque mot, à les classer selon qu'elles sont permanentes quelles que soient la fonction ou la forme du mot dans la phrase, ou particulières à ce mot dans un contexte donné. Cette distinction entre informations permanentes et contextuelles relatives au mot devra permettre ultérieurement de répartir les tâches entre mémoire statique et programmes dynamiques, les caractéristiques lexicales stables du mot étant probablement inscrites dans la mémoire lexicale, tandis que ses caractéristiques contextuelles, et donc instables, feront l'objet d'instructions de sous-programmes plus ou moins détaillées.

Ce travail préliminaire peut être mené à bien par des équipes relativement peu informées des exigences de la machine, à condition qu'elles soient bien encadrées, et que leurs travaux s'intègrent dans un plan préconçu et soient soumis à des vérifications et à des améliorations régulières, à la lumière de premiers essais permettant de tester les notations et les programmes qu'elles déclenchent. Au sein de ces équipes, la présence des techniciens de la programmation pour calculatrices électroniques est indispensable, pour que les linguistes ne perdent pas de vue les caractéristiques propres au type d'analyse qu'on leur demandera : une analyse faite pour une machine sans éclair de conscience, à qui il faut tout dire parce qu'elle ne devine jamais.

Commencer par des dénombrements.

De même que pour les machines, point n'est besoin de prendre prématurément position entre diverses théories ou ébauches de théories linguistiques. Il est fort séduisant de penser qu'une explication générale des faits du langage pourrait grandement accélérer la recherche en vue de l'automatisation de la traduction et de la recherche d'informations. Cependant le langage reflète l'univers des représentations, concrètes ou abstraites, particulières ou générales; et l'information par lui communiquée varie en particularité ou en généralité selon les intentions du sujet parlant. C'est pourquoi la traduction, qui est une transposition d'information - tout autant que la recherche d'information, laquelle se fonde sur l'enregistrement détaillé ou analytique des faits recherchés, - ne saurait sans perte d'information s'écarter beaucoup du degré de particularité voulu par l'auteur d'un texte. Il est donc fort difficile de concevoir comment une théorie générale qui soit autre qu'une taxonomie générale, qu'un inventaire méthodique, permettra jamais une simplification importante d'un problème à la base duquel on retrouve toujours le mot, c'est-à-dire soit l'outil grammatical, soit le signifiant établissant un rapport entre un esprit et un signifié.

C'est pourquoi nous estimons qu'entre les empiristes de la traduction automatique et les théoriciens cherchant une explication générale, il n'y a en dernière analyse d'opposition que sur des nuances, les uns étant plus conscients de la mouvante diversité du langage, les autres plus désireux de pouvoir généraliser les lois assez rigoureuses qui régissent toute langue en tant que code systématique et convention sociale. C'est pourquoi aussi les options entre empirisme lexical, structuralisme, formalisation mathématique, etc. sont en somme assez irréelles, et qu'il faut bien en venir à cette "combined theoretical and empirical line of attack" définie par Reifler et qui a donné d'excellents résultats 5. Il s'agira de dénombrer des mots, des sens de ces mots, des règles d'association des mots entre eux, bien plutôt que de chercher une pierre philosophale de toutes les traductions.

Les équipes explorant les relations de deux langues données en vue de la traduction automatique bilatérale à sens unique (nous aurons déjà fait un choix important en définissant ainsi de façon restrictive le rôle de ces équipes et en excluant au début une recherche générale de traduction universelle) devront néanmoins s'efforcer de travailler de telle façon que ne soit exclue aucune option importante à un stade ultérieur de la recherche. Il faut en effet pouvoir tirer le parti maximum de leur travail à un moment quelconque, quelle que soit l'option choisie à ce moment-là en matière de machine ou de programme pour la suite des opérations. Ces équipes devront aller progressivement du particulier au général, le particulier ne pouvant réellement être au départ qu'un corpus ou recueil de textes de la langue d'entrée, dans lequel chaque mot sera étudié sous le double rapport de ses caractéristiques permanentes et contextuelles, et naturellement aussi du point de vue de la morphologie s'il s'agit d'une langue peu ou prou fléchie. Cependant outre ce travail lexicographique elles pourront simultanément engager l'étude sous son aspect structural; un groupe par exemple s'intéressera au recensement des mots et à l'identification de leurs caractéristiques grammaticales, tandis qu'un autre étudiera dans le même corpus les structures - étude étroitement liée à celle des caractéristiques grammaticales permanentes et contextuelles des mots, et pouvant avoir aussi des liens avec leur examen du point de vue sémantique.

Nous voyons ici qu'une troisième étude s'imposera : celle de la signification des mots de la langue d'entrée du point de vue de leur traduction dans la langue de sortie. Cette analyse sémantique se fait sous l'angle des correspondances de sens de langue à langue et de l'examen comparatif de l'aire de signification d'un mot de langue A et du mot ayant un même sens dans la langue B. Ces trois études pouvant être menées de front par trois équipes différentes, il sera nécessaire de relever, selon les normes communes, toutes les interférences de chacune des trois études sur chaque autre, ce qui amènera assez rapidement à isoler et à classer les problèmes les plus complexes, c'est-à-dire ceux où structure, morphologie, lexique, et signification probable, devraient entrer en jeu pour résoudre une ambiguïté. C'est cette étude des interférences qui aboutira à la formulation des programmes de traduction des structures difficiles. Quant aux cas faciles, l'inventaire des mots et des structures aura à lui seul permis de les résoudre par simple équivalence de langue à langue. Il conviendra de déterminer le plus tôt possible la proportion des cas simples et des cas difficiles pour un couple de langues.

Codage, synabolisations, auto-programmation.

Les travaux esquissés ci-dessus étant proprement linguistiques et pouvant être confiés à des hommes n'ayant sur les machines et leur fonctionnement que des connaissances élémentaires, ils ne pourront cependant pas être conçus indépendamment d'un travail sur machines qui devra commencer le plus tôt possible en vue de la mécanisation graduelle de la plus grande partie de la recherche. En effet chaque acte de recensement des formes, des mots, des structures et des sens doit aboutir à une notation brève et autant que possible codée, qui puisse être utilisée directement, ou transcodée, soit sur des cartes perforées, soit sur tout autre support accessible à une machine électronique aux fins de travaux statistiques, de classements, et de traduction. Un premier codage cohérent et systématique des notations linguistiques dès l'étape « humaine » du travail s'imposera si l'on veut mécaniser le plus possible les travaux dès le départ; il est probable que des tâtonnements s'imposeront au début, même en admettant la plus entière et la plus parfaite coopération entre les ingénieurs des calculatrices et les linguistes. A un niveau de recherche relativement élevé, une première analyse des données linguistiques et électroniques du problème, conçue de façon à laisser ouvertes les possibilités de résoudre les imprévus, devra s'instituer afin que soit tracé le cadre général du codage et de la symbolisation mathématique des programmes de traduction, dans lesquels devront s'intégrer les observations des linguistes. Ce sera toutes proportions gardées l'équivalent du COMIT d'Yngve et du M.I.T.

C'est particulièrement dans le domaine de la reconnaissance automatique des structures que la collaboration de la première heure entre linguistes et ingénieurs sera nécessaire et féconde : il faut en effet non seulement distinguer et classer les structures d'éléments de la phrase, mais les relier aux symboles exprimant les fonctions possibles des mots, établir entre ces symboles et certaines structures des rapports fixes, exprimer le tout par une symbolisation rigoureuse et aussi économique que possible, et, pour certains cas d'ambiguïté, concevoir un programme permettant à la machine d'essayer plusieurs structures, et de choisir entre elles celle dont il est possible de « faire la preuve ».

Ces étapes une fois franchies, il sera possible de commencer divers types de traductions automatiques rudimentaires. Les unes seront des mot-à-mot, à structure déficiente parce qu'ils se fonderont sur une analyse simplement lexicale, et laisseront au lecteur le choix entre des constructions diverses et des sens multiples. D'autres, à base d'analyse structurale, seront des « bloc-à-bloc » dans lesquels on reconnaîtra des suites de mots correctement ordonnés, beaucoup de mots n'étant cependant pas encore traduits, et apparaissant dans la langue d'entrée; d'autres proviendront de la combinaison des deux programmes, et de leur amélioration progressive grâce à l'examen critique dont ils feront l'objet; il pourra en provenir petit à petit des brouillons de traductions plus perfectionnés et de plus en plus compréhensibles pour d'autres que les techniciens de la traduction automatique.

Esquisse d'un programme.

Cet aperçu des travaux qui permettront de commencer de traduire à la machine - c'est-à-dire de se mettre en mesure de découvrir les moyens d'améliorer les traductions automatiques, de tirer parti des recensements de faits opérés au cours de leur préparation, et de la critique des programmes utilisés, - est de nature à suggérer les grandes lignes de l'action qui peut utilement être entreprise là où cela n'est pas encore fait, notamment en France, en vue du développement de la linguistique appliquée. Il est trop évident que la recherche devra être menée simultanément sur divers plans, - celui de la technique et de l'industrie d'une part, celui de la linguistique de l'autre. Et qui dit linguistique dit social, puisque toute action concertée sur le langage donne lieu à discussions et à réactions dès qu'elle heurte de front ou même indirectement certaines habitudes inconscientes. On sait par exemple quelles difficultés s'élèvent devant les plus timides tentatives de normalisation des translittérations, et combien chacun tient à des habitudes orthographiques totalement anarchiques. Parce que l'on ne pourra pas agir sur tous les fronts à la fois, et parce que le technique ira beaucoup plus vite que le social, il faut donc établir un plan d'ensemble, choisir les domaines d'action prioritaire, garder le contact avec tous les aspects du problème sans espérer pouvoir agir partout simultanément.

Le soin de développer et d'améliorer les machines existantes peut être laissé aux constructeurs et à leurs bureaux de recherches. Ici les besoins sont connus dans la plupart des cas longtemps d'avance, et les recherches sont en cours. Amélioration de la capacité et de la vitesse d'accès des mémoires, mise en œuvre de programmes automatiques pouvant découvrir sans intervention humaine la solution des problèmes posés, création d'appareils de lecture automatique des textes imprimés, études d'appareils à transcrire alphabétiquement les paroles, tout cela est en train; il suffira que les linguistes prennent conscience de leur rôle, définissent en termes accessibles aux ingénieurs les problèmes qui leur sont propres. C'est là un premier et urgent besoin, où s'impose une action concertée interdisciplinaire.

Une nouvelle association scientifique.

Il est donc nécessaire tout d'abord de former des hommes pour cette action interdisciplinaire, et pour cela de diffuser des idées et des connaissances sur la linguistique appliquée, dont le développement s'accélère. Ne vient-il pas de se constituer à Washington, avec l'aide de puissantes fondations, un Centre de linguistique appliquée, fondé par la Modern Language Association of America ? A Léningrad, N. D. Andreev définit avec force les tâches de cette science 6 tandis qu'à Moscou s'est fondé un Institut de linguistique appliquée et paraît une revue intitulée Traduction mécanique et linguistique appliquée 7. Répandre et approfondir les connaissances dans ce domaine, développer l'attitude d'observation scientifique devant le fait linguistique, recenser les problèmes, en chercher les liens entre eux et avec les sciences et disciplines voisines, voilà quelques-unes des premières tâches à accomplir.

C'est du sentiment de l'urgence de ces tâches, et du désir de favoriser en France la mise en œuvre des moyens propres à l'accomplir, qu'est née à Paris l'Association pour l'Étude et le Développement de la Traduction automatique et de la Linguistique appliquée (ATALA), fondée à l'automne de 1959, dans le but d'informer et de former des hommes par l'échange de leurs connaissances. Elle fait suite à un petit groupe international d'études sur la traduction automatique, dont l'auteur de ces lignes avait pris l'initiative en 1958 avec quelques collègues; les exposés présentés par les membres du groupe devant quelques invités permirent une assimilation assez rapide de certains aspects interdisciplinaires de la recherche, et convainquirent chacun de l'utilité de ces rencontres; bientôt un sous-groupe s'attaquait aux problèmes de la traduction automatique d'anglais en français. Dès l'été de 1959, la décision était prise de transformer le Groupe qui avait grandi rapidement par cooptation, en une Association française conforme à la loi de 190I, sans buts lucratifs et consacrée à des fins éducatives et scientifiques. C'était chose faite dès octobre 1959, et l'Association se mettait aussitôt à l'œuvre pour étudier ses moyens d'action et définir son programme scientifique.

Les buts de l'ATALA sont ainsi précisés dans ses statuts :

« Article 2.

« L'Association a pour but de favoriser l'étude des problèmes linguistiques scientifiques et techniques de la traduction automatique ainsi que la coordination et l'organisation des efforts individuels dans ce domaine, et de faciliter ainsi les échanges scientifiques et culturels de nature à raffermir la paix. Pour atteindre ces buts elle se propose en particulier :
a) d'assurer l'information mutuelle de ses membres sur la traduction automatique et sur les domaines et techniques connexes, notamment par la publication d'une revue ou d'un bulletin, d'ouvrages et de tous autres documents intéressant le domaine de son activité;
b) d'établir, en vue d'échanger des informations, des contacts avec tous autres groupements s'intéressant aux mêmes sujets qu'elle-même;
c) d'encourager et d'aider ses membres à effectuer des travaux pratiques ou des études spéciales dans les domaines ci-dessus;
d) de participer activement à la diffusion des connaissances acquises dans le traitement électronique de données linguistiques et logiques;
e) plus généralement de contribuer, sous toutes les formes utiles et par tous moyens appropriés, à la réalisation de la traduction automatique et au développement de la linguistique appliquée.

« Article 3.

« L'Association s'efforcera de promouvoir la création d'une Fédération Internationale des groupements nationaux ayant le même objet et pourra constituer éventuellement la section française de cette Fédération. »

L'Association s'est préoccupée de se donner un programme aussi précis que possible, à l'élaboration duquel président les principes suivants : conserver à l'Association son caractère de libre lieu de rencontre de toutes les bonnes volontés, et son indépendance; éviter les doubles emplois avec toute institution officielle ou privée existante ou future exerçant une activité connexe, et rechercher au contraire toute occasion d'aider cette activité par les moyens propres à une association libre; s'employer à faciliter sur le plan national et international les échanges les plus complets d'informations afin de stimuler la recherche et la diffusion des connaissances ; entreprendre dès que possible des projets-pilotes de recherche, ne serait-ce que pour maintenir ses membres en contact étroit avec la réalité des travaux pratiques, et ne jamais se confiner dans une atmosphère académique et théorique.

La mise en œuvre de ce programme dépendra dans une certaine mesure des appuis matériels dont bénéficiera l'Association - prestations de services par les grandes firmes spécialisées dans la fabrication et l'emploi des machines électroniques, cotisations exceptionnelles de membres bienfaiteurs ou contrats de recherche et subventions.

En attendant que se précisent ces perspectives, un premier programme provisoire comporte les points suivants : I° Travaux d'ordre pratique sur la traduction automatique; 2° formation de cadres; 3° communications et information; 4° organisation matérielle du travail; 5° travaux théoriques.

Travaux pratiques : il a été décidé après une large discussion que ces travaux porteraient tout d'abord sur la traduction d'anglais en français, qui n'a été entreprise ni étudiée jusqu'ici par aucun autre groupe. Les premiers efforts consisteront à définir une méthodologie. Déjà un comité scientifique de l'Association est au travail. Il a présenté un premier rapport d'activité fort encourageant, réparti les tâches préliminaires et recensé les problèmes.

La possibilité d'entreprendre des travaux sur d'autres langues n'a pas été exclue, mais devra attendre que le nombre des membres actifs soit suffisant pour permettre à un groupe assez nombreux de s'en occuper. Il sera par exemple intéressant d'étudier les caractéristiques de la traduction d'une langue romane dans une autre, afin de déterminer la nature et l'importance des difficultés rencontrées, et de rechercher des possibilités de « tronc commun » à des programmes de traduction entre langues d'une même famille.

Enseignement.

Les réunions scientifiques régulières de l'Association et de ses Comités de travail constituent déjà une des formes les plus précieuses d'enseignement avancé et continuent l'œuvre de l'ancien Groupe international d'études. Le recrutement initial de nouveaux membres dans les milieux universitaires et industriels a dépassé les espoirs des premiers fondateurs, et l'Association est en mesure de réunir des compétences très diverses et d'éclairer de nombreux problèmes de linguistique appliquée, en faisant appel aux connaissances de ses membres. Elle pourra au besoin fournir à toute institution d'enseignement en faisant la demande des conférenciers susceptibles de traiter des sujets généraux ou particuliers. Il est en outre prévu de formaliser dès que possible cet enseignement mutuel et de l'étendre, par exemple en organisant un séminaire régulier auprès d'une institution d'enseignement supérieur. Il pourrait avoir pour objet une étude critico-historique de ce qui a été fait dans le domaine de la traduction automatique; il pourrait aussi aborder l'étude d'un problème à la fois étendu et précis, comme par exemple celui de la langue-pivot ou langue universelle de machine, étroitement lié au thème de la formalisation des langues naturelles aux fins de recherches documentaires.

Les travaux des comités scientifiques de l'Association permettront dans les prochains mois de déterminer dans quelle mesure celle-ci sera prête au cours du second semestre de 1960 à entreprendre ces tâches en liaison avec une institution publique de hautes études.

Communications et information.

Autant pour les relations intérieures de l'Association, dont tous les membres ne peuvent pas participer à tous les travaux, que pour ses relations extérieures en France, et à l'étranger où elle s'est déjà assuré de précieux contacts, la création d'un organe de liaison permettant les échanges d'idées et d'informations est indispensable. Un comité a été chargé de préparer la publication de ce bulletin, qui sera tout d'abord une feuille polycopiée distribuée aux membres et à laquelle il pourra être souscrit des abonnements. Les premiers numéros seront largement consacrés à la publication de fiches signalétiques sur les ouvrages et articles intéressant les travaux de l'ATALA, le bulletin pouvant ainsi reprendre et continuer le travail bibliographique entrepris dès 1958 au sein du Groupe international 8.

Organisation matérielle du travail.

Le Bureau provisoire de l'Association s'est jusqu'ici abstenu de prendre des engagements financiers importants, désirant avant de le faire asseoir solidement les ressources sociales. Cependant il est permis d'envisager la constitution dans la première moitié de 1960 d'un petit noyau permanent, assurant le secrétariat et les liaisons nécessaires, et fournissant un point d'appui aux travaux bénévoles des membres. Cette question pourra probablement être réglée dès après la constitution, par la première Assemblée générale annuelle, du Conseil d'administration prévu par les statuts. Il paraît déjà indispensable d'envisager la désignation de plusieurs chercheurs travaillant à plein temps et pouvant appuyer et consolider les travaux des comités scientifiques. Il n'est pas déplacé de rappeler à ce propos que les premières cotisations de quinze ou seize membres bienfaiteurs permettraient de rémunérer un jeune chercheur sur une base régulière.

Travaux théoriques.

La composition même de l'Association lui assure la possibilité de stimuler chez ses membres des travaux théoriques d'exploration des domaines limitrophes à la linguistique appliquée. Jusqu'ici des travaux de deux ordres ont été retenus comme susceptibles de mettre en lumière certains aspects importants des travaux pratiques. D'une part, une étude est prévue, en rapport direct avecla traduction de l'anglais en français, sur la stylistique comparée de l'anglais et du français scientifiques. Il s'agira d'appliquer à la stylistique des méthodes déjà mises au point par M. J.-C. Gardin pour les études archéologiques, et de tracer à l'aide de moyens de mesure précis la limite entre les procédés d'expression strictement linguistiques et ceux qui sont du ressort de la stylistique. D'autre part, un comité scientifique chargé de prospecter les travaux déjà entrepris ou possibles sur des langues autres que l'anglais et le français, pense pouvoir se pencher avec fruit sur le problème de la « congruence » des langues, qui touche de près à celui de la langue-pivot. Par congruence de deux langues, on entend le degré de facilité avec laquelle elles se laissent traduire l'une dans l'autre, lequel n'est pas nécessairement lié à leur ressemblance ni à leurs origines communes.

Ces travaux d'approche vers les problèmes de la linguistique appliquée, comme d'ailleurs le nombre et la qualité des membres de la nouvelle Association, manifestent que les savants et linguistes français sont prêts à agir de concert dès que sera constitué le cadre de leur action collective. Plus n'est question ici en effet de travaux individuels, menés pendant toute une vie par des isolés. La linguistique appliquée met en œuvre des techniques et des connaissances tellement diverses, et demande un outillage si onéreux, que seuls peuventy participer activement des groupes interdisciplinaires constitués autour de moyens d'action collectifs. De divers côtés des initiatives sont et seront prises pour doter la France dans ce domaine de moyens de recherche conformes à ses besoins et à ses possibilités. Si comme il faut l'espérer des travaux à plein temps sont prochainement entrepris pour la mise en œuvre de programmes de traduction automatique de textes scientifiques, l'ATALA sera en mesure de stimuler l'intérêt des savants et des jeunes pour cette recherche. Elle jouera auprès des laboratoires officiels un rôle d'information et de liaison; elle pourra entreprendre des recherches limitées et précises sur des aspects particuliers de certains problèmes; et enfin elle assurera librement une liaison scientifique avec des centres de recherche étrangers. C'est là un rôle modeste en regard de l'ampleur des problèmes qui se posent autour du langage comme moyen de communication. Mais il ne faut pas sous-estimer la portée éventuelle d'une action limitée et précise, menée avec ténacité en vue de faire participer notre pays à un mouvement scientifique nouveau. L'Association qui vient d'être fondée a déjà permis de grouper des initiatives éparses et des tendances qui s'ignoraient mutuellement. Elle pourra rester en flèche par rapport à la recherche officielle et orienter au besoin celle-ci vers les problèmes nouveaux et les idées-forces.

  1. (retour)↑  E. Delavenay. - La Machine à traduire. -Paris, Presses Universitaires de France, 1959. Introduction to machine translation. London, Thames & Hudson, 1960.
  2. (retour)↑  Impact, Science et Société. Vol. 10, n°I.
  3. (retour)↑  Automatisme. Tome 4 (1959), nos 7-8 et n° 12.
  4. (retour)↑  Sestier (A.). - La Traduction automatique des textes écrits scientifiques et techniques d'un langage dans un autre. (In : Ingénieurs et techniciens. Mars-avril-mai et juin 1959).
  5. (retour)↑  Linguistic and engineering studies in the automatic translation of scientific Russian into English. -The University of Washington, 1959. - Outline of the Project : Intermediate MT systems as research tools.
  6. (retour)↑  Andreev (N.D.) et Zinder (L.R.)- Problèmes fondamentaux de la linguistique appliquée. (In : Voprosy Jazykoznanija. 1959, n° 4.)
  7. (retour)↑  Maisinnyi perevod i prikladnaja lingvistika, 1959.
  8. (retour)↑  Bibliographie de la traduction automatique, par E. et K. Delavenay. - La Haye, Mouton et Cie (à paraître).