Chargement en cours

Synthèses rédigées par les étudiants du cours de Culture numérique

La traduction automatique sur Internet

Outils, méthodes, enjeux

Laetitia Bernaudon , Eva Fontaine
La traduction automatique est un outil qui a subi de nombreuses évolutions depuis sa création, notamment avec la démocratisation d'Internet. Aujourd'hui, ce système soulève de nombreux enjeux socio-culturels : comment fonctionne cet outil, quelle utilisation en font les internautes et les professionnels (traducteurs littéraires, éditeurs) ?
(déposé le 2015-01-14 18:54:06)

La traduction automatique sur Internet : outils, méthodes, enjeux

La traduction automatique est un logiciel gratuit, accessible en ligne, permettant de traduire un texte dans une langue de départ vers une autre langue. Les plus connus sont Systran, Reverso, ou encore Google Traduction. D’abord utilisés dans un contexte militaire durant la Guerre Froide, ces logiciels servent aujourd’hui à une multitude d’utilisateurs pour une grande variété de pratiques. La banalisation de ces outils induit divers enjeux : en effet, il est intéressant de se demander qui les utilise et quels en sont les avantages et les inconvénients. Quels enjeux la traduction automatique implique-t-elle aujourd’hui, qu’est-ce que l’arrivée d’Internet a induit comme changements ? Pour répondre à ces questions, il conviendra en premier lieu d’étudier l’évolution de la traduction automatique, de ses usages, et de considérer les problèmes qu’elle soulève aujourd’hui dans un contexte économique et culturel.

1. Les débuts de la traduction automatique

Années 1950 : Création de la traduction automatique

Dans le domaine de l’informatique, les années 1950 constituent une période de premiers grands succès, tels que le traitement des données numériques, qui en est encore à ses premiers balbutiements aux Etats-Unis et en Grande-Bretagne. La traduction automatiques était alors appelée « traitement automatique des langues maternelles ». Mais à cette époque, la conception de cette pratique s’arrêtait à la simple idée qu’il suffisait de substituer les données numériques en des données alphanumériques, ce qui donnait une traduction très artificielle et non idiomatique dans la langue d’arrivée. Il s’agissait donc uniquement de traduire des mots, et non des expressions, voire des textes entiers comme aujourd’hui. A l’époque, la traduction automatique n’était pas considérée comme une activité reconnue, légitime, et les problèmes complexes liés à la syntaxe n’étaient pas abordés. En 1952, John Hutchins, expert mondial de la traduction automatique, donne une première conférence sur la TA, sans se faire d’illusions quant à l’idée d’une traduction parfaite : le manque de puissances des ordinateurs, ainsi que d’importantes lacunes en connaissances syntaxiques rendent les premiers outils de traduction peu efficaces. Le premier système de TA, présenté au public en 1954, et dont les recherches ont été financées par les États-Unis et la Russie dans un but stratégique, ne peut traduire que quelques phrases russes vers l’anglais, en utilisant un dictionnaire de 650 mots, comprenant 6 règles de grammaire. Ce logiciel, servant surtout à des fins militaires, était basé sur des règles de grammaires, rédigées par des linguistes, et fonctionnait de la manière suivante : la langue source était analysée dans sa structure grammaticale et le logiciel construisait un arbre syntaxique équivalent en langue cible. L’objectif était de donner un accès direct au contenu d’un message sans recourir à un traducteur professionnel.

Pendant que les Etats-Unis se limitent à cet usage, les recherches se poursuivent au Canada, au Japon et en Europe, avec notamment la mise en place du système Systran à la communauté européenne en 1976.

Premiers usages de la traduction automatique.

Tandis que, jusqu’alors, l'intérêt porté à la traduction automatique était surtout motivé par une demande sociale couplée à la curiosité scientifique qui découla, notamment, de la création des premières calculatrices électroniques, le rapport ALPAC de 1966 met fin aux financements de la recherche en matière de traduction automatique de la part des Etats-Unis et favorise la linguistique computationnelle.

Cependant, dès la fin des années 60, le besoin du développement de la traduction automatique est renforcé par des décisions législatives. En 1969, le Canada met en place la loi des langues officielles qui a pour but d’officialiser le bilinguisme du pays et de réaffirmer son biculturalisme; une législation qui nécessite un recours accru à des processus de traduction pour permettre aux locuteurs des deux langues officielles d’échanger et donc une recrudescence de la recherche dans la mise en place d’outils de traduction automatique des langues jusqu’alors en perte de vitesse car privée de subventions. Ce besoin accru d’outils de traduction automatique n’échappa pas au Capitaine André Gouin qui, dans sa thèse, développe l’idée du développement du système Systran, un des rares systèmes de traduction à avoir survécu au rapport ALPAC,  spécialisé dans la traduction automatique du russe à l’anglais pour la United State Air Force afin de l’adapter à la traduction du français à l’anglais. L’appui que reçut le Capitaine Gouin de la part du gouvernement canadien relança donc la recherche en traduction automatique avec une insistance particulière sur la paire de langues Français - Anglais.

Il n’est donc pas étonnant de voir que lorsque la Commission Européenne choisit d’utiliser Systran pour la traduction de ses documents internes; en 1976, la paire de langue la plus développée soit celle anglais - français. Fournie d’origine dans le système, elle a été utilisée sur de nombreux types de documents. Un travail de développement de la traduction automatique dans le sens inverse (Anglais - Français) a été entrepris conjointement par Systran et la Commision afin de prouver la flexibilité du système. Pour cela, on fit cett ois appel à des textes de grands organismes comme le CNRS. La deuxième paire a être développée pour la Commission Européenne, fut celle anglais - italien, afin de montrer qu’il était facile d’ajouter une langue cible à une langue source pré-éxistante et ainsi subvenir aux besoin des locuteurs italiens très présents à la Commission Européenne.

Ces utilisations du système Systran par des organismes officiels témoignent de la crédibilité grandissante dont peut jouir la traduction automatique. Délaissée par la recherche scientifique, c’est en outre ces mêmes organismes qui ont permis de relancer l’engouement pour la recherche en traduction automatique dont l’avenir était alors incertain.


2. Évolution : la démocratisation de la Traduction automatique

Usages pour les particuliers et les professionnels

Depuis la Deuxième Guerre Mondiale, beaucoup de pays ont investi dans la recherche pour élaborer une machine à traduire, et de nos jours, la traduction automatique a resurgi sous la forme de projets de recherche mais également de produits commerciaux destinés au grand public, via Internet.

Dans le monde de l’édition, les traducteurs se sont également approprié cet outil, dont la plupart peuvent en apprécier les vertus en en tirer avantage dans leur travail. Peu après l’arrivée des ordinateurs, des logiciels de traitement de texte et correcteurs orthographiques ont été mis à la disposition des traducteurs, ainsi que plusieurs outils dont la firme ALPS, crée en 1980, et utilisée en majorité par de grandes entreprises et des organismes internationaux. Le logiciel Trados, encore utilisé de nos jours, apparaît également en 1984, ainsi que Multitrans, crée quelques années plus tard par le canadien Gerry Gervais. Tous ces logiciels ont pour objectif de simplifier au maximum le travail du traducteur en l’assistant dans le processus de traduction et en lui ouvrant des passages préalablement traduits. Le traducteur professionnel doit maintenant choisir entre deux scénarii : partir d’une traduction automatique vers une traduction humaine, en l’améliorant, ou se servir de la TA en complément, c’est-à-dire en comparant les deux résultats en d’en choisir les éléments qu’il juge les plus pertinents.

Dans le premier scénario, le traducteur analyse les résultats de la traduction automatique, et ne garde que quelques parties qui lui paraissent satisfaisantes, ou en corrigeant les incohérences grammaticales, logiques, ou terminologiques ce qui peut constituer un gain de temps :

Exemple : élément source : « so long »

Traduction automatique : « tellement longtemps »

Traduction attendue : « adieu »

Dans le deuxième scénario, qui consiste à utiliser la traduction automatique en complément, le traducteur compare le texte à traduire aux mémoires de traduction : il s’agit de la mémorisation de données par un programme dans le but d’épargner à l’utilisateur l’effort de traduire deux fois les mêmes données.

Après une interruption des recherches suite au rapport ALPAC en 1966, estimant que la traduction n’offrait pas assez de perspectives, de nouvelles formes de TA refont surface avec la création de MOSES, un logiciel mis au point par Philippe Koehl en 2007, et PORTAGE, un projet lancé en 2004 par le CNRC (Conseil National des Recherches du Canada). Ces deux outils s’appuient sur des données statistiques et se basent sur des ensembles de textes afin de construire un modèle de traduction. Les traducteurs professionnels sont à nouveau pris en compte dans les nouveaux objectifs des traducteurs automatiques.

outils de traduction : fonctionnement et limites

La traduction automatique comprend en fait différent types de processus informatiques de traduction. En matière de traduction via informatique, différentes techniques et écoles s’opposent.

Un système de traduction automatique basé sur les règles ou exemples  doit être capable de maîtriser des règles grammaticales et syntaxiques propres à la fois à la langue source et à la langue cible afin de pouvoir reproduire des textes corrects de façon syntaxiques mais aussi sémantiques. C’est le cas de Systran dont nous avons déjà parlé. Ce genre de systèmes de traduction sont conçus conjointement par des experts informatiques et des linguistes qui fixent ces régles précises. Ils font appel à de nombreux dictionnaires spécialisés dans différents domaines pour coller au mieux au contexte du texte source.  Ainsi, le traducteur-machine peut prendre en compte (avec plus ou moins de justesse) la dimension sémantique du texte.

Néanmoins, l’élaboration d’un tel système et son perfectionnement coûtent cher en personnel très qualifié et la traduction automatique basée sur les règles ou exemples n’est donc pas  un système très propice à une commercialisation de masse.

Les moteurs de recherche et autres sites internet souhaitant intégrer un outil de traduction automatique se tournent donc vers la traduction automatique statistique.

3. Enjeux économiques et culturels

Economie de la traduction : l’exemple de Google traduction

L’essor de la traduction automatique se poursuit dans un secteur plus mercantile, avec l’apparition d’une multitude de sites accessibles en ligne, proposant des traductions rapides et gratuites : Systran, Reverso, FreeTranslation.com, ProMT-Online, Babylon, WordLingo, Yahoo, Lexicool…

Le plus populaire de ces sites est Google Traduction qui est, selon une enquête comparative réalisée par ALTISSIA en 2014, le traducteur en ligne le plus utilisé sur le Web (sources : http://www.altissia.com/blog/fr/quel-est-le-meilleur-traducteur-en-ligne-gratuit/)

En effet, depuis 2006, Google Traduction, un système également basé sur une analyse statistique, propose une traduction dans plus de 74 langues.

Développement des échanges interculturels

La traduction est essentielle à la circulation des idées, ainsi que pour le partage et l’échange culturel entre différents pays, et permet une large diffusion des créations artistiques. La littérature étrangère est notamment un secteur grandissant dans le monde de l’édition, et de plus en plus de cultures peuvent ainsi être entendues. Avec la traduction automatique, les éditeurs font face à de nouveaux obstacles : comme nous le savons déjà, la traduction littéraire implique de maîtriser non seulement une langue étrangère dans sa totalité mais également l’arrière-plan culturel lié à cette langue, ce qu’une machine ne peut pas assurer dans le processus de traduction. Traduire signifie comprendre un texte de départ et le restituer dans une langue d’arrivée, établir un pont entre deux cultures, deux communautés linguistiques, et faire des choix relevant en grande partie de notre subjectivité, de notre représentation du monde. Les aspects linguistiques et culturels de la traduction sont au centre de la réflexion du traducteur.

Alors que la traduction automatique permet une traduction au mot à mot en une fraction de seconde, Il apparaît intéressant de concilier la rapidité de la traduction automatique à la traduction réfléchie, intelligible que produit le traducteur : cette pratique récente est appelée la post-édition. Le texte de départ est traité par un logiciel de traduction automatique, avant d’être revu et corrigé par un professionnel pour le rendre humainement compréhensible. Le but de cette nouvelle activité est avant tout d’ordre économique : il faut traduire plus, plus vite et moins cher. Cette pratique fait les grandes institutions internationales telles que l’Union européenne, ainsi qu’une multitude de maisons d’édition et d’agences de traduction, et se développe en subissant de nombreuses évolutions.


La traduction est une pratique peu reconnue et pourtant essentielle dans la diffusion d’un patrimoine culturel et la découverte de cultures étrangères. Comme Internet, elle fut crée en premier lieu à des fins militaires avant de se démocratiser et de devenir accessible au  grand public. Les nombreuses évolutions qu’elle a connues soulèvent des questionnement socioculturels et modifient les activités professionnelles liées aux échanges internationaux. Pour les éditeurs en particuliers, cette pratique constitue un enjeu majeur.

Notes de lecture