Traduction automatique neuronale : l’avenir est dans le deep learning
La traduction automatique neuronale, ou TAN, est un paradigme relativement nouveau. Avant que les systèmes de TAN ne commencent à être utilisés, la traduction automatique a connu plusieurs autres types de systèmes de traduction automatique. Mais, au fur et à mesure que la recherche dans le domaine de l’intelligence artificielle progresse, il est tout naturel d’essayer de l’appliquer à la traduction.
Histoire de la traduction automatique neuronale
Les applications de deep learning, littéralement “apprentissage profond” en français, sont apparues pour la première fois dans les années 1990. Elles ont ensuite été utilisées, non pas en traduction, mais en reconnaissance vocale. C’est à cette époque que la traduction automatique a commencé à reprendre de l’ampleur, après que presque toutes les études sur le sujet eurent été abandonnées dans les années 1960. On estimait alors que la traduction automatique coûtait trop cher pour des résultats très médiocres.
La traduction automatique à base de règles était alors le type de traduction automatique le plus utilisé, et la traduction automatique statistique commençait à gagner en importance.
Le premier article scientifique sur l’utilisation des réseaux neuronaux dans la traduction automatique est paru en 2014. Après cela, le domaine a commencé à voir beaucoup d’avancées.
En 2015, l’OpenMT, un concours de traduction automatique, comptait pour la première fois un système de traduction automatique neuronale parmi ses concurrents. L’année suivante, elle comptait déjà 90 % de systèmes TAN parmi ses lauréats.
En 2016, plusieurs systèmes de TA neuronale gratuits ont été lancés. Parmi les plus connus : DeepL Translator ou Google Neural Machine Translation System (GNMT) pour Google Translate.
Comment fonctionne la traduction automatique neuronale ?
Ces systèmes de TAN sont constitués de neurones artificiels, reliés entre eux et organisés en couches. Ils s’inspirent des réseaux neuronaux biologiques, capables d’apprendre par eux-mêmes à partir des données qu’ils reçoivent chaque fois que quelqu’un traduit un nouveau document. Le processus “d’apprentissage” consiste à modifier le poids des neurones artificiels. Il est répété à chaque nouvelle traduction afin d’optimiser constamment leurs poids, et donc la qualité des traductions suivantes. Les systèmes de TAN fonctionnent avec des corpus bilingues de documents sources et cibles déjà traduits.
La traduction elle-même fonctionne en deux phases.
Tout d’abord, une phase d’analyse. Les mots du document source sont codés pour devenir une séquence de vecteurs qui représentent la signification des mots. Un contexte est généré pour chaque mot, basé sur la relation entre le mot et le contexte du mot précédent. Ensuite, en utilisant ce nouveau contexte, la traduction correcte du mot est sélectionnée parmi toutes ses traductions possibles hors contexte.
Ensuite, il y a la phase de transfert. Il s’agit d’une phase de décodage, au cours de laquelle la phrase est générée dans la langue cible.
Deep learning : mieux qu’avant, mais toujours pas parfait
Les systèmes de deep learning sont les meilleurs systèmes de traduction automatique qui existent à ce jour. Mais ils ne sont pas encore parfaits, et ne peuvent fonctionner complètement par eux-mêmes. Comme les langues sont utilisées tous les jours, elles sont en constante évolution. Par conséquent, les systèmes de deep learning ont toujours besoin d’apprendre, en particulier les néologismes et les nouvelles expressions. Et pour apprendre ces nouveaux éléments des langues, ils auront toujours besoin de l’aide des humains, que ce soit pour travailler directement sur les systèmes, ou pour effectuer une post-édition sur des documents traduits.
Néanmoins, les systèmes qui peuvent “apprendre” par eux-mêmes représentent une avancée exceptionnelle. Et ce, non seulement pour la traduction automatique, mais aussi pour toutes les tâches de traitement du langage naturel, ainsi que pour l’intelligence artificielle en général.
La traduction automatique neuronale a encore besoin de recherche et d’améliorations, c’est certain. Mais elle représente un brillant avenir pour la traduction automatique. De toutes les personnes qui liront cet article, la plupart auront déjà utilisé un système de traduction automatique neuronale, qu’ils en soient conscients ou non. Et si ce n’est pas le cas, il y a de fortes chances que vous en essayiez au moins un maintenant, par exemple : DeepL Translator.
Article rédigé par Marjolaine Grison.