Glossaire

Traduction automatique

Découvre comment la traduction automatique utilise l'IA et l'apprentissage profond pour briser les barrières linguistiques, permettant ainsi une communication et une accessibilité mondiales transparentes.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

La traduction automatique (TA) est une tâche relevant de l'intelligence artificielle (IA) et de la linguistique computationnelle axée sur la conversion automatique de textes ou de discours d'une langue naturelle (la langue source) vers une autre (la langue cible). Elle s'appuie sur des algorithmes d'apprentissage automatique (ML), en particulier des modèles d'apprentissage profond (DL), formés sur de vastes quantités de données textuelles parallèles pour apprendre les schémas complexes et les nuances de la conversion linguistique. L'objectif est de produire des traductions qui sont non seulement exactes sur le plan du sens, mais aussi fluides et naturelles dans la langue cible.

Concepts fondamentaux et évolution

Les premiers systèmes de traduction automatique s'appuyaient fortement sur des approches basées sur des règles, utilisant des dictionnaires et des règles grammaticales minutieusement élaborées par des linguistes. Plus tard, la traduction automatique statistique (TAS) est apparue, apprenant les probabilités de traduction à partir de grands corpus de textes bilingues comme le corpus Europarl. Aujourd'hui, le domaine est dominé par la traduction automatique neuronale (NMT), qui utilise des réseaux neuronaux profonds (NN) pour modéliser l'ensemble du processus de traduction. Les modèles NMT, souvent basés sur des modèles séquence à séquence avec des mécanismes d'attention ou sur l'architecture Transformer très influente (introduite dans le célèbre article"Attention Is All You Need"), peuvent capturer les dépendances à longue portée et les caractéristiques linguistiques subtiles, ce qui conduit à des améliorations significatives de la qualité de la traduction. Ces modèles nécessitent des quantités considérables de données d'entraînement et de ressources informatiques, souvent gérées à l'aide de plateformes comme Ultralytics HUB.

Traduction automatique et tâches NLP connexes

La traduction automatique est une application spécifique dans le domaine plus large du traitement du langage naturel (NLP). Bien qu'elle y soit liée, elle diffère des autres tâches du TAL :

  • Compréhension du langage naturel (NLU) : NLU se concentre sur le fait de permettre aux machines de comprendre le sens du texte, y compris l'intention et le contexte. La TA utilise la compréhension dans le cadre du processus, mais son objectif principal est la conversion linguistique.
  • Génération de texte : Bien que la TA soit une forme de génération de texte, elle est limitée par la nécessité de représenter fidèlement le sens du texte source dans une langue différente. La génération générale de texte peut impliquer la création d'un texte entièrement nouveau à partir d'un message-guide.
  • La synthèse vocale et la synthèse vocale : La synthèse vocale convertit l'audio parlé en texte, et la synthèse vocale fait l'inverse. Ces systèmes gèrent les changements de modalité, alors que la traduction automatique se concentre principalement sur les changements de langue dans la modalité texte (bien que les systèmes de traduction vocale enchaînent souvent ces composants).

Applications dans le monde réel

La traduction automatique alimente de nombreuses applications qui facilitent la communication mondiale et l'accès à l'information :

  1. Outils de traduction en ligne : Des services comme Google Translate et DeepL Translator fournissent des traductions instantanées d'extraits de texte, de documents et de sites Web entiers à des milliards d'utilisateurs dans le monde entier, ce qui permet de faire tomber les barrières de la communication.
  2. Plates-formes de communication multilingues : La traduction en temps réel intégrée aux applis de messagerie (comme Skype Translator) ou aux plateformes de médias sociaux permet aux utilisateurs parlant différentes langues de communiquer de façon transparente.
  3. Localisation de contenu : Les entreprises utilisent la TA (souvent associée à une post-édition humaine) pour adapter les sites Web, les interfaces logicielles et les supports marketing à un public international, rapidement et à moindre coût.
  4. Accès à l'information : Les moteurs de recherche utilisent la TA pour indexer et récupérer des informations dans plusieurs langues, élargissant ainsi l'accès aux bases de connaissances mondiales. Les outils développés par des organisations telles que l'Association for Computational Linguistics (ACL) repoussent souvent les limites de ces applications.

Pertinence et outils

La TA est un domaine important de la recherche en IA, qui a permis des avancées dans les architectures de réseaux neuronaux comme le Transformer, qui a ensuite influencé les modèles dans d'autres domaines, y compris la vision par ordinateur. L'évaluation de la qualité de la TA implique souvent des mesures telles que le score BLEU. Le développement utilise souvent des cadres comme PyTorch ou TensorFlowLes outils open-source tels que Hugging Face Transformers, OpenNMT ou Fairseq fournissent des modèles pré-entraînés et des outils pour construire des systèmes de traduction personnalisés.

Tout lire