Glossário

Tradução automática

Descobre como a Tradução Automática utiliza a IA e a aprendizagem profunda para quebrar as barreiras linguísticas, permitindo uma comunicação e acessibilidade globais sem falhas.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Tradução Automática (TM) é um subcampo da Inteligência Artificial (IA) e do Processamento de Linguagem Natural (PLN) centrado na tradução automática de texto ou discurso de uma língua natural para outra. Aproveita a linguística computacional e os algoritmos de aprendizagem automática (ML) para colmatar as lacunas de comunicação entre diferentes línguas sem intervenção humana. O objetivo não é apenas a substituição palavra por palavra, mas sim transmitir o significado e a intenção do texto de origem de forma precisa e fluente na língua de destino. Esta tecnologia tem-se tornado cada vez mais sofisticada, passando dos primeiros sistemas baseados em regras para modelos complexos de aprendizagem profunda (DL).

Como funciona a tradução automática

Os primeiros sistemas de tradução automática baseavam-se em conjuntos extensos de regras gramaticais e dicionários bilingues. Mais tarde, surgiu a tradução automática estatística (SMT), que aprendia padrões de tradução a partir de grandes corpora paralelos (textos emparelhados com as suas traduções). No entanto, o atual estado da arte é a Tradução Automática Neural (NMT). A NMT utiliza redes neuronais artificiais (NN) para aprender o mapeamento entre línguas.

Os modelos NMT, em particular os baseados em modelos sequência-a-sequência, empregam frequentemente arquitecturas como as Redes Neuronais Recorrentes (RNN), especificamente LSTMs ou GRUs, ou, mais comummente agora, a arquitetura Transformer. Os transformadores utilizam mecanismos de auto-atenção(Attention Is All You Need paper) para ponderar a importância de diferentes palavras na sequência de entrada ao gerar cada palavra na sequência de saída, capturando dependências de longo alcance de forma mais eficaz. O treino destes modelos requer grandes quantidades de dados de texto paralelo e recursos computacionais significativos, utilizando frequentemente GPUs ou TPUs para um treino distribuído eficiente. Estruturas importantes como PyTorch e TensorFlow são amplamente utilizadas para desenvolver sistemas NMT.

Conceitos e tecnologias fundamentais

Vários conceitos são fundamentais para a MT moderna:

  • Tokenização: Decompõe o texto de entrada em unidades menores (palavras, subpalavras ou caracteres) chamadas tokens para o modelo processar.(Saiba mais sobre a Tokenização).
  • Embeddings: Representa os tokens como vectores numéricos densos que captam o significado semântico, permitindo que o modelo compreenda as relações entre as palavras.(Explora Embeddings).
  • Mecanismo de atenção: Permite que o modelo se concentre em partes relevantes da sequência de entrada ao gerar a saída, crucial para lidar com frases longas e melhorar a qualidade da tradução.(Compreende os mecanismos de atenção).
  • Pontuação BLEU: Uma métrica comum para avaliar a qualidade da MT, comparando a tradução gerada por máquina com uma ou mais traduções de referência humanas(Papineni et al., 2002).
  • Pesquisa de feixes: Um algoritmo utilizado durante a inferência para gerar vários candidatos potenciais à tradução e selecionar o mais provável, melhorando a fluência em vez de simplesmente escolher a palavra seguinte mais provável em cada passo.

Distinção de termos relacionados

Embora relacionada com outras tarefas de PNL, a MT tem um objetivo específico:

  • Processamento de linguagem natural (PNL): O campo mais vasto que engloba a MT, o resumo de texto, a análise de sentimentos, a resposta a perguntas, etc. A MT é uma aplicação no âmbito da PNL.
  • Compreensão da linguagem natural (NLU): Centra-se na compreensão automática do significado do texto, incluindo o reconhecimento de intenções e a extração de entidades. Embora as capacidades de NLU melhorem a MT, a NLU propriamente dita diz respeito à compreensão e não necessariamente à tradução.(Ver entrada do glossário NLU).
  • Reconhecimento de voz: Converte o áudio falado em texto. Este texto pode então ser utilizado como entrada para um sistema de MT.(Ver entrada do glossário Reconhecimento de fala).
  • Texto para fala (TTS): Converte a saída de texto (potencialmente de um sistema de MT) em fala sintetizada.(Ver entrada do glossário Text-to-Speech).
  • Modelação da língua: A tarefa de prever a palavra seguinte numa sequência, fundamental para muitas tarefas de PNL, incluindo a NMT, mas não para a tradução propriamente dita.(Explora a Modelação Linguística).

Aplicações no mundo real

A Tradução Automática está ao serviço de inúmeras aplicações:

  • Comunicação instantânea: Serviços como o Google Translate e o DeepL Translator permitem aos utilizadores traduzir páginas Web, documentos e mensagens em tempo real, eliminando as barreiras linguísticas a nível mundial.
  • Localização de conteúdos: As empresas utilizam a MT para traduzir descrições de produtos, manuais de utilizador, campanhas de marketing e sítios Web para chegar a mercados internacionais de forma mais eficiente do que a tradução manual, utilizando frequentemente a MT como primeira passagem seguida de revisão humana(MT pós-edição).
  • Apoio ao cliente multilingue: A integração da MT nas plataformas de chatbot e de apoio ao cliente permite às empresas oferecer apoio em vários idiomas.
  • Acesso à informação: A tradução de trabalhos de investigação, artigos noticiosos(a Reuters utiliza a MT) e livros torna a informação acessível para além das fronteiras linguísticas.
  • Aplicações de tradução em tempo real: Ferramentas integradas em aplicações de comunicação ou dispositivos dedicados fornecem tradução quase em tempo real para viajantes e colaborações internacionais(Skype Translator).

Apesar dos progressos significativos, continuam a existir desafios, como o tratamento de nuances, expressões idiomáticas, contexto cultural, línguas com poucos recursos e a atenuação de preconceitos algorítmicos aprendidos com os dados. O trabalho futuro centra-se na melhoria da perceção do contexto, no tratamento da ambiguidade, na obtenção de uma maior fluência e na integração da MT com outras modalidades, como a visão por computador, em modelos multimodais. Plataformas como o Ultralytics HUB facilitam a formação e a implementação de modelos sofisticados de IA, incluindo potencialmente soluções de MT personalizadas no futuro.

Lê tudo