Glossário

Modelos de sequência para sequência

Descobre como os modelos sequência-a-sequência transformam as sequências de entrada em sequências de saída, potenciando tarefas de IA como a tradução, os chatbots e o reconhecimento de voz.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Os modelos sequência-a-sequência são um tipo de arquitetura de rede neural concebida para transformar uma sequência noutra sequência. Estes modelos são particularmente eficazes em tarefas em que a entrada e a saída são ambas sequências de comprimento arbitrário, o que os torna versáteis para uma vasta gama de aplicações em inteligência artificial e aprendizagem automática.

Definição

Os modelos sequência-a-sequência, frequentemente abreviados como modelos Seq2Seq, são compostos por dois componentes principais: um codificador e um descodificador. O codificador processa a sequência de entrada e comprime-a numa representação vetorial de comprimento fixo, frequentemente designada por "vetor de contexto" ou "vetor de pensamento". Este vetor destina-se a captar a informação essencial da sequência de entrada. O descodificador pega então neste vetor de contexto e gera a sequência de saída, passo a passo.

Uma caraterística fundamental dos modelos sequência-a-sequência é a sua capacidade de lidar com sequências de entrada e saída de comprimento variável. Isto é conseguido através da utilização de redes neuronais recorrentes (RNN) ou das suas variantes mais avançadas, como as redes de memória longa de curto prazo(LSTM) ou as unidades recorrentes fechadas(GRU), tanto no codificador como no descodificador. Estas arquitecturas foram concebidas para processar dados sequenciais, mantendo um estado oculto que transporta informações através da sequência.

Aplicações

Os modelos sequência-a-sequência têm sido amplamente utilizados em vários domínios, nomeadamente no processamento de linguagem natural (PNL) e não só. Eis algumas aplicações do mundo real:

  • Tradução automática: Uma das aplicações mais proeminentes é a tradução automática, em que um modelo Seq2Seq traduz texto de uma língua (a sequência de entrada) para outra língua (a sequência de saída). Por exemplo, o Google Translate utiliza modelos sequência-a-sequência para traduzir idiomas codificando a frase de origem e descodificando-a para o idioma de destino. Esta tarefa beneficia significativamente da capacidade dos modelos Seq2Seq para lidar com diferentes comprimentos de frase e estruturas gramaticais complexas.

  • Sumarização de textos: Os modelos Seq2Seq também são usados para sumarização de texto, em que o modelo pega um documento longo como entrada e gera um resumo mais curto e conciso. Isso é útil em aplicações como agregação de notícias ou geração de relatórios. Estes modelos podem ser treinados para compreender o contexto de grandes quantidades de texto e extrair as informações mais importantes para produzir um resumo coerente. Podes explorar mais sobre tarefas de PNL relacionadas, como a geração de texto e a sumarização de texto, no nosso glossário.

  • Chatbots: Outra aplicação importante é a construção de IA de conversação, como os chatbots. Neste contexto, a sequência de entrada é a mensagem de um utilizador e a sequência de saída é a resposta do chatbot. Os chatbots avançados utilizam frequentemente modelos Seq2Seq sofisticados para manter o contexto durante conversas mais longas e gerar respostas mais relevantes e coerentes. Sabe mais sobre a criação de assistentes com IA na nossa página do glossário sobre assistentes virtuais.

  • Reconhecimento de fala: Os modelos sequência-a-sequência são também utilizados em sistemas de reconhecimento de fala, convertendo sequências de áudio em texto. Neste caso, o sinal de áudio é a sequência de entrada e o texto transcrito é a sequência de saída. Estes modelos podem lidar com a natureza temporal da fala e com a variabilidade na pronúncia e nas taxas de fala. Para saber mais sobre a conversão de fala em texto, consulta a nossa página de glossário de fala para texto.

Os modelos sequência-a-sequência têm sido fundamentais para o avanço de inúmeras aplicações de IA, em particular as que envolvem dados sequenciais. À medida que a investigação progride, estes modelos continuam a evoluir, tornando-se mais eficientes e capazes de lidar com tarefas cada vez mais complexas. Podes explorar mais sobre a evolução dos modelos de IA e as suas aplicações através das publicações do blogueUltralytics .

Lê tudo