Glossário

Modelação da língua

Descubra como a modelação da linguagem potencia as aplicações de PNL e IA, como a geração de texto, a tradução automática e o reconhecimento de voz, com técnicas avançadas.

A modelação linguística é uma tarefa fundamental da Inteligência Artificial (IA) e uma componente essencial do Processamento de Linguagem Natural (PLN). Envolve o desenvolvimento de modelos que podem prever a probabilidade de uma sequência de palavras. Na sua essência, um modelo linguístico aprende os padrões, a gramática e o contexto de uma língua a partir de grandes quantidades de dados de texto. Isto permite-lhe determinar a probabilidade de uma determinada palavra aparecer a seguir numa frase. Por exemplo, dada a frase "o gato sentou-se em cima do", um modelo linguístico bem treinado atribuiria uma probabilidade elevada à palavra "tapete" e uma probabilidade muito baixa a "batata". Esta capacidade de previsão é a base de muitas aplicações de IA baseadas na linguagem.

Como funciona a modelação linguística?

A modelação da linguagem é uma tarefa no âmbito da aprendizagem automática (ML) em que um modelo é treinado para compreender e gerar linguagem humana. O processo começa por alimentar o modelo com grandes conjuntos de dados de texto, como o conteúdo da Wikipédia ou uma grande coleção de livros. Ao analisar estes dados, o modelo aprende as relações estatísticas entre as palavras.

Os modelos linguísticos modernos baseiam-se fortemente na aprendizagem profunda (DL) e são frequentemente construídos utilizando arquitecturas de redes neuronais (NN). A arquitetura Transformer, introduzida no artigo "Attention Is All You Need", tem sido particularmente revolucionária. Utiliza um mecanismo de atenção que permite ao modelo ponderar a importância de diferentes palavras no texto de entrada, permitindo-lhe captar dependências complexas e de longo alcance e compreender o contexto de forma mais eficaz. O treino do modelo envolve o ajuste dos pesos internos do modelo para minimizar a diferença entre as suas previsões e as sequências de texto reais nos dados de treino, um processo optimizado utilizando a retropropagação.

Aplicações reais da modelação linguística

As capacidades dos modelos linguísticos levaram à sua integração em inúmeras tecnologias que utilizamos diariamente.

  • Texto preditivo e preenchimento automático: Quando o teclado do seu smartphone sugere a palavra seguinte à medida que escreve, está a utilizar um modelo de linguagem. Ao analisar a sequência de palavras que já escreveu, prevê a palavra mais provável a seguir, acelerando a comunicação. Esta tecnologia é uma caraterística essencial de sistemas como o Gboard da Google.
  • Tradução automática: Serviços como o Google Translate e DeepL utilizam modelos linguísticos sofisticados para traduzir texto entre línguas. Não se limitam a substituir palavra por palavra; em vez disso, analisam o significado e a estrutura do texto de partida para gerar uma tradução gramaticalmente correta e contextualmente precisa na língua de chegada. Esta é uma aplicação dos modelos sequência-a-sequência.
  • Criação e sumarização de conteúdos: Os modelos de linguagem são utilizados para a geração de texto, onde podem escrever artigos, e-mails ou histórias criativas. Também alimentam ferramentas de resumo de texto que condensam documentos longos em resumos concisos e são o núcleo de chatbots interactivos.

Conceitos relacionados

É útil distinguir a modelação da linguagem de termos relacionados:

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência