Glossário

Modelação da língua

Descobre como a modelação da linguagem potencia as aplicações de PNL e IA, como a geração de texto, a tradução automática e o reconhecimento de voz, com técnicas avançadas.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A modelação linguística é uma tarefa fundamental no âmbito do Processamento de Linguagem Natural (PLN) e da Inteligência Artificial (IA), centrada na previsão da probabilidade de ocorrência de uma sequência de palavras numa determinada língua. Essencialmente, envolve a construção de modelos que compreendem os padrões estatísticos e as estruturas gramaticais da linguagem humana, permitindo que as máquinas processem, compreendam e gerem texto que se assemelhe à comunicação humana. Estes modelos aprendem com grandes quantidades de dados de texto para captar as relações entre as palavras e os seus padrões de utilização típicos.

Como funciona a modelação da língua

Na sua essência, um modelo linguístico atribui uma probabilidade a uma sequência de palavras. As primeiras abordagens baseavam-se em métodos estatísticos como os n-gramas, que calculam a probabilidade de uma palavra com base nas 'n-1' palavras anteriores. Embora simples, estes modelos têm dificuldade em captar dependências de longo alcance no texto. A modelação moderna da linguagem utiliza fortemente as Redes Neuronais (NN), em particular arquitecturas como as Redes Neuronais Recorrentes (RNN) e, mais recentemente, os Transformers. Os Transformers, apresentados no artigo "Attention Is All You Need", utilizam mecanismos como a auto-atenção para ponderar a importância de diferentes palavras numa sequência, independentemente da sua distância, permitindo uma melhor compreensão do contexto. O treino destes modelos envolve o processamento de grandes corpora de texto, a decomposição do texto através de tokenização e a aprendizagem de representações(embeddings) para estes tokens.

Relevância e aplicações

A modelação da linguagem é uma tecnologia fundamental que alimenta muitas aplicações de IA que interagem com a linguagem humana. A sua capacidade de prever e compreender sequências de palavras torna-a inestimável em vários domínios.

As aplicações no mundo real incluem:

Conceitos relacionados

Compreender a modelação da linguagem implica familiaridade com termos relacionados:

  • Processamento de linguagem natural (PNL): A modelação da linguagem é um subcampo do domínio mais vasto da PNL, que engloba várias tarefas como o reconhecimento de entidades nomeadas (NER), a marcação de parte do discurso e a resposta a perguntas. Muitas tarefas de PLN utilizam modelos linguísticos.
  • Grandes modelos linguísticos (LLM): Trata-se de modelos linguísticos altamente avançados, como o GPT-4, caracterizados pela sua dimensão maciça (milhares de milhões de parâmetros) e pela formação em enormes conjuntos de dados(Big Data). Os LLMs exibem capacidades notáveis na compreensão e geração de texto semelhante ao humano para tarefas complexas. Muitos LLMs pré-treinados estão disponíveis em plataformas como Hugging Face.
  • Geração de texto: Embora intimamente relacionada, a geração de texto é uma aplicação da modelação da linguagem. O modelo de linguagem fornece as probabilidades das sequências de palavras e o processo de geração utiliza essas probabilidades (frequentemente com estratégias de amostragem) para produzir um novo texto.
  • Modelos multimodais: Estes modelos integram a compreensão da linguagem com outros tipos de dados, como imagens na Visão por Computador (CV). Modelos como o CLIP aprendem representações conjuntas de texto e imagens, permitindo tarefas como a legendagem de imagens ou a resposta a perguntas visuais. Explora oUltralytics HUB para obteres ferramentas para gerir e implementar vários modelos de IA, incluindo os que potencialmente integram capacidades linguísticas.
Lê tudo