Glossário

Modelo de língua grande (LLM)

Descobre como os Modelos de Linguagem Grandes (LLMs) revolucionam a IA com PNL avançada, potenciando chatbots, criação de conteúdos e muito mais. Aprende os principais conceitos!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Os modelos de linguagem de grande dimensão (LLM) são um tipo de modelo de inteligência artificial (IA) que revolucionou o domínio do processamento de linguagem natural (PNL). Estes modelos distinguem-se pelo seu enorme tamanho, treinados em enormes conjuntos de dados de texto e código, permitindo-lhes compreender e gerar texto semelhante ao humano com uma fluência e coerência notáveis. Os LLMs estão na vanguarda de muitas aplicações de IA de ponta, impulsionando avanços na forma como as máquinas interagem com a linguagem e a processam.

Definição

Os modelos de linguagem grande são essencialmente modelos de aprendizagem profunda, especificamente redes de transformadores, que foram escalados em termos de parâmetros e dados de treino. O termo "grande" refere-se aos biliões ou mesmo triliões de parâmetros que estes modelos podem conter. Os parâmetros são variáveis que o modelo aprende durante o treino e que ditam a sua capacidade de mapear o texto de entrada para os resultados desejados. Quanto mais parâmetros, geralmente, mais complexos são os padrões que o modelo pode aprender. Estes modelos são treinados utilizando técnicas de aprendizagem não supervisionada em grandes quantidades de dados de texto retirados da Internet, livros, artigos e repositórios de código. Este processo de formação permite-lhes aprender as relações estatísticas entre palavras e frases, permitindo-lhes prever a palavra seguinte numa sequência, traduzir línguas, responder a perguntas e até gerar conteúdos criativos. Exemplos proeminentes de LLMs incluem o GPT-4 da OpenAI e o Llama 3 da Meta.

Aplicações

Os LLM têm uma vasta gama de aplicações em vários sectores, transformando a forma como as empresas funcionam e como as pessoas interagem com a tecnologia. Eis alguns exemplos concretos:

  • Chatbots e assistentes virtuais: Os LLMs alimentam sofisticados chatbots e assistentes virtuais capazes de se envolverem em conversas naturais e conscientes do contexto. Eles podem entender consultas complexas, fornecer respostas informativas e até mesmo exibir um certo grau de personalidade. Esta tecnologia melhora o serviço ao cliente, fornecendo apoio instantâneo e experiências personalizadas. Por exemplo, as empresas estão a utilizar chatbots com LLM para lidar com as questões dos clientes, libertando os agentes humanos para questões mais complexas.
  • Criação de conteúdo e geração de texto: Os LLMs são excelentes na criação de várias formas de conteúdo escrito, desde artigos e publicações em blogues a textos de marketing e histórias criativas. Podem ajudar os criadores de conteúdos automatizando tarefas de escrita repetitivas, fazendo brainstorming de ideias e até redigindo textos inteiros. Esta capacidade está a ser utilizada nas áreas do marketing, jornalismo e escrita criativa para aumentar a produtividade e explorar novas formas de criação de conteúdos. Podes ver capacidades de geração de texto semelhantes em aplicações como modelos de texto para vídeo.

Conceitos-chave

Vários conceitos-chave estão intimamente relacionados com os modelos de grandes línguas e a sua compreensão proporciona uma visão mais completa desta tecnologia:

  • Processamento de linguagem natural (NLP): Os LLMs são um avanço significativo no âmbito da PNL, um campo da IA centrado em permitir que os computadores compreendam, interpretem e gerem linguagem humana. A PNL engloba uma vasta gama de tarefas, incluindo a análise de sentimentos, a tradução automática e a resposta a perguntas, todas elas beneficiando das capacidades dos LLMs.
  • Redes de Transformadores: A arquitetura subjacente à maioria dos LLMs é a rede de transformadores. Introduzidos no artigo Attention is All You Need, os transformadores utilizam mecanismos de atenção para ponderar a importância de diferentes palavras numa frase ao processar a linguagem. Esta arquitetura é particularmente eficaz na captação de dependências de longo alcance no texto, um aspeto crucial para compreender o contexto e gerar texto coerente.
  • Engenharia rápida: Interagir com os LLMs de forma eficaz requer, muitas vezes, uma engenharia de prompts. Isto envolve a elaboração de instruções específicas e bem estruturadas para orientar o LLM no sentido de gerar o resultado desejado. A qualidade do comando tem um impacto significativo na qualidade e na relevância da resposta do MLT, o que realça a importância de compreender como comunicar eficazmente com estes modelos.

Os modelos de linguagem de grande dimensão representam um grande salto em frente na IA, oferecendo capacidades sem precedentes na compreensão e geração de linguagem. Embora ainda em evolução, o seu impacto em diversas aplicações já é significativo e promete remodelar numerosos aspectos do nosso mundo digital.

Lê tudo