Glossário

Modelo de língua grande (LLM)

Descubra como os Modelos de Linguagem Grandes (LLMs) revolucionam a IA com PNL avançada, alimentando chatbots, criação de conteúdo e muito mais. Aprenda os principais conceitos!

Um modelo de linguagem de grande dimensão (LLM) é um tipo de modelo de Inteligência Artificial (IA) concebido para compreender, gerar e interagir com a linguagem humana. Estes modelos são "grandes" porque contêm milhares de milhões de parâmetros e são treinados em grandes quantidades de dados de texto, muitas vezes abrangendo uma parte significativa da Internet pública, livros e outras fontes. Esta formação extensiva permite-lhes reconhecer padrões complexos, gramática, contexto e nuances na linguagem, tornando-os ferramentas poderosas para uma vasta gama de tarefas de Processamento de Linguagem Natural (PNL).

A arquitetura fundamental para a maioria dos LLMs modernos é o Transformer, introduzido no influente artigo"Attention Is All You Need". Esta arquitetura permite que o modelo pondere a importância de diferentes palavras (ou tokens) numa sequência, capturando dependências de longo alcance e relações contextuais de forma muito mais eficaz do que os modelos anteriores, como as Redes Neuronais Recorrentes (RNNs).

Como são utilizados os LLM

Os LLMs foram integrados em inúmeras aplicações em vários sectores, alterando fundamentalmente a forma como interagimos com a tecnologia. A sua capacidade de gerar texto coerente e contextualmente relevante torna-os altamente versáteis.

Dois exemplos importantes do mundo real incluem:

Chatbots avançados e assistentes virtuais: As empresas utilizam LLMs para criar chatbots sofisticados para o serviço ao cliente, capazes de compreender a intenção do utilizador e fornecer respostas detalhadas e conversacionais. Os assistentes digitais como o Google Assistant e o Alexa da Amazon utilizam a tecnologia LLM para interações mais naturais.
Criação e resumo de conteúdos: Os LLMs são amplamente utilizados para redigir e-mails, escrever artigos, gerar textos criativos e criar textos de marketing. Também podem efetuar resumos de texto, condensando documentos longos em resumos concisos, o que é inestimável em áreas como o direito e a investigação.

LLMs vs. outros modelos de IA

É importante diferenciar os LLM de outros tipos de modelos de IA, nomeadamente os utilizados em diferentes domínios, como a visão por computador.

Modelação de linguagem vs. LLM: A modelação de linguagem é a tarefa principal de prever a palavra seguinte numa sequência. Um LLM é uma implementação em grande escala de um modelo de linguagem, como o GPT-4 da OpenAI ou os modelos Llama da Meta.
Modelos de base vs. LLM: Os LLMs são uma categoria proeminente de modelos de base. O termo "modelo de fundação", popularizado pelo Centro de Pesquisa em Modelos de Fundação (CRFM) de Stanford, é mais amplo e engloba modelos grandes treinados em vários tipos de dados, não apenas em texto.
Modelos de visão por computador vs. LLM: Esta é uma distinção fundamental. Enquanto os LLM processam e geram texto, os modelos de visão por computador, como o Ultralytics YOLO11, são especializados na interpretação de dados visuais de imagens e vídeos. Os modelos de CV executam tarefas como a deteção de objectos, a classificação de imagens e a segmentação de instâncias. Plataformas como o Ultralytics HUB são projetadas para simplificar o ciclo de vida dos modelos de visão, desde o gerenciamento do conjunto de dados até a implantação.

O futuro: Integração multimodal

A fronteira entre a IA da linguagem e da visão está a esbater-se com o desenvolvimento de modelos multimodais. Estes modelos avançados, frequentemente designados por Modelos de Linguagem Visual (VLM), podem processar e integrar informações de várias modalidades, como texto e imagens. Por exemplo, um utilizador pode carregar uma fotografia de uma refeição e pedir ao modelo a receita. Esta convergência, explorada em modelos como o GPT-4o, é um passo importante para sistemas de IA mais abrangentes.

Apesar do seu poder, é crucial estar ciente das limitações do LLM, incluindo o potencial para gerar informações incorrectas(alucinações) e herdar preconceitos dos seus dados de treino. Estes desafios realçam a importância constante da ética da IA e das práticas de desenvolvimento responsáveis. Para mais informações sobre a criação de aplicações de IA, pode explorar a documentação do Ultralytics.

Modelo de língua grande (LLM)

Solução flexível de licenciamento empresarial para impulsionar a sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Treine modelos YOLO de forma simples com o Ultralytics HUB

Como são utilizados os LLM

LLMs vs. outros modelos de IA

O futuro: Integração multimodal

Ler mais nesta categoria

Compreender o fabrico aditivo: Tecnologia e casos de utilização

Monitorização das operações aeroportuárias em terra com o Ultralytics YOLO11

A evolução e o futuro da robótica na indústria transformadora

Junte-se à comunidade Ultralytics