Glossário

Prompting de cadeia de pensamento

Melhora o raciocínio da IA com a sugestão de cadeia de pensamento! Aumenta a precisão, a transparência e a retenção de contexto para tarefas complexas e de vários passos.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A solicitação de cadeia de pensamento (CoT) é uma técnica avançada concebida para melhorar as capacidades de raciocínio dos modelos de linguagem de grande porte (LLMs). Em vez de pedir a um modelo uma resposta direta, a CoT guia o modelo através de passos intermédios de raciocínio, tal como um ser humano pode decompor um problema complexo. Este método encoraja o modelo a "pensar passo a passo", conduzindo a resultados mais precisos, coerentes e justificáveis, especialmente para tarefas que requerem raciocínio aritmético, de senso comum ou simbólico. É uma técnica chave dentro do campo mais alargado da engenharia de prontidão.

Como funciona a promoção da cadeia de pensamento

O estímulo da cadeia de pensamento funciona estruturando o estímulo para incluir uma série de passos de raciocínio intermédios que conduzem à resposta final. Isto pode ser feito de várias formas, muitas vezes envolvendo a apresentação de exemplos(aprendizagem de poucos passos) em que o processo de raciocínio é explicitamente apresentado. Por exemplo, em vez de perguntares apenas "Qual é o resultado de X?", a pergunta pode incluir um exemplo como "P: Problema Y. A: Passo 1..., Passo 2..., Resposta final Z. Q: Problema X. A:". O modelo aprende então a seguir este padrão, gerando os seus próprios passos de raciocínio antes de chegar à conclusão. Isto contrasta com o padrão de solicitação, que normalmente pede uma resposta direta sem passos de raciocínio explícitos. A eficácia depende da capacidade do LLM para reconhecer e replicar o padrão de raciocínio demonstrado, uma capacidade que surge frequentemente em modelos com escala suficiente, tal como salientado em investigações como "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" da Google.

Principais benefícios do Prompting de Cadeia de Pensamento

A utilização de sugestões de cadeia de pensamento oferece várias vantagens para melhorar o desempenho do modelo de IA:

  • Raciocínio melhorado: Melhora significativamente o desempenho em tarefas que exigem dedução lógica em várias etapas, cálculos matemáticos ou compreensão do senso comum.
  • Aumenta a transparência: Torna visível o processo de raciocínio do modelo, contribuindo para a IA explicável (XAI) ao permitir que os utilizadores compreendam como foi obtida uma resposta. Isto ajuda na depuração e identificação de potenciais falhas na lógica do modelo.
  • Maior precisão: Ao dividir os problemas, os modelos têm menos probabilidades de cometer erros do que se tentassem resolver tarefas complexas num único passo, o que leva a uma maior precisão.
  • Lida melhor com a complexidade: Permite que os modelos lidem com problemas mais intrincados que seriam difíceis de resolver apenas com o estímulo direto.

Aplicações no mundo real

O estímulo CoT é valioso em vários domínios em que o raciocínio detalhado é crucial:

Exemplo 1: Apoio ao cliente complexo

Os chatbots alimentados por LLMs podem usar a CoT para lidar com questões multifacetadas dos clientes. Se um cliente perguntar sobre a devolução de um produto defeituoso comprado com um código de desconto, um chatbot orientado por CoT pode primeiro verificar a data de compra, verificar a política de devolução, calcular o valor do reembolso considerando o desconto e, em seguida, delinear os passos de devolução, explicando cada parte claramente. Esta abordagem estruturada garante que todos os aspectos são abordados com precisão, melhorando a satisfação do cliente em comparação com uma resposta direta potencialmente incompleta. Plataformas como Hugging Face alojam modelos em que estas técnicas de solicitação podem ser exploradas.

Exemplo 2: Sistemas de tutoria educativa

Os tutores de IA podem utilizar a CoT para explicar conceitos complexos ou resolver problemas passo a passo. Quando um aluno tem dificuldades com um problema de matemática, a IA pode gerar um caminho de solução detalhado, explicando cada passo lógico, em vez de fornecer apenas a resposta final. Isto ajuda o aluno a compreender os princípios subjacentes e a aprender o processo de resolução de problemas. Isto alinha-se com os objectivos da IA na educação para personalizar a aprendizagem.

Comparação com conceitos relacionados

  • Engenharia de instruções: O CoT é uma técnica específica dentro da prática mais alargada da engenharia de prompts, que engloba todos os métodos de conceção de prompts eficazes para modelos de IA.
  • Encadeamento de prompts: Embora seja semelhante ao envolver várias etapas, o encadeamento de perguntas envolve normalmente a divisão de uma tarefa em sub-tarefas sequenciais, em que o resultado de uma pergunta se torna a entrada para a seguinte. A CoT concentra-se normalmente em extrair o raciocínio de uma única interação prompt-resposta, frequentemente demonstrada através de exemplos.
  • Aprendizagem Zero-Shot: A aprendizagem zero-shot envolve pedir a um modelo para executar uma tarefa para a qual não foi explicitamente treinado, sem exemplos. A CoT de disparo zero tenta obter um raciocínio passo-a-passo, simplesmente adicionando frases como "Vamos pensar passo-a-passo" ao pedido, sem fornecer exemplos. Isto torna-o mais acessível, mas pode ser menos fiável do que o CoT de poucas tentativas.

A solicitação de CoT representa um passo significativo para a construção de sistemas de Inteligência Artificial (IA) mais capazes e transparentes, particularmente em domínios que exigem tomadas de decisão complexas, como a análise de imagens médicas ou a modelação financeira, complementando os avanços em áreas como a visão por computador, impulsionados por modelos como Ultralytics YOLO. Ferramentas e plataformas como o Ultralytics HUB facilitam o desenvolvimento e a implementação de modelos sofisticados de IA, em que a compreensão de técnicas avançadas como a CoT pode ser benéfica.

Lê tudo