Melhora o raciocínio da IA com a sugestão de cadeia de pensamento! Aumenta a precisão, a transparência e a retenção de contexto para tarefas complexas e de vários passos.
A solicitação de cadeia de pensamento (CoT) é uma técnica avançada concebida para melhorar as capacidades de raciocínio dos modelos de linguagem de grande porte (LLMs). Em vez de pedir a um modelo uma resposta direta, a CoT guia o modelo através de passos intermédios de raciocínio, tal como um ser humano pode decompor um problema complexo. Este método encoraja o modelo a "pensar passo a passo", conduzindo a resultados mais precisos, coerentes e justificáveis, especialmente para tarefas que requerem raciocínio aritmético, de senso comum ou simbólico. É uma técnica chave dentro do campo mais alargado da engenharia de prontidão.
O estímulo da cadeia de pensamento funciona estruturando o estímulo para incluir uma série de passos de raciocínio intermédios que conduzem à resposta final. Isto pode ser feito de várias formas, muitas vezes envolvendo a apresentação de exemplos(aprendizagem de poucos passos) em que o processo de raciocínio é explicitamente apresentado. Por exemplo, em vez de perguntares apenas "Qual é o resultado de X?", a pergunta pode incluir um exemplo como "P: Problema Y. A: Passo 1..., Passo 2..., Resposta final Z. Q: Problema X. A:". O modelo aprende então a seguir este padrão, gerando os seus próprios passos de raciocínio antes de chegar à conclusão. Isto contrasta com o padrão de solicitação, que normalmente pede uma resposta direta sem passos de raciocínio explícitos. A eficácia depende da capacidade do LLM para reconhecer e replicar o padrão de raciocínio demonstrado, uma capacidade que surge frequentemente em modelos com escala suficiente, tal como salientado em investigações como "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" da Google.
A utilização de sugestões de cadeia de pensamento oferece várias vantagens para melhorar o desempenho do modelo de IA:
O estímulo CoT é valioso em vários domínios em que o raciocínio detalhado é crucial:
Os chatbots alimentados por LLMs podem usar a CoT para lidar com questões multifacetadas dos clientes. Se um cliente perguntar sobre a devolução de um produto defeituoso comprado com um código de desconto, um chatbot orientado por CoT pode primeiro verificar a data de compra, verificar a política de devolução, calcular o valor do reembolso considerando o desconto e, em seguida, delinear os passos de devolução, explicando cada parte claramente. Esta abordagem estruturada garante que todos os aspectos são abordados com precisão, melhorando a satisfação do cliente em comparação com uma resposta direta potencialmente incompleta. Plataformas como Hugging Face alojam modelos em que estas técnicas de solicitação podem ser exploradas.
Os tutores de IA podem utilizar a CoT para explicar conceitos complexos ou resolver problemas passo a passo. Quando um aluno tem dificuldades com um problema de matemática, a IA pode gerar um caminho de solução detalhado, explicando cada passo lógico, em vez de fornecer apenas a resposta final. Isto ajuda o aluno a compreender os princípios subjacentes e a aprender o processo de resolução de problemas. Isto alinha-se com os objectivos da IA na educação para personalizar a aprendizagem.
A solicitação de CoT representa um passo significativo para a construção de sistemas de Inteligência Artificial (IA) mais capazes e transparentes, particularmente em domínios que exigem tomadas de decisão complexas, como a análise de imagens médicas ou a modelação financeira, complementando os avanços em áreas como a visão por computador, impulsionados por modelos como Ultralytics YOLO. Ferramentas e plataformas como o Ultralytics HUB facilitam o desenvolvimento e a implementação de modelos sofisticados de IA, em que a compreensão de técnicas avançadas como a CoT pode ser benéfica.