Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

CoT-подсказки (Chain-of-Thought)

Изучите подсказки Chain-of-Thought (CoT) для улучшения мышления ИИ. Узнайте, как разбиение задач на логические шаги улучшает генерацию кода для Ultralytics .

Подсказка «Цепочка мыслей» (CoT) — это передовая техника в инженерии подсказок, которая позволяет большим языковым моделям (LLM) решать сложные задачи рассуждения, разбивая их на промежуточные логические шаги. Вместо того, чтобы просить модель дать немедленный окончательный ответ, CoT побуждает систему генерировать «цепочку мыслей», которая имитирует человеческое решение проблем. Такое пошаговое мышление значительно улучшает производительность при решении задач, связанных с арифметикой, символической логикой и здравым смыслом, преобразуя наше взаимодействие с системами искусственного интеллекта (ИИ).

Механизм рассуждения

Стандартные языковые модели часто сталкиваются с трудностями при решении многоэтапных задач, поскольку пытаются сопоставить входные данные с выходными за один проход. Такой подход «черного ящика» может приводить к ошибкам, особенно когда логический скачок слишком велик. Подсказки «цепочки мыслей» решают эту проблему путем вставки этапов рассуждений между входным вопросом и конечным результатом.

Этот процесс обычно работает двумя способами:

  • Zero-Shot CoT: пользователь добавляет к запросу простую триггерную фразу, например «Давайте подумаем пошагово». Это активирует скрытые способности модели к рассуждению без необходимости использования конкретных примеров.
  • Few-Shot CoT: подсказка включает в себя несколько примеров (образцов) вопросов в паре с их пошаговыми решениями. Это использует обучение по нескольким примерам, чтобы показать модели, как именно структурировать свою логику перед попыткой решения новой задачи.

Благодаря явному формированию промежуточных выводов модель имеет больше возможностей для самокорректировки и обеспечивает прозрачность процесса принятия решения. Это крайне важно для снижения вероятности возникновения галлюцинаций в LLM, когда модели могут с уверенностью утверждать неверные факты.

Применение в реальном мире

Хотя изначально разработанная для текстовой логики, подсказка Chain-of-Thought имеет мощные приложения в сочетании с другими областями ИИ, такими как компьютерное зрение и генерация кода.

1. Улучшение генерации кода для компьютерного зрения

Разработчики используют CoT для управления LLM при написании сложных программных скриптов для таких задач, как обнаружение объектов. Вместо расплывчатого запроса типа «написать код для поиска автомобилей», подсказка CoT может структурировать запрос: «Сначала импортируйте необходимые библиотеки. Во-вторых, загрузите предварительно обученную модель. В-третьих, определите источник изображения. Наконец, запустите цикл прогнозирования». Этот структурированный подход гарантирует, что сгенерированный код для моделей, таких как YOLO26, будет синтаксически правильным и логически обоснованным.

2. Автономное принятие решений

В области автономных транспортных средств системы должны обрабатывать визуальные данные и принимать решения, критические с точки зрения безопасности. Подход «цепочка мыслей» позволяет системе формулировать свою логику: «Я detect пешехода рядом с пешеходным переходом. Пешеход стоит лицом к дороге. Для меня светофор зеленый, но пешеход может выйти на дорогу. Поэтому я буду замедлять ход и готовлюсь остановиться». Это делает решения ИИ интерпретируемыми и соответствует принципам объяснимого ИИ (XAI).

Цепочка мыслей в действии

Хотя CoT в первую очередь является методом естественного языка, его можно реализовать программно, чтобы обеспечить согласованное взаимодействие с моделями зрения. Следующий Python демонстрирует, как разработчик может структурировать подсказку, чтобы направить LLM (здесь моделируемый) на генерацию действительного кода вывода для Ultralytics .

# Example of structuring a Chain-of-Thought prompt for an LLM
# This prompt guides the model to write a valid YOLO26 inference script

cot_prompt = """
Task: Write a Python script to detect objects using YOLO26.

Chain of Thought:
1. Import the YOLO class from the 'ultralytics' library.
2. Load the 'yolo26n.pt' model weights (the latest nano model).
3. Load a sample image using a URL or local path.
4. Run the predict() function and save the results.

Based on these steps, generate the Python code below:
"""

# In a real application, you would send 'cot_prompt' to an LLM API
print(f"Structured Prompt for LLM:\n{cot_prompt}")

Различение смежных понятий

Важно отличать подсказки «Цепочка мыслей» от схожих терминов в сфере машинного обучения (ML):

  • Цепочка подсказок: это соединение нескольких отдельных вызовов модели, где вывод одного шага становится вводом следующего. CoT происходит в рамках одной подсказки для вызова внутреннего рассуждения, тогда как цепочка подсказок координирует рабочий процесс через несколько взаимодействий.
  • Поисковое усиление генерации (RAG): RAG фокусируется на извлечении внешних данных (таких как документы или базы данных) для обоснования знаний модели. CoT фокусируется на самом процессе рассуждения. Часто они комбинируются — RAG используется для получения фактов, а CoT — для рассуждений о них.
  • Prompt Tuning: это эффективный с точки зрения параметров метод тонкой настройки, который оптимизирует непрерывные мягкие подсказки (векторы) во время обучения. CoT — это дискретная стратегия естественного языка, применяемая при выводах в реальном времени без изменения весов модели.

Перспективы на будущее

По мере развития базовых моделей подсказки Chain-of-Thought становятся стандартной передовой практикой для раскрытия их полного потенциала. Исследования таких групп, как Google , показывают, что по мере увеличения размера моделей их способность к CoT-рассуждениям значительно улучшается. Эта эволюция прокладывает путь для более надежных автономных агентов, способных обрабатывать сложные рабочие процессы в различных отраслях, от здравоохранения до интеллектуального производства.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас