Глоссарий

Подталкивание цепочки мыслей

Усиль рассуждения искусственного интеллекта с помощью подсказок по цепочке мыслей! Повысь точность, прозрачность и сохранение контекста при решении сложных многоэтапных задач.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Подсказки по цепочке мыслей (CoT) - это продвинутая техника, разработанная для улучшения способности к рассуждениям больших языковых моделей (LLM). Вместо того чтобы требовать от модели прямого ответа, CoT направляет модель через промежуточные этапы рассуждений, подобно тому, как человек разбивает сложную задачу на части. Этот метод побуждает модель "думать шаг за шагом", что приводит к более точным, последовательным и обоснованным результатам, особенно в задачах, требующих арифметических, логических или символических рассуждений. Это ключевая техника в более широкой области оперативной инженерии.

Как работает цепочка мыслей

Подсказки в виде цепочки мыслей работают за счет того, что подсказка включает в себя ряд промежуточных шагов рассуждения, которые приводят к окончательному ответу. Этого можно добиться несколькими способами, часто с приведением примеров(обучение в несколько кадров), в которых процесс рассуждения изложен в явном виде. Например, вместо того чтобы просто спросить: "Что является результатом X?", подсказка может содержать пример вроде "Q: Проблема Y. A: Шаг 1..., Шаг 2..., Окончательный ответ Z. В: Проблема X. О:". Затем модель учится следовать этому шаблону, генерируя свои собственные шаги рассуждения, прежде чем прийти к выводу. Это контрастирует со стандартными подсказками, которые обычно требуют прямого ответа без явных шагов рассуждения. Эффективность зависит от способности LLM распознавать и воспроизводить продемонстрированный шаблон рассуждений, а такая способность часто появляется в моделях достаточного масштаба, о чем свидетельствуют такие исследования, как Google "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models".

Основные преимущества цепочки мыслей

Использование подсказок Chain-of-Thought дает несколько преимуществ для улучшения работы модели ИИ:

  • Улучшенное мышление: Значительно повышает производительность при выполнении заданий, требующих многоступенчатых логических умозаключений, математических расчетов или понимания здравого смысла.
  • Повышение прозрачности: Делает процесс рассуждений в модели видимым, способствуя развитию объяснимого ИИ (XAI), позволяя пользователям понять, как был получен тот или иной ответ. Это помогает в отладке и выявлении потенциальных недостатков в логике модели.
  • Повышение точности: разбивая проблемы на части, модели реже допускают ошибки по сравнению с попытками решить сложные задачи за один шаг, что приводит к повышению точности.
  • Лучше справляется со сложностью: Позволяет моделям решать более сложные задачи, которые было бы трудно решить только с помощью прямых подсказок.

Применение в реальном мире

Подсказки CoT ценны в различных сферах, где подробные рассуждения имеют решающее значение:

Пример 1: Комплексная поддержка клиентов

Чатботы на базе LLM могут использовать CoT для решения многогранных проблем клиентов. Если клиент спрашивает о возврате бракованного товара, купленного по коду скидки, чат-бот, управляемый CoT, может сначала проверить дату покупки, ознакомиться с политикой возврата, рассчитать сумму возврата с учетом скидки, а затем описать шаги по возврату, четко объяснив каждую часть. Такой структурированный подход обеспечивает точное рассмотрение всех аспектов, повышая удовлетворенность клиента по сравнению с потенциально неполным прямым ответом. Такие платформы, как Hugging Face содержат модели, на которых можно изучить подобные техники подсказок.

Пример 2: Образовательные обучающие системы

ИИ-репетиторы могут использовать CoT для объяснения сложных концепций или пошагового решения задач. Когда ученик затрудняется с решением математической задачи, ИИ может сгенерировать подробный путь решения, объясняя каждый логический шаг, а не просто предоставляя окончательный ответ. Это поможет ученику понять основополагающие принципы и освоить процесс решения задач. Это совпадает с целями ИИ в образовании - персонализировать обучение.

Сравнение с родственными концепциями

  • Инженерия подсказок: CoT - это конкретная техника в рамках более широкой практики инженерии подсказок, которая охватывает все методы разработки эффективных подсказок для моделей ИИ.
  • Цепочка подсказок: Несмотря на схожесть и многоступенчатость, цепочка подсказок обычно предполагает разбиение задачи на последовательные подзадачи, где результат одной подсказки становится входом для следующей. CoT обычно фокусируется на выявлении рассуждений в рамках одного взаимодействия подсказки и ответа, часто демонстрируя это на примерах.
  • Zero-Shot Learning: Обучение с нулевым выстрелом подразумевает, что модель просят выполнить задачу, которой она не была явно обучена, без примеров. Zero-shot CoT пытается вызвать пошаговые рассуждения, просто добавляя в подсказку фразы вроде "Давайте думать шаг за шагом", не приводя примеров. Это делает его более доступным, но может быть менее надежным, чем малозадачный CoT.

Подсказки CoT - это значительный шаг к созданию более способных и прозрачных систем искусственного интеллекта (ИИ), особенно в областях, требующих принятия сложных решений, таких как анализ медицинских изображений или финансовое моделирование, дополняющий достижения в таких областях, как компьютерное зрение, созданное с помощью таких моделей, как Ultralytics YOLO. Инструменты и платформы вроде Ultralytics HUB облегчают разработку и развертывание сложных моделей ИИ, где понимание продвинутых техник вроде CoT может оказаться полезным.

Читать полностью