Узнайте, как быстрая цепочка разбивает сложные задачи ИИ на надежные рабочие процессы. Узнайте, как интегрировать Ultralytics с LLM для создания продвинутых ИИ-агентов.
Цепочка подсказок — это передовой архитектурный паттерн в разработке искусственного интеллекта (ИИ), при котором сложная задача разбивается на последовательность более мелких, управляемых подзадач. В этом рабочем процессе результат одного шага — часто генерируемый большой языковой моделью (LLM) или системой компьютерного зрения — служит входными данными для следующего шага. В отличие от единого монолитного промпта, который пытается решить многогранную проблему сразу, цепочка позволяет разработчикам создавать более надежные, тестируемые и функциональные приложения. Этот модульный подход необходим для создания сложных ИИ-агентов, которые могут рассуждать, просматривать веб-страницы или взаимодействовать с физической средой.
По сути, быстрое цепочное соединение устраняет ограничения контекстных окон и возможностей рассуждения в Foundation Models. Когда модель должна выполнить слишком много различных операций в рамках одного запроса (например, «Проанализируй это изображение, извлеки текст, переведи его на испанский и отформатируй как счет в формате JSON»), вероятность ошибки увеличивается. Разбивая задачу на последовательные операции, разработчики могут проверять точность каждого этапа.
Эффективные цепочки часто используют «клей-код», написанный на языке Python или управляемый библиотеками оркестрации, такими как LangChain, для обработки преобразования данных между этапами. Это позволяет интегрировать разрозненные технологии, например, сочетать зрительную остроту обнаружения объектов с лингвистической беглостью генеративных текстовых моделей.
Цепочки подсказок особенно эффективны при преодолении разрыва между различными формами данных, позволяя мультимодальным моделям функционировать в динамичных промышленных и коммерческих условиях.
Следующий пример демонстрирует первое «звено» в цепочке: использование компьютерного зрения (CV) для генерации структурированных данных , которые служат контекстом для последующего подсказки.
from ultralytics import YOLO
# Load the YOLO26 model (natively end-to-end and highly efficient)
model = YOLO("yolo26n.pt")
# Step 1: Run inference to 'see' the environment
results = model("https://ultralytics.com/images/bus.jpg")
# Step 2: Format visual detections into a natural language string
det_names = [model.names[int(c)] for c in results[0].boxes.cls]
prompt_context = f"The scene contains: {', '.join(det_names)}. Please describe the likely activity."
# The 'prompt_context' variable is now ready to be sent to an LLM API
print(prompt_context)
Для реализации эффективных архитектур машинного обучения (ML) полезно различать цепочку подсказок от схожих терминов в сфере искусственного интеллекта:
Используя быструю цепочку, команды могут создавать надежные приложения, которые объединяют логику, извлечение данных и распознавание действий. Для управления наборами данных и обучения моделей зрения, которые питают эти цепочки, Ultralytics предлагает централизованное решение для аннотации, обучения и развертывания.