Глоссарий

Развертывание модели

Открой для себя основы развертывания моделей, превращая ML-модели в реальные инструменты для прогнозирования, автоматизации и понимания на основе ИИ.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Развертывание модели - это критически важный процесс, когда обученная модель машинного обучения (ML) становится доступной для использования в живой производственной среде. На этом этапе модель переходит из стадии разработки или тестирования в рабочий инструмент, который может генерировать предсказания(inference) на новых реальных данных. Это важнейший этап в жизненном цикле машинного обучения, преодолевающий разрыв между созданием ML-модели и ее реальным использованием для получения пользы в приложениях, системах или бизнес-процессах.

Актуальность развертывания модели

Без эффективного развертывания даже самая точная модель останется академическим упражнением, не способным принести ощутимую пользу. Развертывание очень важно для получения отдачи от инвестиций (ROI) в проекты AI и ML. Оно позволяет организациям автоматизировать задачи, получать действенные выводы из данных, улучшать пользовательский опыт и принимать обоснованные решения. Успешное развертывание гарантирует, что ресурсы, вложенные в обучение моделей, воплотятся в практические результаты. Непрерывная работа часто включает в себя мониторинг моделей, чтобы убедиться, что производительность не снижается со временем из-за таких факторов, как дрейф данных.

Области применения развертывания моделей

Развертывание моделей позволяет создавать огромное количество приложений на базе ИИ в разных отраслях. Вот несколько примеров:

  • Управление запасами в розничной торговле: Развертывание модели обнаружения объектов, как Ultralytics YOLO в розничной торговле позволяет камерам автоматически контролировать запасы на полках, отслеживать уровень запасов и оповещать персонал о том, что товар заканчивается, оптимизируя управление запасами и сокращая количество ручных проверок.
  • Автономные системы: Самоуправляемые автомобили и беспилотники во многом полагаются на развернутые модели для восприятия и навигации. Модели, обученные таким задачам, как обнаружение объектов, сегментация и планирование пути, устанавливаются на бортовые компьютеры системы, чтобы интерпретировать данные датчиков в режиме реального времени.

Важные соображения при развертывании модели

Эффективное развертывание ML-моделей требует тщательного планирования с учетом нескольких факторов:

  • Масштабируемость: Инфраструктура развертывания должна справляться с различной нагрузкой, увеличивая или уменьшая ее в зависимости от потребностей. Для этого часто используются платформы облачных вычислений или системы оркестровки контейнеров.
  • Латентность и пропускная способность: Приложениям часто требуется низкая задержка для отклика в реальном времени. Оптимизация моделей с помощью таких техник, как квантование или обрезка, а также использование эффективных режимов выполнения могут помочь удовлетворить требования к производительности.
  • Среда развертывания: Модели могут быть развернуты на серверах (облачных или локальных), непосредственно в приложениях или на устройствах с ограниченными ресурсами с помощью пограничных вычислений. Развертывание на пограничных устройствах требует оптимизации модели по размеру и вычислительной эффективности.
  • Обслуживание модели: Это включает в себя размещение модели, часто через API (интерфейс прикладного программирования), позволяя приложениям отправлять данные и получать прогнозы. Такие технологии, как Docker, часто используются для упаковки моделей и их зависимостей в переносимые контейнеры для последовательного развертывания.
  • Техническое обслуживание: Развернутые модели нуждаются в постоянном мониторинге и потенциальном переобучении или обновлении, чтобы поддерживать производительность и адаптироваться к изменяющимся моделям данных. Это относится к более широкой практике MLOps (Machine Learning Operations).

Инструменты и платформы

Различные инструменты и платформы упрощают процесс развертывания. Фреймворки часто предоставляют возможность экспорта моделей в различные форматы, подходящие для разных целей развертывания. Платформы вроде Ultralytics HUB предлагают интегрированные решения для обучения, отслеживания и развертывания моделей компьютерного зрения, оптимизируя рабочий процесс от разработки до производства. Другие специализированные инструменты для обслуживания моделей и сервисы облачных провайдеров также предлагают комплексные функции развертывания.

Читать полностью