Глоссарий

Развертывание модели

Открой для себя основы развертывания моделей, превращая ML-модели в реальные инструменты для прогнозирования, автоматизации и понимания на основе ИИ.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Развертывание модели - это процесс интеграции обученной модели машинного обучения в существующую производственную среду для получения практических, реальных прогнозов. Это важнейший этап в жизненном цикле машинного обучения, так как он делает модель доступной для использования в приложениях, системах или бизнес-процессах. Без развертывания модель остается в среде разработки и не может принести пользу в реальных сценариях.

Актуальность развертывания модели

Развертывание модели преодолевает разрыв между ее разработкой и практическим применением. Это этап, на котором модели машинного обучения превращаются из теоретических построений в осязаемые инструменты, способные автоматизировать задачи, дать понимание и стимулировать принятие решений. Успешное развертывание модели гарантирует, что усилия и ресурсы, вложенные в ее разработку, воплотятся в реальные преимущества, будь то улучшение бизнес-операций, повышение качества обслуживания пользователей или решение сложных проблем. Развертывание необходимо для получения отдачи от инвестиций в проекты ИИ и машинного обучения, позволяя моделям генерировать предсказания на новых, невидимых данных и постоянно учиться и совершенствоваться с течением времени благодаря мониторингу моделей.

Области применения развертывания моделей

Развертывание моделей является неотъемлемой частью широкого спектра приложений в различных отраслях. Вот несколько конкретных примеров:

  • Умная розничная торговля: В розничной торговле модели обнаружения объектов, такие как Ultralytics YOLOv8 , могут быть развернуты в магазине, чтобы следить за уровнем запасов в режиме реального времени. Развернутые модели анализируют записи с камер, чтобы автоматически подсчитывать количество товаров на полках, выявлять неправильно расставленные предметы и отправлять оповещения о низком уровне запасов. Это обеспечивает эффективное управление запасами, уменьшает их отсутствие на складе и улучшает общее впечатление от покупок, обеспечивая доступность товаров.
  • Автономные транспортные средства: Самоуправляемые автомобили в значительной степени полагаются на развернутые модели обнаружения объектов и сегментации экземпляров. Эти модели, часто основанные на таких архитектурах, как YOLOv5, устанавливаются на бортовой компьютер автомобиля и обрабатывают данные с камер и LiDAR в режиме реального времени. Развернутые модели обнаруживают пешеходов, транспортные средства, дорожные знаки и другие препятствия, позволяя автомобилю безопасно перемещаться и принимать взвешенные решения по управлению, что способствует развитию ИИ в самодвижущихся автомобилях.

Важные соображения при развертывании модели

Во время развертывания модели учитывается несколько важных аспектов, чтобы обеспечить эффективность, надежность и масштабируемость:

  • Умозаключения: Выводы в реальном времени - ключевой момент, особенно для приложений, требующих немедленного прогнозирования, таких как автономное вождение или анализ видео в реальном времени. Оптимизация моделей для получения низкой задержки в выводах имеет решающее значение, и часто включает в себя такие техники, как квантование модели и обрезка для уменьшения размера модели и вычислительных накладных расходов. TensorRTВысокопроизводительный оптимизатор выводов NVIDIA часто используется для ускорения выводов для моделей Ultralytics YOLO на NVIDIA GPU.
  • Среды развертывания: Модели могут быть развернуты в различных средах, каждая из которых имеет свой набор требований и ограничений.
    • Развертывание на границе сети: Edge computing подразумевает развертывание моделей на устройствах на границе сети, таких как смартфоны, встраиваемые системы вроде NVIDIA Jetson или Raspberry Pi, а также пограничные серверы. Пограничное развертывание выгодно для приложений, требующих низкой задержки, конфиденциальности данных и возможности работы в автономном режиме. Например, развертывание FastSAM модель на мобильном устройстве для сегментации изображений в реальном времени.
    • Развертывание в облаке: Облачные вычисления предлагают масштабируемую инфраструктуру для развертывания моделей в виде веб-сервисов или API. Облачное развертывание подходит для приложений, требующих высокой доступности, масштабируемости и централизованного управления. Такие платформы, как Ultralytics HUB, облегчают облачное развертывание, позволяя пользователям обучать, развертывать и управлять Ultralytics YOLO моделями в облаке.
  • Обслуживание моделей: Обслуживание моделей - это процесс предоставления доступа к развернутым моделям приложениям или пользователям, часто через API. Надежные решения для обслуживания моделей обеспечивают высокую доступность, масштабируемость и эффективное управление развернутыми моделями. Такие инструменты, как NVIDIA Triton Inference Server, могут быть интегрированы с Ultralytics YOLO для масштабируемых и эффективных развертываний глубокого обучения.

Успешное развертывание моделей - это многогранный процесс, который требует тщательного планирования, оптимизации и мониторинга, чтобы модели машинного обучения приносили пользу в реальных приложениях. Такие платформы, как Ultralytics HUB, призваны упростить и оптимизировать процесс развертывания, сделав его более доступным для разработчиков и предприятий, чтобы использовать мощь ИИ видения.

Читать полностью