Глоссарий

Обрезка

Оптимизируй модели ИИ с помощью обрезки - снижай сложность, повышай эффективность и быстрее разворачивай их на пограничных устройствах без ущерба для производительности.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Обрезка, в контексте искусственного интеллекта и машинного обучения, относится к техникам, используемым для снижения сложности модели путем удаления менее важных связей или параметров. Этот процесс направлен на рационализацию модели, делая ее более эффективной с точки зрения вычислений и использования памяти, без существенного ущерба для ее точности. Обрезка особенно ценна при развертывании моделей на устройствах с ограниченными ресурсами или при стремлении ускорить скорость вычислений.

Актуальность обрезки

Основная актуальность обрезки заключается в оптимизации модели. По мере того как модели глубокого обучения растут в размерах и усложняются для достижения более высокой точности, они становятся вычислительно дорогими и требуют много памяти. Это создает проблемы для развертывания, особенно на граничных устройствах, таких как смартфоны или встраиваемые системы, которые имеют ограниченные ресурсы. Обрезка решает эту проблему, создавая более компактные и быстрые модели, которые легче развернуть и которые требуют меньше вычислительной мощности, что позволяет делать выводы в реальном времени в различных приложениях. Это важнейший шаг в оптимизации моделей для их развертывания, делающий ИИ более доступным и практичным на различных платформах.

Применение обрезки

Методы обрезки применяются в различных областях ИИ и машинного обучения. Вот несколько конкретных примеров:

  • Мобильное компьютерное зрение: Рассмотрим Ultralytics YOLO модели, используемые в мобильных приложениях для таких задач, как обнаружение объектов. Обрезка может значительно уменьшить размер этих моделей, что позволит им эффективно работать на смартфонах, не расходуя заряд батареи и не снижая производительности. Это очень важно для приложений реального времени, таких как мобильные системы безопасности или приложения дополненной реальности. Например, развертывание обрезанной модели YOLO на Edge TPU на Raspberry Pi может привести к ускорению скорости вычислений и снижению энергопотребления.

  • Системы автономного вождения: В самоуправляемых автомобилях быстрое и точное обнаружение объектов имеет первостепенное значение. Автономные автомобили полагаются на сложные модели для обработки данных датчиков в режиме реального времени. Обрезка этих моделей может уменьшить задержку в выводах, обеспечивая более быстрое принятие решений системой искусственного интеллекта автомобиля. Это очень важно для безопасности и быстроты реакции в динамичных условиях вождения. Оптимизированные с помощью обрезки модели также могут быть развернуты с помощью TensorRT для дальнейшего повышения производительности на графических процессорах NVIDIA , которые обычно используются в автономных системах.

Виды и техники

Существуют различные подходы к обрезке, которые в целом делятся на:

  • Обрезка весов: Она заключается в удалении отдельных весов или связей в нейронной сети, которые оказывают минимальное влияние на выход модели. Такие техники, как обрезка по величине, удаляют веса с наименьшими абсолютными значениями.
  • Обрезка фильтров: Этот более структурированный подход удаляет целые фильтры (и связанные с ними карты признаков) из конволюционных слоев. Обрезка фильтров часто приводит к более значительному уменьшению размера модели и ускорению работы по сравнению с обрезкой весов, так как напрямую уменьшает количество вычислений.

Обрезка также может применяться на разных этапах процесса разработки модели:

  • Обрезка перед обучением: Обрезка выполняется на предварительно обученной модели. Это распространенный подход, так как предварительно обученные модели часто имеют избыточные параметры.
  • Обрезка во время тренировки: Обрезка интегрируется в сам процесс обучения. Это может привести к более эффективному обучению и потенциально лучшей производительности модели после обрезки.
  • Посттренировочная обрезка: Обрезка применяется после того, как модель полностью обучена. Это самый простой подход, который часто включает в себя такие техники, как квантование, чтобы еще больше уменьшить размер модели и ускорить вывод, иногда используется в сочетании с такими форматами, как ONNX.

В общем, обрезка - это важнейшая техника оптимизации модели, которая позволяет внедрять эффективные и производительные модели ИИ в условиях ограниченных ресурсов и в приложениях, чувствительных к задержкам. Снижая сложность модели, обрезка способствует тому, что ИИ становится более практичным и широко применимым.

Читать полностью