Глоссарий

Квантование модели

Оптимизируй модели глубокого обучения с помощью квантования модели. Повышай эффективность, скорость и экономию энергии на устройствах с ограниченными ресурсами. Узнай больше прямо сейчас!

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Квантование модели - важнейшая техника оптимизации в области искусственного интеллекта и машинного обучения, предназначенная для уменьшения размера и повышения эффективности моделей глубокого обучения. Она включает в себя преобразование весов и активаций модели из высокоточных, обычно 32-битных с плавающей точкой, в форматы более низкой точности, такие как 16-битные или даже 8-битные целые числа.

Почему квантование моделей имеет значение

По мере роста сложности и размера моделей ИИ они требуют все больше вычислительных ресурсов и памяти, что создает серьезные проблемы, особенно в средах граничных вычислений, где ресурсы ограничены. Квантование моделей помогает решить эти проблемы за счет:

  • Уменьшение размера модели: Квантование значительно уменьшает занимаемую моделями память, что позволяет развертывать их на устройствах с ограниченным объемом памяти, таких как смартфоны и пограничные устройства. Такая эффективность крайне важна для приложений в автономных транспортных средствах и IoT-устройствах, о чем мы рассказываем в нашем руководстве по граничным вычислениям.

  • Повышение скорости вычислений: Вычисления с более низкой точностью требуют меньшей вычислительной мощности, что приводит к более быстрому выводу. Такое увеличение скорости жизненно важно для приложений реального времени, таких как видеонаблюдение и автономное вождение, о чем рассказывается в статье " Автономное вождение".

  • Повышение энергоэффективности: Устройства могут обрабатывать квантованные модели с пониженным энергопотреблением, что очень важно для устройств, работающих от батареек.

Техники квантования моделей

Квантование модели может применяться на разных уровнях, включая:

  • Квантование веса: Преобразование весов модели к более низкой точности, достижение баланса между размером модели и точностью.
  • Квантование активаций: Уменьшение точности активаций во время выводов полезно как для уменьшения размера, так и для сокращения вычислений.

Примеры квантования моделей в действии

  1. Мобильные приложения: Квантованные модели используются в приложениях для смартфонов для перевода языка в реальном времени и обработки изображений, где необходимы быстрые и эффективные операции на ограниченных аппаратных ресурсах.

  2. Автономные транспортные средства: В автономных автомобилях принятие решений в реальном времени имеет решающее значение. Квантование позволяет моделям ИИ эффективно работать на встроенных системах, способствуя ускорению реакции и повышению безопасности навигации. Узнай больше об этом применении в статье "Самоуправляемые автомобили".

Отличие квантования модели от смежных концепций

  • Обрезка модели: В то время как квантование направлено на снижение точности, обрезка модели подразумевает удаление ненужных весов или нейронов, чтобы оптимизировать модель.

  • Смешанная точность: Концепция смешанной точности подразумевает использование нескольких прецизионностей в рамках одной модели, чтобы повысить производительность и эффективность без ущерба для точности.

Реальные применения и преимущества

  • Розничная торговля: Развертывание квантованных моделей в розничной торговле позволяет эффективно распознавать товары и управлять запасами, обеспечивая предприятиям более быстрые и масштабируемые решения на основе ИИ.

  • Здравоохранение: В здравоохранении квантованные модели используются для медицинской визуализации и диагностики, где скорость и точность имеют первостепенное значение.

В целом квантование моделей - важный инструмент в развитии технологий ИИ, позволяющий сделать их более доступными и эффективными для различных платформ и отраслей. О том, как в моделях Ultralytics YOLO используются методы квантования для оптимизации производительности, ты узнаешь из нашего руководства.

Читать полностью