Глоссарий

Детекторы, основанные на якоре

Узнай, как детекторы на основе якорей революционизируют обнаружение объектов благодаря точной локализации, адаптивности к масштабу и реальным приложениям.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Детекторы на основе якорей представляют собой важный и основополагающий подход в компьютерном зрении (КЗ) для решения задачи обнаружения объектов. Эти модели работают с использованием предопределенного набора опорных ящиков, обычно называемых "якорями" или "приорами", которые имеют определенные размеры и соотношение сторон. Якоря распределяются по всему изображению и выступают в качестве начальных предположений или шаблонов, позволяя модели более эффективно предсказывать местоположение и класс объектов, особенно когда речь идет о предметах разного масштаба и формы. Многие влиятельные ранние модели обнаружения объектов, такие как некоторые версии Ultralytics YOLO использовали эту технику.

Как работают детекторы, основанные на якоре

Фундаментальная концепция детекторов на основе якорей заключается в наложении плотной сетки этих предопределенных якорных блоков на входное изображение в разных местах и масштабах. Каждая якорная коробка соответствует потенциальному объекту с определенным размером и формой. В процессе обучения модели детектор учится двум основным вещам для каждого якоря: во-первых, он классифицирует, содержит ли якорь соответствующий объект или фон; во-вторых, он уточняет положение и размеры якоря (этот процесс называется регрессией), чтобы точно соответствовать границам реального объекта.

Рассмотрим обнаружение различных транспортных средств на изображении оживленной улицы. Вместо того чтобы анализировать каждую группу пикселей, модель, основанная на якорях, использует заранее определенные шаблоны коробок: маленькие - для пешеходов, средние квадраты - для автомобилей и большие прямоугольники - для автобусов. Эти шаблоны (якоря) размещаются по всему изображению. Если якорь значительно перекрывает автомобиль, модель учится классифицировать его как "автомобиль" и подстраивает координаты и размер якоря так, чтобы он идеально подходил под машину. Якоря, покрывающие только дорогу или здания, классифицируются как "фон". Такой систематический подход, руководствующийся заранее заданными формами, помогает справиться со сложностью обнаружения объектов. Производительность обычно оценивается с помощью таких метрик, как Intersection over Union (IoU) и mean Average Precision (mAP).

Ключевые особенности и преимущества

Детекторы на основе якорей, часто использующие в качестве основы мощные конволюционные нейронные сети (CNN), обладают явными преимуществами:

  • Работа с изменениями масштаба и соотношения сторон: Предопределенные якоря явно охватывают различные формы и размеры, что делает эти модели изначально хорошими для обнаружения объектов независимо от их размеров и ориентации.
  • Структурированное предсказание: Якоря обеспечивают структурированный способ генерации предложений об объектах по всему изображению, обеспечивая всесторонний охват.
  • Высокая запоминаемость: Генерируя большое количество потенциальных местоположений объектов с помощью якорей, эти методы часто достигают высокой запоминаемости, то есть они хорошо находят наиболее релевантные объекты, хотя иногда для этого требуются такие шаги постобработки, как немаксимальное подавление (NMS) для фильтрации дубликатов.
  • Доказанная производительность: Такие архитектуры, как Faster R-CNN и SSD (Single Shot MultiBox Detector), продемонстрировали высокую производительность на стандартных эталонных наборах данных, таких как COCO.

Применение в реальном мире

Детекторы на основе якоря были успешно применены в многочисленных реальных сценариях:

  1. Автономные транспортные средства: Обнаружение автомобилей, пешеходов, велосипедистов и дорожных знаков разного размера и расстояния крайне важно для безопасной навигации. Методы, основанные на якорях, помогают обеспечить надежную идентификацию объектов как вблизи, так и вдали, больших и маленьких. Такие компании, как Waymo, во многом полагаются на надежное обнаружение объектов. Узнай больше об искусственном интеллекте в самодвижущихся автомобилях.
  2. Аналитика в розничной торговле: В магазинах эти детекторы могут следить за полками, чтобы идентифицировать товары, проверять уровень запасов или анализировать движение покупателей, обнаруживая людей. Способность работать с упаковками разных размеров и форм необходима для таких приложений, как управление запасами на основе искусственного интеллекта.

Детекторы, основанные на якорях, и безъякорные детекторы

В последние годы в качестве популярной альтернативы появились безъякорные детекторы. В отличие от моделей, основанных на якорях (например, Ultralytics YOLOv5), безъякорные подходы предсказывают местоположение и размеры объектов напрямую, часто определяя ключевые точки (например, центры или углы объектов) или предсказывая расстояния от точки до границ объекта, что избавляет от необходимости использовать предопределенные формы якорей.

Ключевые отличия включают в себя:

  • Сложность: Модели с якорями требуют тщательной разработки и настройки параметров якоря (размеров, соотношения, масштаба), которые могут зависеть от набора данных. Модели без якорей упрощают конструкцию головки обнаружения.
  • Гибкость: Безъякорные методы могут лучше адаптироваться к объектам с необычным соотношением сторон или формам, которые не очень хорошо представлены фиксированным набором якорей.
  • Эффективность: Устранение якорей может уменьшить количество предсказаний, которые должна сделать модель, что потенциально приведет к более быстрому выводу и более простой постобработке.

Хотя детекторы на основе якорей, такие как YOLOv4, были весьма успешными, многие современные архитектуры, включая Ultralytics YOLO11, стали использовать безъякорные конструкции, чтобы использовать их преимущества в простоте и эффективности. Ты можешь изучить преимущества безъякорного детектирования в YOLO11 и посмотреть сравнения между различными моделями YOLO .

Инструменты и обучение

Разработка и развертывание моделей обнаружения объектов, как основанных на якорях, так и без них, предполагает использование таких фреймворков, как PyTorch или TensorFlow и библиотек вроде OpenCV. Такие платформы, как Ultralytics HUB, предлагают оптимизированные рабочие процессы для обучения пользовательских моделей, управления наборами данных и развертывания решений, поддерживая различные архитектуры моделей. Для дальнейшего обучения такие ресурсы, как Papers With Code, содержат список самых современных моделей, а курсы от таких платформ, как DeepLearning.AI, охватывают основополагающие концепции.

Читать полностью