Узнай, как детекторы на основе якорей революционизируют обнаружение объектов благодаря точной локализации, адаптивности к масштабу и реальным приложениям.
Детекторы на основе якорей представляют собой важный и основополагающий подход в компьютерном зрении (КЗ) для решения задачи обнаружения объектов. Эти модели работают с использованием предопределенного набора опорных ящиков, обычно называемых "якорями" или "приорами", которые имеют определенные размеры и соотношение сторон. Якоря распределяются по всему изображению и выступают в качестве начальных предположений или шаблонов, позволяя модели более эффективно предсказывать местоположение и класс объектов, особенно когда речь идет о предметах разного масштаба и формы. Многие влиятельные ранние модели обнаружения объектов, такие как некоторые версии Ultralytics YOLO использовали эту технику.
Фундаментальная концепция детекторов на основе якорей заключается в наложении плотной сетки этих предопределенных якорных блоков на входное изображение в разных местах и масштабах. Каждая якорная коробка соответствует потенциальному объекту с определенным размером и формой. В процессе обучения модели детектор учится двум основным вещам для каждого якоря: во-первых, он классифицирует, содержит ли якорь соответствующий объект или фон; во-вторых, он уточняет положение и размеры якоря (этот процесс называется регрессией), чтобы точно соответствовать границам реального объекта.
Рассмотрим обнаружение различных транспортных средств на изображении оживленной улицы. Вместо того чтобы анализировать каждую группу пикселей, модель, основанная на якорях, использует заранее определенные шаблоны коробок: маленькие - для пешеходов, средние квадраты - для автомобилей и большие прямоугольники - для автобусов. Эти шаблоны (якоря) размещаются по всему изображению. Если якорь значительно перекрывает автомобиль, модель учится классифицировать его как "автомобиль" и подстраивает координаты и размер якоря так, чтобы он идеально подходил под машину. Якоря, покрывающие только дорогу или здания, классифицируются как "фон". Такой систематический подход, руководствующийся заранее заданными формами, помогает справиться со сложностью обнаружения объектов. Производительность обычно оценивается с помощью таких метрик, как Intersection over Union (IoU) и mean Average Precision (mAP).
Детекторы на основе якорей, часто использующие в качестве основы мощные конволюционные нейронные сети (CNN), обладают явными преимуществами:
Детекторы на основе якоря были успешно применены в многочисленных реальных сценариях:
В последние годы в качестве популярной альтернативы появились безъякорные детекторы. В отличие от моделей, основанных на якорях (например, Ultralytics YOLOv5), безъякорные подходы предсказывают местоположение и размеры объектов напрямую, часто определяя ключевые точки (например, центры или углы объектов) или предсказывая расстояния от точки до границ объекта, что избавляет от необходимости использовать предопределенные формы якорей.
Ключевые отличия включают в себя:
Хотя детекторы на основе якорей, такие как YOLOv4, были весьма успешными, многие современные архитектуры, включая Ultralytics YOLO11, стали использовать безъякорные конструкции, чтобы использовать их преимущества в простоте и эффективности. Ты можешь изучить преимущества безъякорного детектирования в YOLO11 и посмотреть сравнения между различными моделями YOLO .
Разработка и развертывание моделей обнаружения объектов, как основанных на якорях, так и без них, предполагает использование таких фреймворков, как PyTorch или TensorFlow и библиотек вроде OpenCV. Такие платформы, как Ultralytics HUB, предлагают оптимизированные рабочие процессы для обучения пользовательских моделей, управления наборами данных и развертывания решений, поддерживая различные архитектуры моделей. Для дальнейшего обучения такие ресурсы, как Papers With Code, содержат список самых современных моделей, а курсы от таких платформ, как DeepLearning.AI, охватывают основополагающие концепции.