Зелёная проверка
Ссылка копируется в буфер обмена

Преимущества Ultralytics YOLO11 в том, что это безъякорный детектор.

Пойми, как Ultralytics YOLO11 поддерживает безъякорное обнаружение объектов и какие преимущества дает эта модельная архитектура для различных приложений.

Если мы посмотрим на историю моделей ИИ для зрения, то концепция обнаружения объектов - основной задачи компьютерного зрения, которая заключается в идентификации и определении местоположения объектов в изображении или видео, - существует с 1960-х годов. Однако ключевая причина ее значимости в передовых инновациях сегодня заключается в том, что с тех пор техники обнаружения объектов и архитектуры моделей продвинулись вперед и стремительно совершенствовались. 

В одной из предыдущих статей мы обсудили эволюцию обнаружения объектов и путь, который привел к моделям Ultralytics YOLO . Сегодня мы сосредоточимся на изучении более конкретной вехи в этом путешествии: переходе от детекторов, основанных на якорях, к детекторам без якорей. 

Детекторы, основанные на якорях, опираются на заранее определенные ячейки, называемые "якорями", чтобы предсказать, где находятся объекты на изображении. В отличие от них, детекторы без якорей пропускают эти предопределенные коробки и вместо этого предсказывают местоположение объектов напрямую.

Хотя это изменение может показаться простым и логичным, на самом деле оно привело к значительным улучшениям в точности и эффективности обнаружения объектов. В этой статье мы разберемся, как безъякорные детекторы изменили компьютерное зрение благодаря таким достижениям, как Ultralytics YOLO11.

Что такое детекторы на основе якоря?

Детекторы, основанные на якорях, используют заранее определенные ящики, известные как якоря, чтобы помочь найти объекты на изображении. Представь себе эти якоря как сетку из коробок разных размеров и форм, расположенных поверх изображения. Затем модель подстраивает эти коробки под объекты, которые она обнаруживает. Например, если модель идентифицирует автомобиль, она изменит якорную коробку, чтобы она более точно соответствовала положению и размеру машины.

Каждый якорь связан с возможным объектом на изображении, и в процессе обучения модель учится настраивать ящики с якорями, чтобы они лучше соответствовали расположению, размеру и соотношению сторон объекта. Это позволяет модели обнаруживать объекты разного масштаба и ориентации. Однако выбор правильного набора якорных ящиков может занять много времени, а процесс их тонкой настройки чреват ошибками.

Рис. 1. Что такое анкерный ящик?

Хотя детекторы на основе якорей, такие как YOLOv4, отлично работают во многих приложениях, у них есть некоторые недостатки. Например, якорные блоки не всегда хорошо совмещаются с объектами разных форм и размеров, что затрудняет обнаружение небольших или неправильной формы объектов. Процесс выбора и точной настройки размеров якорных блоков также может отнимать много времени и требует больших ручных усилий. Кроме того, модели, основанные на якорях, часто испытывают трудности с обнаружением объектов, которые заслоняют или перекрывают друг друга, так как предопределенные ящики могут плохо адаптироваться к этим более сложным сценариям.

Переход к безъякорному обнаружению объектов

Безъякорные детекторы начали привлекать внимание в 2018 году благодаря таким моделям, как CornerNet и CenterNet, которые применили свежий подход к обнаружению объектов, избавившись от необходимости использовать предопределенные якорные коробки. В отличие от традиционных моделей, которые полагаются на якорные ящики разных размеров и форм, чтобы предсказать, где находятся объекты, безъякорные модели предсказывают местоположение объектов напрямую. Они фокусируются на ключевых точках или особенностях объекта, например на его центре, что упрощает процесс обнаружения и делает его более быстрым и точным.

Вот как обычно работают безъякорные модели:

  • Обнаружение ключевой точки: Вместо того чтобы использовать заранее определенные ячейки, некоторые модели определяют важные точки на объекте, например центр или определенные углы. Эти ключевые точки помогают моделям понять, где находится объект и насколько он велик.
  • Центр предсказание: Некоторые модели сосредоточены на предсказании центра объекта. Как только центр найден, модель может предсказать размер и положение всего объекта, исходя из этого.
  • Регрессия по тепловым картам: Многие модели без привязки используют тепловые карты, где каждый пиксель представляет собой возможное местоположение объекта. Более сильные значения тепловой карты указывают на большую уверенность в том, что в этой точке находится объект.
Рис. 2. Обнаружение на основе якорей и обнаружение без якорей.

Поскольку безъякорные модели не полагаются на якорные ящики, они имеют более простую конструкцию. Это означает, что они более эффективны с вычислительной точки зрения. Поскольку им не нужно обрабатывать множество якорных ящиков, они могут быстрее обнаруживать объекты - важное преимущество в приложениях реального времени, таких как автономное вождение и видеонаблюдение. 

Безъякорные модели также гораздо лучше справляются с маленькими, нерегулярными или закрытыми объектами. Поскольку они сосредоточены на обнаружении ключевых точек, а не на попытке подогнать их под якорные коробки, они гораздо более гибкие. Это позволяет им точно обнаруживать объекты в загроможденном или сложном окружении, где модели, основанные на якорях, могут потерпеть неудачу.

Ultralytics YOLO11: Безъякорный детектор

Изначально созданные для скорости и эффективности, модели YOLO постепенно перешли от методов, основанных на якорях, к безъякорному обнаружению, что сделало такие модели, как YOLO11 , более быстрыми, гибкими и лучше подходящими для широкого спектра приложений реального времени.

Вот краткий обзор того, как безъякорная конструкция эволюционировала в разных версиях YOLO :

  • Ultralytics YOLOv5u: Представил безякорную головку Ultralytics , устраняющую необходимость в предопределенных якорных коробках. Вместо этого модель напрямую предсказывает, где находятся объекты в изображении, упрощая процесс и повышая гибкость и скорость.
  • YOLOv6: Был использован новый метод под названием Anchor-Aided Training (AAT), в котором якоря использовались только во время обучения. Это позволило модели извлечь выгоду из структуры методов, основанных на якорях, во время обучения, но при этом использовать безъякорное обнаружение во время выполнения для большей скорости и адаптивности.
  • Ultralytics YOLOv8: Полностью перешел на безъякорное обнаружение, используя безъякорную раздельную головку Ultralytics . Это сделало модель более быстрой и точной, особенно для маленьких или странной формы объектов, которые не очень хорошо подходят для якорных коробок.
  • Ultralytics YOLO11: Развивает подход YOLOv8'без якорей, оптимизируя обнаружение еще больше за счет полного отказа от якорных блоков. Это обеспечивает более быстрое и точное обнаружение для приложений реального времени, таких как наблюдение за поведением животных и аналитика розничной торговли.
Рис. 3. Сравнение Ultralytics YOLOv8 и Ultralytics YOLO11 .

Применение в реальном мире YOLO11

Отличный пример преимуществ безъякорного обнаружения с помощью YOLO11 - автономные автомобили. В самоуправляемых автомобилях быстрое и точное обнаружение пешеходов, других транспортных средств и препятствий имеет решающее значение для безопасности. YOLO11 Безъякорный подход упрощает процесс обнаружения, напрямую предсказывая ключевые точки объектов, такие как центр пешехода или границы другого транспортного средства, а не полагаясь на предопределенные якорные точки. 

Рис. 4. Преимущества обнаружения без якорей в YOLO11 (изображение автора).

YOLO11 не нужно настраивать или подгонять сетку якорей под каждый объект, что может быть вычислительно дорого и медленно. Вместо этого он фокусируется на ключевых характеристиках, что делает его быстрее и эффективнее. Например, когда пешеход выходит на траекторию движения автомобиля, YOLO11 может быстро определить его местоположение, точно указывая на ключевые точки, даже если человек частично скрыт или движется. Способность адаптироваться к различным формам и размерам без якорных блоков позволяет YOLO11 обнаруживать объекты более надежно и на более высоких скоростях, что крайне важно для принятия решений в реальном времени в системах автономного вождения.

Другие области применения, в которых YOLO11'безъякорные способности действительно выделяются, включают в себя:

  • Управление розничной торговлей и запасами: YOLO11 облегчает наблюдение за товарами на полках, даже если они сложены в штабеля или частично завалены. Это помогает быстрее и точнее отслеживать товарные запасы и уменьшает количество ошибок.
  • Медицинская визуализацияYOLO11 также эффективен в здравоохранении, где с его помощью можно обнаружить опухоли или другие аномалии на медицинских снимках. Его способность работать с объектами неправильной формы помогает повысить точность диагностики сложных состояний.
  • Наблюдение за дикой природой: В исследованиях дикой природы YOLO11 может отслеживать животных в густых лесах или на труднопроходимой местности, помогая исследователям следить за поведением или защищать исчезающие виды.
  • Спортивная аналитикаYOLO11 можно использовать для отслеживания игроков, движения мяча или других элементов в реальном времени во время спортивных событий, чтобы предоставить ценные сведения для команд, тренеров и телеведущих.

При работе с безъякорными моделями нужно учитывать следующие моменты

Хотя безъякорные модели, такие как YOLO11 , обладают множеством преимуществ, они все же имеют определенные ограничения. Одно из главных практических соображений заключается в том, что даже безъякорные модели могут испытывать трудности с окклюзиями или сильно перекрывающимися объектами. Это объясняется тем, что компьютерное зрение нацелено на воспроизведение человеческого зрения, и так же, как мы иногда сталкиваемся с трудностями при идентификации закрытых объектов, модели ИИ могут столкнуться с подобными проблемами.

Еще один интересный фактор связан с обработкой предсказаний модели. Хотя архитектура моделей без якорей проще, чем с якорями, в некоторых случаях возникает необходимость в дополнительной доработке. Например, для очистки перекрывающихся предсказаний или повышения точности в переполненных сценах могут потребоваться методы постобработки, такие как немаксимальное подавление (NMS).

Забей якорь на будущее искусственного интеллекта с YOLO11

Переход от обнаружения по якорям к обнаружению без якорей стал значительным прогрессом в обнаружении объектов. С такими безъякорными моделями, как YOLO11, процесс упрощается, что приводит к повышению точности и скорости.

На примере YOLO11 мы убедились, что безъякорное обнаружение объектов лучше всего работает в приложениях реального времени, таких как самодвижущиеся автомобили, видеонаблюдение и медицинская визуализация, где быстрое и точное обнаружение имеет решающее значение. Такой подход позволяет YOLO11 легче адаптироваться к различным размерам объектов и сложным сценам, обеспечивая лучшую производительность в различных средах.

По мере того как компьютерное зрение продолжает развиваться, обнаружение объектов будет становиться только быстрее, гибче и эффективнее.

Изучи наш репозиторий на GitHub и присоединяйся к нашему интересному сообществу, чтобы быть в курсе всех событий, связанных с искусственным интеллектом. Узнай, как Vision AI влияет на такие отрасли, как производство и сельское хозяйство.

Логотип FacebookЛоготип ТвиттераЛоготип LinkedInСимвол копирования-ссылки

Читайте больше в этой категории

Давай вместе построим будущее
искусственного интеллекта!

Начни свое путешествие с будущим машинного обучения