Пойми, как Ultralytics YOLO11 поддерживает безъякорное обнаружение объектов и какие преимущества дает эта модельная архитектура для различных приложений.
Если мы посмотрим на историю моделей ИИ для зрения, то концепция обнаружения объектов - основной задачи компьютерного зрения, которая заключается в идентификации и определении местоположения объектов в изображении или видео, - существует с 1960-х годов. Однако ключевая причина ее значимости в передовых инновациях сегодня заключается в том, что с тех пор техники обнаружения объектов и архитектуры моделей продвинулись вперед и стремительно совершенствовались.
В одной из предыдущих статей мы обсудили эволюцию обнаружения объектов и путь, который привел к моделям Ultralytics YOLO . Сегодня мы сосредоточимся на изучении более конкретной вехи в этом путешествии: переходе от детекторов, основанных на якорях, к детекторам без якорей.
Детекторы, основанные на якорях, опираются на заранее определенные ячейки, называемые "якорями", чтобы предсказать, где находятся объекты на изображении. В отличие от них, детекторы без якорей пропускают эти предопределенные коробки и вместо этого предсказывают местоположение объектов напрямую.
Хотя это изменение может показаться простым и логичным, на самом деле оно привело к значительным улучшениям в точности и эффективности обнаружения объектов. В этой статье мы разберемся, как безъякорные детекторы изменили компьютерное зрение благодаря таким достижениям, как Ultralytics YOLO11.
Детекторы, основанные на якорях, используют заранее определенные ящики, известные как якоря, чтобы помочь найти объекты на изображении. Представь себе эти якоря как сетку из коробок разных размеров и форм, расположенных поверх изображения. Затем модель подстраивает эти коробки под объекты, которые она обнаруживает. Например, если модель идентифицирует автомобиль, она изменит якорную коробку, чтобы она более точно соответствовала положению и размеру машины.
Каждый якорь связан с возможным объектом на изображении, и в процессе обучения модель учится настраивать ящики с якорями, чтобы они лучше соответствовали расположению, размеру и соотношению сторон объекта. Это позволяет модели обнаруживать объекты разного масштаба и ориентации. Однако выбор правильного набора якорных ящиков может занять много времени, а процесс их тонкой настройки чреват ошибками.
Хотя детекторы на основе якорей, такие как YOLOv4, отлично работают во многих приложениях, у них есть некоторые недостатки. Например, якорные блоки не всегда хорошо совмещаются с объектами разных форм и размеров, что затрудняет обнаружение небольших или неправильной формы объектов. Процесс выбора и точной настройки размеров якорных блоков также может отнимать много времени и требует больших ручных усилий. Кроме того, модели, основанные на якорях, часто испытывают трудности с обнаружением объектов, которые заслоняют или перекрывают друг друга, так как предопределенные ящики могут плохо адаптироваться к этим более сложным сценариям.
Безъякорные детекторы начали привлекать внимание в 2018 году благодаря таким моделям, как CornerNet и CenterNet, которые применили свежий подход к обнаружению объектов, избавившись от необходимости использовать предопределенные якорные коробки. В отличие от традиционных моделей, которые полагаются на якорные ящики разных размеров и форм, чтобы предсказать, где находятся объекты, безъякорные модели предсказывают местоположение объектов напрямую. Они фокусируются на ключевых точках или особенностях объекта, например на его центре, что упрощает процесс обнаружения и делает его более быстрым и точным.
Вот как обычно работают безъякорные модели:
Поскольку безъякорные модели не полагаются на якорные ящики, они имеют более простую конструкцию. Это означает, что они более эффективны с вычислительной точки зрения. Поскольку им не нужно обрабатывать множество якорных ящиков, они могут быстрее обнаруживать объекты - важное преимущество в приложениях реального времени, таких как автономное вождение и видеонаблюдение.
Безъякорные модели также гораздо лучше справляются с маленькими, нерегулярными или закрытыми объектами. Поскольку они сосредоточены на обнаружении ключевых точек, а не на попытке подогнать их под якорные коробки, они гораздо более гибкие. Это позволяет им точно обнаруживать объекты в загроможденном или сложном окружении, где модели, основанные на якорях, могут потерпеть неудачу.
Изначально созданные для скорости и эффективности, модели YOLO постепенно перешли от методов, основанных на якорях, к безъякорному обнаружению, что сделало такие модели, как YOLO11 , более быстрыми, гибкими и лучше подходящими для широкого спектра приложений реального времени.
Вот краткий обзор того, как безъякорная конструкция эволюционировала в разных версиях YOLO :
Отличный пример преимуществ безъякорного обнаружения с помощью YOLO11 - автономные автомобили. В самоуправляемых автомобилях быстрое и точное обнаружение пешеходов, других транспортных средств и препятствий имеет решающее значение для безопасности. YOLO11 Безъякорный подход упрощает процесс обнаружения, напрямую предсказывая ключевые точки объектов, такие как центр пешехода или границы другого транспортного средства, а не полагаясь на предопределенные якорные точки.
YOLO11 не нужно настраивать или подгонять сетку якорей под каждый объект, что может быть вычислительно дорого и медленно. Вместо этого он фокусируется на ключевых характеристиках, что делает его быстрее и эффективнее. Например, когда пешеход выходит на траекторию движения автомобиля, YOLO11 может быстро определить его местоположение, точно указывая на ключевые точки, даже если человек частично скрыт или движется. Способность адаптироваться к различным формам и размерам без якорных блоков позволяет YOLO11 обнаруживать объекты более надежно и на более высоких скоростях, что крайне важно для принятия решений в реальном времени в системах автономного вождения.
Другие области применения, в которых YOLO11'безъякорные способности действительно выделяются, включают в себя:
Хотя безъякорные модели, такие как YOLO11 , обладают множеством преимуществ, они все же имеют определенные ограничения. Одно из главных практических соображений заключается в том, что даже безъякорные модели могут испытывать трудности с окклюзиями или сильно перекрывающимися объектами. Это объясняется тем, что компьютерное зрение нацелено на воспроизведение человеческого зрения, и так же, как мы иногда сталкиваемся с трудностями при идентификации закрытых объектов, модели ИИ могут столкнуться с подобными проблемами.
Еще один интересный фактор связан с обработкой предсказаний модели. Хотя архитектура моделей без якорей проще, чем с якорями, в некоторых случаях возникает необходимость в дополнительной доработке. Например, для очистки перекрывающихся предсказаний или повышения точности в переполненных сценах могут потребоваться методы постобработки, такие как немаксимальное подавление (NMS).
Переход от обнаружения по якорям к обнаружению без якорей стал значительным прогрессом в обнаружении объектов. С такими безъякорными моделями, как YOLO11, процесс упрощается, что приводит к повышению точности и скорости.
На примере YOLO11 мы убедились, что безъякорное обнаружение объектов лучше всего работает в приложениях реального времени, таких как самодвижущиеся автомобили, видеонаблюдение и медицинская визуализация, где быстрое и точное обнаружение имеет решающее значение. Такой подход позволяет YOLO11 легче адаптироваться к различным размерам объектов и сложным сценам, обеспечивая лучшую производительность в различных средах.
По мере того как компьютерное зрение продолжает развиваться, обнаружение объектов будет становиться только быстрее, гибче и эффективнее.
Изучи наш репозиторий на GitHub и присоединяйся к нашему интересному сообществу, чтобы быть в курсе всех событий, связанных с искусственным интеллектом. Узнай, как Vision AI влияет на такие отрасли, как производство и сельское хозяйство.
Начни свое путешествие с будущим машинного обучения