Ограничительная рамка - это прямоугольная рамка, используемая в компьютерном зрении (КВЗ) для указания местоположения и приблизительной протяженности объекта в кадре изображения или видео. Обычно они определяются координатами левого верхнего и правого нижнего углов (или центральной точкой, шириной и высотой), поэтому такие рамки представляют собой простой, но эффективный метод указания того, где находится объект и сколько места он занимает. Граничные коробки являются фундаментальными компонентами в различных задачах КВ, включая обнаружение объектов, отслеживание объектов, аннотирование изображений, и составляют краеугольный камень многих современных систем искусственного интеллекта (AI) и машинного обучения (ML). Они необходимы для того, чтобы машины могли понять не только , какие объекты присутствуют, но и где они расположены в визуальной сцене.
Важность в обнаружении объектов
Граничные коробки очень важны как для обучения, так и для оценки моделей обнаружения объектов. В задачах, решаемых такими моделями, как Ultralytics YOLOограничительные рамки служат "базовой истиной" в процессе обучения. Это значит, что они представляют правильное расположение и размер объектов в обучающих данных, обучая модель точному определению местоположения объектов. Этот процесс часто начинается с тщательного аннотирования данных, когда люди или автоматизированные инструменты рисуют эти рамки вокруг объектов на изображениях, часто используя платформы вроде CVAT или интегрируясь с платформами вроде Ultralytics HUB для управления набором данных. Во время выводов обученная модель предсказывает ограничительные рамки вокруг обнаруженных объектов, а также метки классов и баллы доверия. Такая способность к локализации жизненно важна для приложений, требующих не просто идентификации объектов, но и определения их точного местоположения.
Основные понятия, связанные с ограничительными рамками
Несколько метрик и техник тесно связаны с использованием и оценкой ограничительных коробок в ML-моделях:
- Пересечение через союз (IoU): Метрика, используемая для измерения перекрытия между предсказанным ограничительным блоком и истинным ограничительным блоком. Она оценивает точность локализации.
- Немаксимальное подавление (НМС): Техника постобработки, используемая для устранения избыточных, перекрывающих друг друга ограничительных боксов для одного и того же объекта, сохраняя только наиболее уверенное предсказание.
- Средняя точность (mAP): Стандартная метрика для оценки производительности моделей обнаружения объектов, учитывающая как точность классификации, так и точность локализации (часто на основе порога IoU). Смотри подробные метрики производительностиYOLO .
- Якорные коробки: Предопределенные боксы различных размеров и соотношения сторон, используемые в некоторых детекторах (например, в старых версиях YOLO ) для более эффективного предсказания ограничивающих боксов. Более новые модели, включая YOLO11часто обходятся без якорей, что упрощает работу детектора.
- Набор данных COCO: Крупномасштабный набор данных для обнаружения, сегментации и создания надписей, широко используемый для бенчмаркинга моделей обнаружения объектов. Ultralytics обеспечивает легкий доступ к COCO и другим наборам данных обнаружения.
Ограничительные рамки против смежных терминов
В то время как стандартные (выровненные по оси) ограничительные рамки определяют местоположение объектов с помощью простых прямоугольников, другие техники компьютерного зрения предлагают разные уровни детализации или работают с разными сценариями:
- Сегментация изображений: Присваивает каждому пикселю изображения метку класса. В отличие от ограничительных рамок, которые обеспечивают грубую локализацию, сегментация обеспечивает мелкозернистую локализацию.
- Семантическая сегментация: Присваивает каждому пикселю категорию (например, "автомобиль", "дорога", "небо"), но не различает разные экземпляры одного и того же класса объектов.
- Сегментация экземпляра: Идет на шаг дальше семантической сегментации, определяя отдельные экземпляры объектов в каждой категории на уровне пикселей. Модели Ultralytics YOLO поддерживают задачи сегментации экземпляров.
- Ориентированные граничные коробки (OBB): Повернутые прямоугольники, используемые для более плотного окружения объектов, которые не выровнены по осям изображения, часто встречаются в аэрофотосъемке(набор данных DOTA) или при обнаружении текста. Ultralytics YOLO11 поддерживает обнаружение OBB.
Применение в реальных сценариях
Граничные коробки являются неотъемлемой частью многочисленных практических приложений ИИ:
- Автономные транспортные средства: Самоуправляемые автомобили в значительной степени полагаются на распознавание объектов, чтобы идентифицировать и определять местоположение пешеходов, других транспортных средств, светофоров и препятствий с помощью ограничительных блоков. Такая пространственная осведомленность, часто достигаемая с помощью моделей глубокого обучения, очень важна для безопасной навигации и принятия решений. Такие компании, как Waymo, широко демонстрируют эту технологию. Ultralytics предлагает взглянуть на ИИ в самоуправляемых автомобилях.
- Аналитика в розничной торговле: В розничной торговле bounding boxes помогают в управлении запасами на основе ИИ, обнаруживая товары на полках, отслеживая уровень запасов и анализируя поведение покупателей через взаимодействие с полками или схемы пешеходного движения(подсчет объектов).
- Безопасность и наблюдение: Границы позволяют автоматизированным системам наблюдения обнаруживать и отслеживать людей или объекты, представляющие интерес, в режиме реального времени, подавая сигналы о несанкционированном доступе или подозрительных действиях. Это очень важно для таких приложений, как системы охранной сигнализации.
- Анализ медицинских изображений: В здравоохранении ограничительные рамки помогают рентгенологам и врачам, выделяя на снимках (рентгеновских, компьютерных, магнитно-резонансных) потенциальные аномалии вроде опухолей или повреждений, что помогает быстрее и точнее поставить диагноз. Смотри примеры в разделе "Радиология": Artificial Intelligence и обзор Ultralytics по анализу медицинских изображений.
- Сельское хозяйство: Bounding boxes используются в точном сельском хозяйстве для таких задач, как идентификация фруктов для сбора(обнаружение фруктов), мониторинг состояния урожая или обнаружение вредителей.