Глоссарий

Граничная коробка

Узнай, как ограничивающие рамки позволяют использовать системы обнаружения объектов, искусственного интеллекта и машинного обучения. Изучи их роль в приложениях компьютерного зрения!

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Ограничительная рамка - это прямоугольная рамка, используемая в компьютерном зрении (КВЗ) для указания местоположения и протяженности объекта в кадре изображения или видео. Эти рамки обычно определяются координатами их левого верхнего и правого нижнего углов, обеспечивая простой, но эффективный способ указать, где находится объект и сколько места он занимает. Граничные коробки являются фундаментальными компонентами в различных задачах CV, включая обнаружение объектов, отслеживание объектов и аннотирование изображений, и составляют краеугольный камень многих современных систем искусственного интеллекта (AI) и машинного обучения (ML).

Важность в обнаружении объектов

Граничные коробки очень важны для обучения и оценки моделей обнаружения объектов. В задачах, решаемых такими моделями, как Ultralytics YOLOограничительные рамки служат в качестве базовой истины во время обучения, обучая модель точному определению местоположения объектов. Во время вывода модель предсказывает границы вокруг обнаруженных объектов. Такая способность к локализации очень важна для приложений, требующих не только идентификации объектов, но и их точного местоположения, например в автономных транспортных средствах или роботизированных системах. Процесс часто начинается с тщательного аннотирования данных, когда человек или автоматизированные инструменты рисуют ограничительные рамки вокруг объектов на обучающих изображениях, часто используя такие инструменты, как CVAT.

Основные понятия, связанные с ограничительными рамками

Несколько метрик и техник тесно связаны с использованием и оценкой ограничительных коробок в ML-моделях:

  • Intersection over Union (IoU): Метрика, используемая для измерения перекрытия между предсказанным ограничительным блоком и истинным ограничительным блоком.
  • Немаксимальное подавление (NMS): техника, используемая для устранения избыточных ограничительных боксов, обнаруживающих один и тот же объект, сохраняя только тот, который имеет наивысший балл доверия.
  • Средняя точность (mAP): Распространенная метрика для оценки эффективности моделей обнаружения объектов, в значительной степени опирающаяся на расчеты IoU.
  • Якорные коробки: Предопределенные коробки различных размеров и соотношения сторон, используемые некоторыми детекторами, чтобы помочь более эффективно предсказывать ограничивающие коробки. Эталонные наборы данных, такие как COCO, часто используются для оценки моделей, основанных на этих концепциях.

Ограничительные рамки против смежных терминов

В то время как ограничительные рамки определяют местоположение объектов с помощью прямоугольников, другие техники компьютерного зрения предлагают различные уровни детализации:

  • Сегментация изображений: В отличие от ограничительных коробок, которые обеспечивают прямоугольную локализацию, сегментация изображения Цель - классифицировать каждый пиксель на изображении.
  • Ориентированные ограничительные рамки (Oriented Bounding Boxes, OBB): Стандартные ограничительные рамки выровнены по оси. Для объектов, которые вращаются, ориентированные ограничительные рамки (OBB) обеспечивают более плотное прилегание за счет вращения рамки вместе с объектом. Это особенно полезно в таких приложениях, как анализ аэрофотоснимков или обнаружение объектов в загроможденных сценах, что часто оценивается на таких наборах данных, как DOTA.

Применение в реальных сценариях

Граничные коробки являются неотъемлемой частью многочисленных практических приложений ИИ:

Автономные транспортные средства

При разработке искусственного интеллекта в самодвижущихся автомобилях ограничительные рамки имеют решающее значение для обнаружения и отслеживания пешеходов, велосипедистов, других транспортных средств и дорожных препятствий. Точное обнаружение объектов в реальном времени с помощью ограничительных блоков позволяет системе автомобиля принимать обоснованные решения для безопасной навигации и предотвращения столкновений, соблюдая рекомендации по безопасности, разработанные такими организациями, как Национальная администрация безопасности дорожного движения (NHTSA). Узнай больше о роли ИИ в создании самоуправляемых автомобилей.

Управление запасами в розничной торговле

Ритейлеры используют обнаружение объектов с ограничивающими рамками для автоматического контроля полок и управления запасами. Камеры, оснащенные моделями искусственного интеллекта, могут обнаруживать продукты, подсчитывать уровень запасов, выявлять неправильно расставленные предметы и отслеживать взаимодействие покупателей с товарами. Это повышает эффективность, сокращает ручные усилия и предоставляет ценные данные для оптимизации планировки магазина и пополнения запасов. Анализ таких тенденций в области розничных технологий подчеркивает растущую важность искусственного интеллекта в этом секторе. Ты можешь найти различные решенияUltralytics для разных отраслей.

Читать полностью