Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Отслеживание объектов

Узнайте, как работает отслеживание объектов в компьютерном зрении. Узнайте, как использовать Ultralytics для идентификации и мониторинга объектов с уникальными идентификаторами для анализа в реальном времени.

Отслеживание объектов — это динамический процесс в компьютерном зрении (CV), который включает в себя идентификацию определенных объектов в видео и отслеживание их движения по последовательности кадров. В отличие от статического анализа изображений, который рассматривает каждый снимок отдельно, отслеживание вводит временное измерение. Это позволяет системам искусственного интеллекта (ИИ) присваивать уникальный идентификационный номер (ID) каждому обнаруженному объекту, например автомобилю, человеку или животному, и сохранять эту идентичность, когда объект движется, меняет ориентацию или временно скрывается из виду. Эта способность является краеугольным камнем передового понимания видео, позволяя машинам анализировать поведение, рассчитывать траектории и извлекать полезную информацию из необработанных видеоматериалов.

Как работает отслеживание объектов

Современные системы отслеживания обычно используют парадигму «отслеживание по обнаружению». Этот рабочий процесс сочетает в себе мощные модели обнаружения со специализированными алгоритмами для сопоставления обнаружений во времени. Процесс обычно проходит в три основных этапа:

  1. Обнаружение: в каждом кадре модель обнаружения объектов, такая как современная YOLO26, сканирует изображение, чтобы найти интересующие объекты . Модель выдает ограничительные рамки, которые определяют пространственный объем каждого объекта.
  2. Прогнозирование движения: алгоритмы, такие как фильтр Калмана, оценивают будущее положение объекта на основе его текущей скорости и траектории. Этот прогноз сокращает пространство поиска для следующего кадра, делая систему более эффективной.
  3. Связывание данных: система сопоставляет новые обнаружения с существующими треками, используя методы оптимизации, такие как алгоритм Унгари. Этот шаг часто опирается на такие метрики, как Intersection over Union (IoU), чтобы измерить, насколько предсказанная область пересекается с новым обнаружением. Продвинутые трекеры могут также использовать визуальную экстракцию признаков для повторной идентификации объектов, которые выглядят похожими.

Отслеживание объектов в сравнении с обнаружением объектов

Хотя эти термины тесно связаны между собой, они выполняют разные функции в конвейере машинного обучения (ML).

  • Обнаружение объектов отвечает на вопрос: «Что присутствует на этом изображении и где?» Оно бесстатусное, то есть не имеет памяти о предыдущих кадрах. Если автомобиль проезжает через видео, детектор видит «автомобиль» в кадре 1 и «автомобиль» в кадре 2, но не знает, что это один и тот же автомобиль.
  • Отслеживание объектов отвечает на вопрос: «Куда движется этот конкретный объект?». Оно является состоятельным. Оно связывает «автомобиль» в кадре 1 с «автомобилем» в кадре 2, позволяя системе зарегистрировать, что «автомобиль с идентификационным номером 42» движется слева направо. Это необходимо для таких задач, как прогнозное моделирование и подсчет.

Применение в реальном мире

Способность сохранять идентичность объектов позволяет создавать сложные приложения для вывода в реальном времени в различных отраслях.

  • Интеллектуальные транспортные системы: отслеживание имеет жизненно важное значение для безопасного движения автономных транспортных средств. Отслеживая пешеходов и другие транспортные средства, автомобили могут предсказывать потенциальные столкновения. Кроме того, инженеры-транспортники используют эти системы для оценки скорости, чтобы обеспечить соблюдение правил безопасности и оптимизировать транспортный поток.
  • Аналитика розничной торговли: Традиционные магазины используют ИИ в розничной торговле для понимания поведения покупателей. Отслеживание позволяет менеджерам магазинов выполнять подсчет объектов для измерения посещаемости, анализировать время пребывания перед витринами с помощью тепловых карт и оптимизировать управление очередями для сокращения времени ожидания.
  • Спортивный анализ: в профессиональном спорте тренеры используют отслеживание в сочетании с оценкой положения тела для анализа биомеханики игроков и формаций команд. Эти данные обеспечивают конкурентное преимущество, раскрывая закономерности, которые не видны невооруженным глазом.

Реализация трекинга с помощью Python

Ultralytics внедрение высокопроизводительного отслеживания. track режим в библиотеке автоматически обрабатывает обнаружение, прогнозирование движения и присвоение идентификаторов. В примере ниже показано, как использовать Платформа Ultralytics совместимую модель YOLO26 для track в видео.

from ultralytics import YOLO

# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)

# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
    print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")

Связанные понятия

Чтобы полностью понять экосистему отслеживания, полезно изучить сегментацию экземпляров, которая отслеживает точные контуры объекта на уровне пикселей, а не просто прямоугольник. Кроме того, задачи многообъектного отслеживания (MOT) часто включают широко используемые тесты, такие как MOTChallenge, для оценки того, насколько хорошо алгоритмы обрабатывают перегруженные сцены и окклюзии. Для развертывания в производственных средах разработчики часто используют такие инструменты, как NVIDIA или OpenCV для интеграции этих моделей в эффективные конвейеры.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас