Зелёная проверка
Ссылка копируется в буфер обмена

Как рассчитать расстояние с помощью моделей компьютерного зрения?

Узнай, как расчет расстояния в приложениях компьютерного зрения с помощью Ultralytics YOLO11 помогает измерять близость объектов в режиме реального времени.

Когда ты переходишь дорогу и видишь приближающуюся к тебе машину, ты можешь мгновенно определить, на каком примерно расстоянии она находится. Такое быстрое, почти инстинктивное суждение происходит благодаря пространственному пониманию твоего окружения. Основываясь на этом чувстве, ты можешь решить, стоит ли ускориться, остановиться или продолжать идти. 

Аналогично, компьютерное зрение - это ветвь искусственного интеллекта (ИИ), которая позволяет машинам развивать понимание окружающей обстановки, интерпретируя визуальные данные. Подобно тому, как ты можешь оценить близость автомобиля, чтобы быстро принимать решения, модели компьютерного зрения могут анализировать изображения и видео, помогая машинам чувствовать и реагировать на окружающий их мир.

Например, Ultralytics YOLO11 это модель компьютерного зрения, которая позволяет обнаруживать и отслеживать объекты на изображениях и видео в режиме реального времени. Проще говоря, YOLO11 работает, рассматривая все изображение сразу, а не по частям, что делает ее быстрее и эффективнее. Она также может решать такие задачи компьютерного зрения, как сегментация объектов, оценка позы и классификация изображений.

В частности, возможности YOLO11 можно использовать для вычисления расстояния между объектами, что полезно во многих сферах, таких как производство, розничная торговля и управление толпой, помогая повысить безопасность и эффективность.

В этой статье мы рассмотрим, как YOLO11 можно использовать для расчета расстояний в приложениях компьютерного зрения, почему это важно и какое влияние он оказывает в различных отраслях.

Рис. 1. Пример использования YOLO для расчета посадочной дистанции самолета.

Обзор вычисления расстояний в компьютерном зрении

Расчет расстояния в компьютерном зрении включает в себя обнаружение, определение местоположения и измерение пикселей между двумя объектами на изображении. Пиксели - это отдельные единицы, составляющие цифровое изображение, каждая из которых представляет собой одну точку с определенным цветом или значением интенсивности. 

Чтобы преобразовать пиксельные измерения в реальные расстояния, ключевую роль играет калибровка. Ты можешь представить это как использование линейки для измерения чего-либо, а затем использование этого измерения для понимания размеров других объектов. Ссылаясь на объекты с известными размерами, калибровка создает связь между пикселями и реальными физическими расстояниями.

Давай рассмотрим пример, чтобы понять, как это работает. На изображении ниже монета является эталонным объектом, и ее размер (0,9 дюйма на 1,0 дюйма) известен. Сравнив пиксельные измерения других объектов с размером монеты, мы можем вычислить их реальный размер.

Рис 2. Монету можно использовать в качестве эталона для измерения реальных размеров других предметов.

Однако расчет расстояния производится в двухмерной (2D) плоскости, то есть измеряет только горизонтальные и вертикальные расстояния между объектами. Это отличается от оценки глубины, которая измеряет расстояние между объектами в трехмерном пространстве, включая их удаленность от камеры.

Хотя камеры глубины могут измерять истинную глубину и давать более подробную пространственную информацию, во многих случаях достаточно простого калиброванного расстояния. Например, знание того, как далеко друг от друга находятся объекты в двухмерной плоскости, отлично подходит для таких задач, как отслеживание объектов или управление очередями, поэтому оценка глубины в таких ситуациях не нужна.

Понимание того, как работает расчет расстояния с помощью YOLO11

Далее рассмотрим, как рассчитать расстояние между двумя объектами, используя поддержку обнаружения и отслеживания объектов в YOLO11. Вот краткое описание:

  • Обнаружение и отслеживание объектов: YOLO11 можно использовать для обнаружения объектов, распознавая их в кадре и отслеживая их перемещение по кадрам видео. Он присваивает каждому объекту уникальный идентификатор трека, что позволяет системе отслеживать его положение и перемещение по всему видео.
  • Ограничительные рамки: На основе результатов обнаружения объектов в YOLO11вокруг них рисуются ограничительные рамки, которые определяют их местоположение на изображении.
  • Выбор объектов: Можно выбрать два объекта для фокусировки, и YOLO11 будет обновлять ограничительные рамки по мере перемещения объектов в реальном времени.
  • Вычисление центроида: Центроиды (центральные точки ограничительных блоков двух объектов) вычисляются на основе координат углов ограничительных блоков, представляющих положение объектов.
  • Вычисление расстояния: Затем центроиды двух объектов можно использовать для вычисления евклидова расстояния между ними. Евклидово расстояние - это прямолинейное расстояние между двумя точками в двумерной плоскости, вычисляемое по разности горизонтального и вертикального направлений. Это позволяет получить расстояние между двумя объектами в пикселях.

Важно помнить, что расстояния, рассчитанные с помощью этого метода, являются лишь приблизительными, так как они основаны на двухмерных измерениях пикселей.

Рис. 3. Использование Ultralytics YOLO для обнаружения человека и вычисления расстояния. 

Влияние оценки расстояния YOLO

Учитывая, что расчет расстояний с помощью YOLO11 является приблизительным, тебе может быть интересно: Где это можно использовать и как это может изменить ситуацию? 

Поскольку для получения этих оценок расстояния используются калибровки, они достаточно точны, чтобы помочь во многих практических ситуациях. Оценка расстояния YOLO11особенно полезна в динамичных средах, например на складах, где объекты постоянно находятся в движении и для поддержания нормальной работы необходимы корректировки в реальном времени.

Интересный пример - использование YOLO11 для отслеживания упаковок на конвейере и оценки расстояния между ними в режиме реального времени. Это помогает менеджерам склада следить за тем, чтобы упаковки были расставлены правильно, предотвращая столкновения и обеспечивая бесперебойную работу. 

В таких случаях точное расстояние не всегда необходимо. Как правило, задается диапазон или порог оптимального расстояния, поэтому приблизительное значение хорошо работает для таких типов приложений.

Рис. 4. Обнаружение пакетов с помощью YOLO11 и вычисление расстояния между ними.

Вычисление расстояний в приложениях для компьютерного зрения

Различные приложения компьютерного зрения могут извлечь пользу из вычисления расстояния между объектами с помощью YOLO11. Например, в аналитике розничной торговли он помогает улучшить управление очередями, отслеживая положение покупателей в реальном времени. Это позволяет предприятиям лучше распределять ресурсы, сокращать время ожидания и создавать более плавный процесс покупки. Динамически регулируя численность персонала и управляя потоком покупателей, магазины могут предотвратить переполненность и оптимизировать использование пространства.

Аналогично, в управлении дорожным движением оценка расстояния помогает следить за интервалом между автомобилями и анализировать схему движения. Это можно использовать для выявления опасных форм поведения, таких как движение в хвосте, и корректировки сигналов светофора, чтобы движение было беспрепятственным. Это может помочь сделать дороги более безопасными, выявляя потенциальные проблемы и улучшая общую организацию движения в реальном времени.

Рис 5. Расчет расстояния с помощью зрения можно использовать для мониторинга дорожного движения.

Еще одно уникальное применение этой технологии произошло во время пандемии COVID-19, когда она помогла способствовать социальной дистанцированности. Она следила за тем, чтобы люди держались на безопасном расстоянии в общественных местах, магазинах и больницах, снижая риск распространения вируса. 

Отслеживая расстояния в реальном времени, можно отправлять предупреждения о том, что люди находятся слишком близко, что облегчает предприятиям и медицинским учреждениям быстрое реагирование и поддерживает более безопасную обстановку для всех.

Плюсы и минусы расчета расстояния в компьютерном зрении

Теперь, когда мы обсудили некоторые варианты применения расчета расстояния с помощью компьютерного зрения, давай подробнее рассмотрим связанные с этим преимущества:

  • Автоматизация: Vision AI может автоматизировать задачи по вычислению расстояния, которые в противном случае требовали бы ручного отслеживания, сокращая человеческие ошибки и трудозатраты, повышая производительность.
  • Оптимизация ресурсов: Зная примерное расстояние между объектами и их близость, можно оптимизировать ресурсы (например, персонал или технику), снижая потери и улучшая рабочие процессы.
  • Минимальная сложность настройки: После настройки системы расчета расстояния с помощью зрения не требуют особого обслуживания и вмешательства человека по сравнению с другими системами, которые зависят от ручного ввода или сложных механизмов.

Несмотря на эти преимущества, существуют и некоторые ограничения, о которых следует помнить при внедрении подобных систем. Вот краткий обзор ключевых факторов, которые нужно учитывать, когда речь идет о расчете расстояния с помощью компьютерного зрения:

  • Чувствительность к факторам окружающей среды: На точность расчета расстояния могут повлиять условия освещения, тени, отражения или препятствия, что приведет к потенциальным ошибкам или несоответствиям.
  • Проблемы конфиденциальности: Использование компьютерного зрения для отслеживания объектов или людей может вызвать проблемы с конфиденциальностью, особенно в общественных местах или чувствительных средах, где могут быть задействованы личные данные.
  • Сложность в многообъектных сценариях: В среде с множеством движущихся объектов точное вычисление расстояний между несколькими объектами одновременно может привести к путанице, особенно если они находятся близко друг к другу или пересекаются.

Основные выводы

Вычисление расстояния между объектами с помощью YOLO11 - это надежное решение, которое может помочь в принятии решений. Оно особенно полезно в динамичных средах, таких как склады, розничная торговля и управление дорожным движением, где отслеживание близости объектов может повысить эффективность и безопасность. 

YOLO11 позволяет автоматизировать задачи, которые обычно требуют ручных усилий. Несмотря на некоторые сложности, такие как чувствительность к факторам окружающей среды и проблемы с конфиденциальностью, преимущества, такие как автоматизация, масштабируемость и легкая интеграция, делают его впечатляющим. Поскольку компьютерное зрение продолжает совершенствоваться, особенно в таких областях, как расчет расстояния, вполне вероятно, что мы увидим реальный сдвиг в том, как машины взаимодействуют с окружающей средой и понимают ее.

Присоединяйся к нашему сообществу! Изучи наш репозиторий на GitHub, чтобы узнать больше о Vision AI. Если ты заинтересован в использовании компьютерного зрения, ознакомься с нашими вариантами лицензирования. Узнай, как компьютерное зрение в здравоохранении повышает эффективность, и посмотри на влияние ИИ в сельском хозяйстве, посетив страницы наших решений! 

Логотип FacebookЛоготип ТвиттераЛоготип LinkedInСимвол копирования-ссылки

Читайте больше в этой категории

Давай вместе построим будущее
искусственного интеллекта!

Начни свое путешествие с будущим машинного обучения