Cheque verde
Enlace copiado en el portapapeles

¿Cómo calcular la distancia utilizando modelos de visión artificial?

Descubre cómo el cálculo de distancias en aplicaciones de visión por ordenador mediante Ultralytics YOLO11 ayuda a medir la proximidad de los objetos en tiempo real.

Cuando estás cruzando la carretera y ves que un coche se acerca a ti, puedes saber al instante aproximadamente a qué distancia está. Este juicio rápido, casi instintivo, se debe a una comprensión espacial de tu entorno. Basándote en este sentido, puedes decidir si aceleras, te detienes o sigues andando. 

Del mismo modo, la visión por ordenador es una rama de la inteligencia artificial (IA) que hace posible que las máquinas desarrollen una comprensión de su entorno mediante la interpretación de datos visuales. Al igual que puedes evaluar la proximidad de un coche para tomar decisiones rápidas, los modelos de visión por ordenador pueden analizar imágenes y vídeos, ayudando a las máquinas a percibir el mundo que las rodea y reaccionar ante él.

Por ejemplo Ultralytics YOLO11 es un modelo de visión por ordenador que puede detectar y rastrear objetos en imágenes y vídeos en tiempo real. En pocas palabras, YOLO11 funciona mirando toda la imagen a la vez, en lugar de por partes, lo que lo hace más rápido y eficaz. También puede realizar tareas de visión por ordenador como la segmentación de instancias, la estimación de poses y la clasificación de imágenes.

En concreto, las capacidades de YOLO11 pueden utilizarse para calcular la distancia que separa unos objetos de otros, lo que resulta útil en muchos ámbitos como la fabricación, el comercio minorista y la gestión de multitudes, ayudando a mejorar la seguridad y la eficacia.

En este artículo exploraremos cómo puede utilizarse YOLO11 para el cálculo de distancias en aplicaciones de visión por ordenador, por qué es importante y su repercusión en distintos sectores.

Fig. 1. Ejemplo de utilización de YOLO para calcular la distancia de aterrizaje de un avión.

Una visión general del cálculo de distancias en visión por ordenador

El cálculo de distancias en visión por ordenador consiste en detectar, localizar y medir los píxeles que hay entre dos objetos de una imagen. Los píxeles son las unidades individuales que componen una imagen digital, cada una de las cuales representa un único punto con un color o un valor de intensidad específicos. 

Para convertir las medidas de los píxeles en distancias del mundo real, la calibración es clave. Puedes pensar en ello como si utilizaras una regla para medir algo y luego usaras esa medida para comprender el tamaño de otros objetos. Al hacer referencia a objetos con tamaños conocidos, la calibración crea un vínculo entre los píxeles y las distancias físicas reales.

Veamos un ejemplo para ver cómo funciona. En la imagen de abajo, la moneda es el objeto de referencia, y se conoce su tamaño (0,9 por 1,0 pulgada). Comparando las medidas en píxeles de los demás objetos con el tamaño de la moneda, podemos calcular su tamaño en el mundo real.

Fig. 2. Una moneda puede utilizarse como referencia para medir el tamaño real de otros objetos.

Sin embargo, el cálculo de la distancia se realiza en un plano bidimensional (2D), lo que significa que sólo mide las distancias horizontal y vertical entre los objetos. Esto es diferente de la estimación de la profundidad, que mide la distancia de los objetos en el espacio tridimensional, incluida su distancia a la cámara.

Aunque las cámaras de profundidad pueden medir la profundidad real y proporcionar información espacial más detallada, en muchos casos basta con una simple distancia calibrada. Por ejemplo, saber a qué distancia están los objetos en un plano 2D funciona bien para tareas como el seguimiento de objetos o la gestión de colas, por lo que la estimación de la profundidad no es necesaria en esas situaciones.

Comprender cómo funciona el cálculo de distancias con YOLO11

A continuación, vamos a ver cómo calcular la distancia entre dos objetos utilizando el soporte de YOLO11para la detección y seguimiento de objetos. He aquí un desglose:

  • Detección y seguimiento de objetos: YOLO11 puede utilizarse para detectar objetos, reconociéndolos en un fotograma y siguiendo su movimiento a través de los fotogramas de un vídeo. Asigna un ID de seguimiento único a cada objeto, lo que permite al sistema controlar su posición y movimiento a lo largo del vídeo.
  • Cuadros delimitadores: Se dibujan cuadros delimitadores alrededor de los objetos detectados basándose en los resultados de detección de objetos de YOLO11, que definen su ubicación en la imagen.
  • Seleccionar objetos: Se pueden seleccionar dos objetos para enfocarlos, y YOLO11 actualiza los cuadros delimitadores a medida que los objetos se mueven en tiempo real.
  • Cálculo de centroides: Los centroides (los puntos centrales de las cajas delimitadoras de los dos objetos) se calculan a partir de las coordenadas de las esquinas de las cajas delimitadoras, que representan las posiciones de los objetos.
  • Cálculo de la distancia: Los centroides de los dos objetos pueden utilizarse para calcular la distancia euclídea entre ellos. La distancia euclídea es la distancia en línea recta entre dos puntos en un plano 2D, calculada utilizando las diferencias en las direcciones horizontal y vertical. Esto proporciona la distancia entre los dos objetos en píxeles.

Es importante tener en cuenta que las distancias calculadas con este método son sólo estimaciones, ya que se basan en mediciones de píxeles en 2D.

Fig. 3. Uso de Ultralytics YOLO para detectar a una persona y calcular distancias. 

El impacto de la estimación de la distancia YOLO

Teniendo en cuenta que el cálculo de distancias mediante YOLO11 es una estimación, te estarás preguntando: ¿Dónde puede utilizarse y cómo puede marcar la diferencia? 

Dado que se utilizan calibraciones para llegar a estas estimaciones de distancia, son lo suficientemente precisas como para ayudar en muchas situaciones prácticas. La estimación de distancias de YOLO11es especialmente útil en entornos dinámicos, como los almacenes, donde los objetos están en constante movimiento y es necesario realizar ajustes en tiempo real para que todo funcione correctamente.

Un ejemplo interesante es el uso de YOLO11 para rastrear paquetes en una cinta transportadora y estimar la distancia entre ellos en tiempo real. Esto ayuda a los jefes de almacén a asegurarse de que los paquetes están espaciados correctamente, evitando colisiones y manteniendo las cosas funcionando sin problemas. 

En estos casos, no siempre es necesaria una distancia exacta. Normalmente, se establece un rango o umbral para la distancia óptima, por lo que una estimación funciona bien para este tipo de aplicaciones.

Fig. 4. Detección de paquetes mediante YOLO11 y cálculo de la distancia entre ellos.

Cálculo de distancias en aplicaciones de visión artificial

Varias aplicaciones de visión por ordenador pueden beneficiarse del cálculo de la distancia entre objetos mediante YOLO11. En el análisis del comercio minorista, por ejemplo, ayuda a mejorar la gestión de colas mediante el seguimiento de las posiciones de los clientes en tiempo real. Esto permite a las empresas asignar mejor los recursos, reducir los tiempos de espera y crear una experiencia de compra más fluida. Ajustando dinámicamente los niveles de personal y gestionando el flujo de clientes, las tiendas pueden evitar el hacinamiento y optimizar el uso del espacio.

Del mismo modo, en la gestión del tráfico, la estimación de la distancia ayuda a controlar el espaciado entre vehículos y analizar los patrones de tráfico. Esto puede utilizarse para detectar comportamientos peligrosos, como ir a rebufo, y ajustar los semáforos para que el tráfico fluya sin problemas. Puede ayudar a que las carreteras sean más seguras, identificando posibles problemas y mejorando la gestión general del tráfico en tiempo real.

Fig. 5. El cálculo de distancias mediante visión puede utilizarse para controlar el tráfico.

Otro uso único de esta tecnología se produjo durante la pandemia de COVID-19, cuando ayudó a promover el distanciamiento social. Se aseguró de que la gente mantuviera una distancia segura en espacios públicos, tiendas y hospitales, reduciendo el riesgo de propagación del virus. 

Mediante el seguimiento de las distancias en tiempo real, se podrían enviar alertas cuando las personas estuvieran demasiado cerca, lo que facilitaría que las empresas y los proveedores de asistencia sanitaria respondieran rápidamente y mantuvieran un entorno más seguro para todos.

Pros y contras del cálculo de distancias en visión por ordenador

Ahora que ya hemos hablado de algunas de las aplicaciones del cálculo de distancias mediante visión por ordenador, veamos más de cerca las ventajas que conlleva hacerlo:

  • Automatización: Vision AI puede automatizar las tareas de cálculo de distancias que de otro modo requerirían un seguimiento manual, reduciendo los errores humanos y los costes de mano de obra al tiempo que aumenta la productividad.
  • Optimización de recursos: Al conocer el espaciado aproximado y la proximidad de los objetos, se pueden optimizar los recursos (como el personal o la maquinaria), reduciendo el despilfarro y mejorando los flujos de trabajo.
  • Mínima complejidad de configuración: Una vez configurados, los sistemas de cálculo de distancias por visión requieren relativamente poco mantenimiento y menos intervención humana que otros sistemas basados en la introducción manual de datos o en maquinaria compleja.

A pesar de estas ventajas, también hay que tener en cuenta algunas limitaciones a la hora de implantar estos sistemas. He aquí un rápido vistazo a los factores clave que hay que tener en cuenta cuando se trata de calcular distancias mediante visión por ordenador:

  • Sensibilidad a los factores ambientales: La precisión del cálculo de la distancia puede verse afectada por las condiciones de iluminación, las sombras, los reflejos o los obstáculos, lo que puede dar lugar a errores o incoherencias.
  • Privacidad: El uso de la visión por ordenador para rastrear objetos o personas puede plantear problemas de privacidad, especialmente en espacios públicos o entornos sensibles en los que puedan estar implicados datos personales.
  • Complejidad en escenarios multiobjeto: En entornos con numerosos objetos en movimiento, calcular con precisión las distancias entre varios objetos simultáneamente puede llevar a confusión, sobre todo si están próximos o se cruzan.

Puntos clave

Calcular la distancia entre objetos con YOLO11 es una solución fiable que puede ayudar en la toma de decisiones. Es especialmente útil en entornos dinámicos como almacenes, comercios y gestión del tráfico, donde mantener un registro de la proximidad de los objetos puede mejorar la eficacia y la seguridad. 

YOLO11 permite automatizar tareas que normalmente requerirían un esfuerzo manual. Aunque existen algunos retos, como la sensibilidad a los factores ambientales y la preocupación por la privacidad, las ventajas, como la automatización, la escalabilidad y la fácil integración, lo hacen impactante. A medida que la visión por ordenador siga mejorando, especialmente en áreas como el cálculo de distancias, es probable que veamos un verdadero cambio en la forma en que las máquinas interactúan con su entorno y lo comprenden.

Únete a nuestra comunidad Explora nuestro repositorio GitHub para saber más sobre Vision AI. Si estás interesado en aprovechar la visión por ordenador, consulta nuestras opciones de licencia. Descubre cómo la visión por ordenador mejora la eficiencia en la sanidad y el impacto de la IA en la agricultura visitando nuestras páginas de soluciones. 

Logotipo de FacebookLogotipo de TwitterLogotipo de LinkedInSímbolo de enlace de copia

Leer más en esta categoría

¡Construyamos juntos el futuro
de la IA!

Comienza tu viaje con el futuro del aprendizaje automático