Cheque verde
Enlace copiado en el portapapeles

Cómo utilizar Ultralytics YOLO11 para la detección de objetos OBB

Comprende cómo Ultralytics YOLO11 puede mejorar la detección de objetos mediante cajas delimitadoras orientadas (OBB) y para qué aplicaciones es ideal esta tarea de visión por ordenador.

UltralyticsYOLO Vision 2024 (YV24), centrado en debatir los últimos avances en IA y visión por ordenador. Fue la ocasión perfecta para presentar nuestro nuevo modelo , Ultralytics YOLO11. El modelo admite las mismas tareas de visión por ordenador que Ultralytics YOLOv8, haciendo que el cambio al nuevo modelo no suponga ningún esfuerzo para los usuarios.

Supongamos que utilizabas YOLOv8 para la detección de objetos mediante cajas delimitadoras orientadas (OBB ) desde varios ángulos. Ahora puedes cambiar a YOLO11 con unos pequeños cambios en tu código y beneficiarte de las mejoras deYOLO11, que van desde una mayor precisión y eficacia hasta la velocidad de procesamiento. En caso de que aún no hayas utilizado modelos como YOLO11, la detección de OBB es un gran ejemplo de cómo YOLO11 puede aplicarse a toda una serie de sectores, ofreciendo soluciones prácticas que tienen un impacto real.

En este artículo, veremos qué es la detección de objetos OBB, dónde puede aplicarse y cómo utilizar YOLO11 para detectar OBB. También veremos cómo las nuevas funciones de YOLO11 pueden mejorar estos procesos y cómo realizar inferencias y entrenar modelos personalizados para aprovechar al máximo sus capacidades de detección de OBB.

La próxima generación de funciones de YOLO11 incluye tareas como la detección de objetos OBB

La detección de objetos OBB lleva la detección de objetos tradicional un paso más allá, al detectar objetos en distintos ángulos. A diferencia de los cuadros delimitadores normales, que permanecen alineados con los ejes de la imagen, los OBB giran para adaptarse a la orientación del objeto. La detección de objetos OBB puede utilizarse para analizar imágenes aéreas o por satélite en las que los objetos no siempre están rectos. En sectores como la planificación urbana, la energía y el transporte, la capacidad de detectar con precisión objetos en ángulo, como edificios, vehículos o infraestructuras, puede constituir la base de aplicaciones de visión por ordenador con beneficios tangibles. 

Fig. 1. Comparación de las cajas delimitadoras normales y las cajas delimitadoras orientadas.

YOLO11 admite la detección de OBB y fue entrenado en el conjunto de datos DOTA v1. 0 para detectar objetos como aviones, barcos y tanques de almacenamiento desde diferentes perspectivas. YOLO11 se presenta en varias variaciones de modelo para adaptarse a diferentes necesidades, como YOLO11n-obb (Nano), YOLO11s-obb (Pequeño), YOLO11m-obb (Mediano), YOLO11l-obb (Grande) y YOLO11x-obb (Extra Grande). Cada modelo ofrece un tamaño diferente, con distintos niveles de velocidad, precisión y potencia de cálculo. Los usuarios pueden elegir el modelo que ofrezca el equilibrio adecuado de velocidad y precisión para su aplicación. 

YOLO11 Casos prácticos que introducen un nuevo ángulo de detección

YOLO11especialmente su compatibilidad con las cajas delimitadoras orientadas, aportan mayor precisión a diversos sectores. A continuación, veremos algunos ejemplos de cómo YOLO11 y la detección de OBB pueden utilizarse en situaciones reales para que los procesos sean más eficaces, precisos y fáciles de gestionar en distintos campos.

Planificación urbana y supervisión de infraestructuras con YOLO11

Si alguna vez has admirado el diseño y la disposición de una ciudad, es gracias al minucioso trabajo de planificación urbana y supervisión de infraestructuras. Uno de los muchos aspectos de la supervisión de infraestructuras es identificar y gestionar estructuras importantes como tanques de almacenamiento, tuberías y polígonos industriales. YOLO11 puede ayudar a los urbanistas a analizar imágenes aéreas para detectar estos componentes críticos con rapidez y precisión. 

La detección de objetos mediante cuadros delimitadores orientados es especialmente útil en este caso, porque permite detectar objetos vistos desde varios ángulos (lo que suele ocurrir con las imágenes aéreas). La precisión es vital aquí para hacer un seguimiento de las zonas industriales, gestionar el impacto medioambiental y garantizar el mantenimiento adecuado de las infraestructuras. El OBB hace que el proceso de detección sea más fiable, ayudando a los planificadores a tomar decisiones informadas sobre el crecimiento, la seguridad y la sostenibilidad de la ciudad. El uso de YOLO11, puede ayudar a los planificadores a controlar y gestionar la infraestructura que mantiene las ciudades funcionando sin problemas.

Fig. 2. Utilizando YOLO11 para detectar tanques de almacenamiento en imágenes aéreas.

Inspección de paneles solares con drones, YOLO11 y Edge AI

A medida que las energías renovables y las innovaciones como las huertas solares se hacen más populares, las inspecciones periódicas son cada vez más importantes. Hay que revisar los paneles solares para asegurarse de que funcionan eficazmente. Con el tiempo, cosas como las grietas, la acumulación de suciedad o la desalineación pueden reducir su rendimiento. Las inspecciones rutinarias ayudan a detectar estos problemas a tiempo, de modo que se pueda realizar el mantenimiento para que sigan funcionando sin problemas.

Por ejemplo, los paneles solares pueden inspeccionarse en busca de daños utilizando drones integrados con IA de borde y YOLO11. Analizar las imágenes en el borde aporta más precisión y eficacia al proceso de inspección. Debido al movimiento y la perspectiva del dron, las imágenes de vigilancia pueden captar a menudo paneles solares desde varios ángulos. En estos casos, la detección OBB de YOLO11puede ayudar a los drones a identificar con precisión los paneles solares. 

YOLO11 Puede proporcionar información para la gestión de flotas

Los puertos manejan cientos de barcos cada semana, y gestionar una flota tan grande puede ser todo un reto. Al analizar los barcos en imágenes aéreas se añade un elemento de dificultad: los barcos suelen aparecer en ángulos diferentes. Aquí es donde resulta útil la compatibilidad deYOLO11con la detección de OBB

La detección OBB hace posible que el modelo detecte barcos en varios ángulos con más precisión que las cajas rectangulares estándar. Utilizando YOLO11 con OBB, las empresas navieras pueden identificar más fácilmente la ubicación y el estado de su flota, haciendo un seguimiento de detalles importantes como los movimientos de la flota y la logística de la cadena de suministro. Estas soluciones de visión ayudan a optimizar las rutas, reducir los retrasos y mejorar la gestión general de la flota en las rutas marítimas.

Fig. 3. Utilizando YOLO11 para detectar barcos y puertos en ángulo.

YOLO11 para desarrolladores de IA: Detección de cajas delimitadoras orientadas

Si eres un desarrollador de IA que quiere utilizar YOLO11 para la detección de OBB, hay dos opciones fáciles para empezar. Si te sientes cómodo trabajando con código, el paqueteUltralytics Python es una gran elección. Si prefieres una solución fácil de usar, sin código y con capacidades de formación en la nube, Ultralytics HUB es una plataforma interna diseñada precisamente para eso. Para más detalles, puedes echar un vistazo a nuestra guía sobre formación e implantación de Ultralytics YOLO11 utilizando Ultralytics HUB.

Ahora que hemos visto ejemplos de cómo se puede aplicar el soporte OBB de YOLO11, exploremos el paquete Ultralytics Python y veamos cómo puedes realizar inferencias y entrenar modelos personalizados con él. 

Ejecutar inferencias utilizando YOLO11

En primer lugar, para utilizar YOLO11 con Python, tendrás que instalar el paquete Ultralytics . Dependiendo de tus preferencias, puedes elegir instalarlo mediante pip, conda o Docker. Para obtener instrucciones paso a paso, puedes consultar nuestra Guía de instalación deUltralytics . Si te encuentras con algún problema durante la instalación, nuestra Guía de Problemas Comunes te ofrece consejos útiles para solucionarlos.

Una vez que hayas instalado el paquete Ultralytics , trabajar con YOLO11 es increíblemente sencillo. Ejecutar una inferencia se refiere al proceso de utilizar un modelo entrenado para hacer predicciones sobre nuevas imágenes, como detectar objetos con OBB en tiempo real. Es diferente del entrenamiento del modelo, que es cuando enseñas al modelo a reconocer nuevos objetos o a mejorar su rendimiento en tareas específicas. La inferencia se utiliza cuando quieres aplicar el modelo a datos no vistos.

El siguiente ejemplo te muestra cómo cargar un modelo y utilizarlo para predecir cuadros delimitadores orientados en una imagen. Para ver ejemplos más detallados y consejos de uso avanzado, consulta la documentación oficial deUltralytics , donde encontrarás las mejores prácticas e instrucciones adicionales.

Fig. 4. Un fragmento de código que muestra la ejecución de inferencias mediante YOLO11.

Entrenar un modelo personalizado YOLO11

Entrenar un modelo YOLO11 significa que puedes afinar su rendimiento en conjuntos de datos y tareas específicas, como la detección de objetos orientada a cuadros delimitadores. Aunque los modelos preentrenados como YOLO11 pueden utilizarse para la detección general de objetos, entrenar un modelo personalizado es esencial cuando necesitas que el modelo detecte objetos únicos u optimice el rendimiento en un conjunto de datos específico.

En el fragmento de código siguiente, cubrimos los pasos para entrenar un modelo YOLO11 para la detección de OBB. 

En primer lugar, se inicializa el modelo utilizando los pesos específicos del OBB preentrenados en YOLO11 (yolo11n-obb.pt). A continuación, se utiliza una función de entrenamiento para entrenar el modelo en un conjunto de datos personalizado, con parámetros como el archivo de configuración del conjunto de datos, el número de ciclos de entrenamiento, el tamaño de la imagen de entrenamiento y el hardware en el que ejecutar el entrenamiento (por ejemplo, CPU o GPU). Tras el entrenamiento, se valida el rendimiento del modelo para comprobar métricas como la precisión y la pérdida. 

Utilizando el modelo entrenado, puedes ejecutar inferencias en nuevas imágenes para detectar objetos con OBB y visualizarlos. Además, el modelo entrenado puede convertirse a formatos como ONNX para su despliegue utilizando la función de exportación.

Fig. 5. Ejemplo de entrenamiento YOLO11 para la detección de objetos OBB.

El camino a seguir para los avances de la IA YOLO11

Ultralytics YOLO11 lleva la detección de objetos al siguiente nivel con su compatibilidad con cuadros delimitadores orientados. Al ser capaz de detectar objetos en diferentes ángulos, YOLO11 puede utilizarse para diversas aplicaciones en distintos sectores. Por ejemplo, es perfecto para sectores como la planificación urbana, la energía y el transporte marítimo, donde la precisión es crucial para tareas como la inspección de paneles solares o la supervisión de flotas. Con un rendimiento más rápido y una mayor precisión, YOLO11 puede ayudar a los desarrolladores de IA a resolver retos del mundo real. 

A medida que la IA se adopte más ampliamente y se integre en nuestra vida cotidiana, modelos como YOLO11 darán forma al futuro de las soluciones de IA.

Para conocer el potencial de Vision AI, únete a nuestra creciente comunidad y explora nuestro repositorio de GitHub. Impulsamos la innovación reinventando sectores como la sanidad o los coches autoconducidos.

Logotipo de FacebookLogotipo de TwitterLogotipo de LinkedInSímbolo de enlace de copia

Leer más en esta categoría

¡Construyamos juntos el futuro
de la IA!

Comienza tu viaje con el futuro del aprendizaje automático