Cheque verde
Enlace copiado en el portapapeles

Despliegue de Ultralytics YOLO11 en Rockchip para una IA de borde eficiente

Explora cómo desplegar Ultralytics YOLO11 en Rockchip utilizando el kit de herramientas RKNN para una IA Edge eficiente, aceleración de IA y detección de objetos en tiempo real.

Una palabra de moda recientemente en la comunidad de la IA es la IA periférica, especialmente en lo que se refiere a la visión por ordenador. A medida que crecen las aplicaciones basadas en IA, aumenta la necesidad de ejecutar modelos de forma eficiente en dispositivos integrados con potencia y recursos informáticos limitados. 

Por ejemplo, los drones utilizan Vision AI para la navegación en tiempo real, las cámaras inteligentes detectan objetos al instante y los sistemas de automatización industrial realizan el control de calidad sin depender de la computación en la nube. Estas aplicaciones requieren un procesamiento rápido y eficiente de la IA directamente en los dispositivos periféricos para garantizar un rendimiento en tiempo real y una baja latencia. Sin embargo, ejecutar modelos de IA en dispositivos periféricos no siempre es fácil. Los modelos de IA suelen requerir más potencia y memoria de la que pueden manejar muchos dispositivos de borde.

El kit de herramientas RKNN de Rockchip ayuda a resolver este problema optimizando los modelos de aprendizaje profundo para los dispositivos alimentados por Rockchip. Utiliza Unidades de Procesamiento Neuronal (NPU) dedicadas para acelerar la inferencia, reduciendo la latencia y el consumo de energía en comparación con el procesamiento en CPU o GPU . 

La comunidad de Vision AI ha estado ansiosa por ejecutar Ultralytics YOLO11 en dispositivos basados en Rockchip, y os hemos escuchado. Hemos añadido soporte para exportar YOLO11 al formato de modelo RKNN. En este artículo, exploraremos cómo funciona la exportación a RKNN y por qué desplegar YOLO11 en dispositivos con Rockchip supone un cambio de juego.

¿Qué es Rockchip y el kit de herramientas RKNN?

Rockchip es una empresa que diseña sistemas en chip (SoC), procesadores diminutos pero potentes que hacen funcionar muchos dispositivos integrados. Estos chips combinan una CPU, una GPU y una Unidad de Procesamiento Neuronal (NPU) para gestionar desde tareas informáticas generales hasta aplicaciones de IA de Visión que se basan en la detección de objetos y el procesamiento de imágenes.

Los SoC Rockchip se utilizan en una gran variedad de dispositivos, como ordenadores monoplaca (SBC), placas de desarrollo, sistemas industriales de inteligencia artificial y cámaras inteligentes. Muchos fabricantes de hardware conocidos, como Radxa, ASUS, Pine64, Orange Pi, Odroid, Khadas y Banana Pi, construyen dispositivos con SoC Rockchip. Estas placas son populares para aplicaciones de inteligencia artificial y visión por ordenador porque ofrecen un equilibrio entre rendimiento, eficiencia energética y asequibilidad.

Fig. 1. Un ejemplo de dispositivo alimentado por Rockchip.

Para ayudar a que los modelos de IA funcionen eficientemente en estos dispositivos, Rockchip proporciona el kit de herramientas RKNN (Rockchip Neural Network). Permite a los desarrolladores convertir y optimizar los modelos de aprendizaje profundo para utilizar las Unidades de Procesamiento Neuronal (NPU) de Rockchip. 

Los modelos RKNN están optimizados para una inferencia de baja latencia y un uso eficiente de la energía. Al convertir los modelos a RKNN, los desarrolladores pueden conseguir velocidades de procesamiento más rápidas, un menor consumo de energía y una mayor eficiencia en los dispositivos alimentados por Rockchip.

Se optimizan los modelos RKNN

Veamos más de cerca cómo los modelos RKNN mejoran el rendimiento de la IA en los dispositivos con Rockchip. 

A diferencia de las CPU y las GPU, que manejan una amplia gama de tareas informáticas, las NPU de Rockchip están diseñadas específicamente para el aprendizaje profundo. Al convertir los modelos de IA al formato RKNN, los desarrolladores pueden ejecutar inferencias directamente en la NPU. Esto hace que los modelos RKNN sean especialmente útiles para tareas de visión por ordenador en tiempo real, donde es esencial un procesamiento rápido y eficiente.

Las NPU son más rápidas y eficientes que las CPU y las GPU para las tareas de IA porque están construidas para manejar cálculos de redes neuronales en paralelo. Mientras que las CPU procesan las tareas paso a paso y las GPU distribuyen las cargas de trabajo entre varios núcleos, las NPU están optimizadas para realizar cálculos específicos de IA de forma más eficiente. 

Como resultado, los modelos RKNN funcionan más rápido y consumen menos energía, lo que los hace ideales para dispositivos alimentados por batería, cámaras inteligentes, automatización industrial y otras aplicaciones de IA de borde que requieren la toma de decisiones en tiempo real.

Visión general de los modelos Ultralytics YOLO

Los modelosYOLO (You Only Look Once)Ultralytics están diseñados para tareas de visión por ordenador en tiempo real, como la detección de objetos, la segmentación de instancias y la clasificación de imágenes. Son conocidos por su velocidad, precisión y eficacia, y se utilizan ampliamente en sectores como la agricultura, la fabricación, la sanidad y los sistemas autónomos. 

Estos modelos han mejorado sustancialmente con el tiempo. Por ejemplo, Ultralytics YOLOv5 facilitó la detección de objetos con PyTorch. Después, Ultralytics YOLOv8 añadió nuevas funciones como la estimación de la pose y la clasificación de imágenes. Ahora, YOLO11 va más allá aumentando la precisión y utilizando menos recursos. De hecho, YOLO11m obtiene mejores resultados en el conjunto de datos COCO utilizando un 22% menos de parámetros que YOLOv8m, lo que lo hace más preciso y eficiente.

Fig. 2. Detección de objetos con YOLO11.

Los modelosYOLO Ultralytics también admiten la exportación a múltiples formatos, lo que permite un despliegue flexible en diferentes plataformas. Estos formatos incluyen ONNX, TensorRT, CoreML y OpenVINO, dando a los desarrolladores la libertad de optimizar el rendimiento en función de su hardware de destino.

Con el soporte añadido para exportar YOLO11 al formato de modelo RKNN, YOLO11 puede aprovechar ahora las NPU de Rockchip. El modelo más pequeño, YOLO11n en formato RKNN, alcanza un impresionante tiempo de inferencia de 99,5 ms por imagen, lo que permite el procesamiento en tiempo real incluso en dispositivos integrados.

Exportar tu modelo YOLO11 al formato RKNN

Actualmente, los modelos de detección de objetos YOLO11 pueden exportarse al formato RKNN. Además, permanece atento: estamos trabajando para añadir compatibilidad con las demás tareas de visión por ordenador y la cuantización INT8 en futuras actualizaciones. 

Exportar YOLO11 al formato RKNN es un proceso sencillo. Puedes cargar tu modelo YOLO11 entrenado a medida, especificar la plataforma Rockchip de destino y convertirlo al formato RKNN con unas pocas líneas de código. El formato RKNN es compatible con varios SoC Rockchip, incluidos RK3588, RK3566 y RK3576, lo que garantiza una amplia compatibilidad de hardware.

Fig. 3. Exportación de YOLO11 al formato de modelo RKNN.

Despliegue de YOLO11 en dispositivos basados en Rockchip

Una vez exportado, el modelo RKNN puede desplegarse en dispositivos basados en Rockchip. Para desplegar el modelo, sólo tienes que cargar el archivo RKNN exportado en tu dispositivo Rockchip y ejecutar la inferencia: el proceso de utilizar el modelo de IA entrenado para analizar nuevas imágenes o vídeos y detectar objetos en tiempo real. Con sólo unas pocas líneas de código, puedes empezar a identificar objetos a partir de imágenes o secuencias de vídeo.

Fig. 4. Ejecutar una inferencia utilizando el modelo RKNN exportado.

Aplicaciones Edge AI de YOLO11 y Rockchip

Para tener una idea más clara de dónde puede desplegarse YOLO11 en dispositivos con Rockchip en el mundo real, veamos algunas aplicaciones clave de la IA de vanguardia.

Los procesadores Rockchip se utilizan ampliamente en tabletas Android, placas de desarrollo y sistemas industriales de IA. Gracias a la compatibilidad con Android, Linux y Python, puedes crear e implantar fácilmente soluciones basadas en IA Vision para diversos sectores.

Tabletas robustas integradas con YOLO11

Una aplicación habitual que implica ejecutar YOLO11 en dispositivos con Rockchip son las tabletas robustas. Son tabletas duraderas y de alto rendimiento diseñadas para entornos duros como almacenes, obras de construcción y entornos industriales. Estas tabletas pueden aprovechar la detección de objetos para mejorar la eficacia y la seguridad.

Por ejemplo, en la logística de almacén, los trabajadores pueden utilizar una tableta Rockchip con YOLO11 para escanear y detectar automáticamente el inventario, reduciendo el error humano y acelerando los tiempos de procesamiento. Del mismo modo, en las obras de construcción, estas tabletas pueden utilizarse para detectar si los trabajadores llevan el equipo de seguridad requerido, como cascos y chalecos, ayudando a las empresas a hacer cumplir la normativa y prevenir accidentes.

Fig 5. Detección de equipos de seguridad con YOLO11.

IA industrial para el control de calidad 

En lo que respecta a la fabricación y la automatización, las placas industriales alimentadas por Rockchip pueden desempeñar un papel importante en el control de calidad y la supervisión de procesos. Una placa industrial es un módulo informático compacto de alto rendimiento diseñado para sistemas integrados en entornos industriales. Estas placas suelen incluir procesadores, memoria, interfaces de E/S y opciones de conectividad que pueden integrarse con sensores, cámaras y maquinaria automatizada.

Ejecutar modelos YOLO11 en estas placas permite analizar las líneas de producción en tiempo real, detectando problemas al instante y mejorando la eficiencia. Por ejemplo, en la fabricación de coches, un sistema de IA que utilice hardware Rockchip y YOLO11 puede detectar arañazos, piezas desalineadas o defectos de pintura a medida que los coches avanzan por la cadena de montaje. Al identificar estos defectos en tiempo real, los fabricantes pueden reducir los residuos, disminuir los costes de producción y garantizar unos niveles de calidad más altos antes de que los vehículos lleguen a los clientes.

Ventajas de ejecutar YOLO11 en dispositivos basados en Rockchip

Los dispositivos basados en Rockchip ofrecen un buen equilibrio entre rendimiento, coste y eficiencia, lo que los convierte en una gran elección para desplegar YOLO11 en aplicaciones de IA de borde.

He aquí algunas ventajas de ejecutar YOLO11 en dispositivos basados en Rockchip:

  • Mejora Rendimiento de la IA: Los dispositivos con Rockchip manejan la inferencia de IA de forma más eficiente que las placas CPU como Raspberry Pi, ofreciendo una detección de objetos más rápida y una latencia menor.
  • Solución rentable: Si estás experimentando con IA y necesitas una opción económica que siga ofreciendo un rendimiento potente, Rockchip es una gran opción. Proporciona una forma asequible de ejecutar YOLO11 sin comprometer la velocidad ni la eficiencia.
  • Eficiencia energética: Ejecutar modelos de visión por ordenador en dispositivos alimentados por Rockchip consume menos energía que las GPU, lo que lo hace ideal para dispositivos que funcionan con baterías y aplicaciones de IA integradas.

Puntos clave

Ultralytics YOLO11 puede ejecutarse eficazmente en dispositivos basados en Rockchip aprovechando la aceleración por hardware y el formato RKNN. Esto reduce el tiempo de inferencia y mejora el rendimiento, lo que lo hace ideal para tareas de visión por ordenador en tiempo real y aplicaciones de IA de borde.

El kit de herramientas RKNN proporciona herramientas clave de optimización, como la cuantización y el ajuste fino, que garantizan el buen rendimiento de los modelos YOLO11 en las plataformas Rockchip. Optimizar los modelos para un procesamiento eficiente en el dispositivo será esencial a medida que aumente la adopción de la IA en los bordes. Con las herramientas y el hardware adecuados, los desarrolladores pueden abrir nuevas posibilidades para las soluciones de visión por ordenador en diversos sectores. 

Únete a nuestra comunidad y explora nuestro repositorio de GitHub para saber más sobre la IA. Comprueba cómo la visión por ordenador en la agricultura y la IA en la sanidad están impulsando la innovación visitando nuestras páginas de soluciones. Además, consulta nuestras opciones de licencia para empezar a crear hoy mismo tus soluciones de Vision AI.

Logotipo de FacebookLogotipo de TwitterLogotipo de LinkedInSímbolo de enlace de copia

Leer más en esta categoría

¡Construyamos juntos el futuro
de la IA!

Comienza tu viaje con el futuro del aprendizaje automático