Cheque verde
Enlace copiado en el portapapeles

Construye un sistema ANPR con Ultralytics YOLO11 y GPT-4o Mini

Aprende a construir un sistema ANPR utilizando Ultralytics YOLO11 para la detección de matrículas y GPT-4o Mini para el reconocimiento de texto con precisión en tiempo real.

Encontrar aparcamiento en un aparcamiento abarrotado, esperar en las largas colas de los peajes o quedarse atascado en los controles de seguridad es frustrante. Los controles manuales de vehículos suelen llevar demasiado tiempo y provocar retrasos. Sin un sistema automatizado, hacer un seguimiento eficaz de los coches puede ser todo un reto. 

La visión por ordenador ha cambiado esta situación al permitir el reconocimiento de matrículas en tiempo real a partir de imágenes y secuencias de vídeo. Por ejemplo Ultralytics YOLO11 es un modelo avanzado de visión por ordenador que puede realizar tareas avanzadas de IA de Visión como detección, clasificación y seguimiento de objetos. Utilizando las capacidades de detección de objetos de YOLO11, puedes detectar con precisión las matrículas de los vehículos en las imágenes. 

Ultralytics ofrece cuadernosGoogle Colab completos que simplifican el proceso de creación de soluciones basadas en IA Vision. Estos cuadernos vienen preconfigurados con dependencias esenciales, modelos y guías paso a paso, lo que facilita la creación de aplicaciones. En particular, hay un cuaderno Colab dedicado para ANPR (Reconocimiento Automático de Matrículas).

En este artículo, utilizando el cuaderno Ultralytics Colab para ANPR, exploraremos cómo construir una solución ANPR utilizando Ultralytics YOLO11 para la detección de matrículas y GPT-4o Mini para el reconocimiento de texto. 

Comprender el ANPR 

Rastrear los coches manualmente lleva mucho tiempo y es propenso a errores, sobre todo cuando se mueven rápidamente. Comprobar cada matrícula una a una ralentiza el proceso y aumenta el riesgo de errores. El reconocimiento automático de matrículas resuelve este problema utilizando la visión por ordenador para detectar y leer las matrículas al instante, haciendo que la vigilancia del tráfico y la seguridad sean más eficaces.

Los sistemas ANPR pueden capturar imágenes o vídeos de los vehículos que pasan y utilizar la detección de objetos en tiempo real para identificar las matrículas. Una vez detectadas, se utiliza el reconocimiento de texto para extraer las matrículas automáticamente, sin necesidad de intervención humana. Este proceso garantiza resultados precisos, incluso cuando los vehículos se mueven rápidamente o las matrículas están parcialmente ocultas.

Fig. 1. Ejemplo de uso de YOLO11 para detectar una matrícula.

Hoy en día, las cabinas de peaje, los sistemas de aparcamiento y las fuerzas del orden confían cada vez más en el ANPR para realizar un seguimiento eficaz de los vehículos.

Desafíos relacionados con la tecnología ANPR

Aunque el ANPR identifica rápidamente a los vehículos, hay algunos problemas que pueden afectar a su precisión. He aquí algunos problemas comunes que pueden afectar al funcionamiento de un sistema ANPR:

  • Poca luz y mal tiempo: Las matrículas son más difíciles de leer de noche y con mal tiempo. La niebla, la lluvia y el resplandor de los faros pueden difuminar el texto, haciéndolo ilegible.
  • Placas borrosas o bloqueadas: Un coche que se mueve rápido puede dejar una imagen borrosa, sobre todo si la velocidad de obturación de la cámara es demasiado lenta. La suciedad, los arañazos o las partes de la matrícula tapadas también pueden causar problemas de reconocimiento. Utilizar cámaras de alta calidad con los ajustes adecuados ayuda a obtener resultados más claros.
  • Diseños de placas incoherentes: No todas las placas tienen el mismo aspecto. Algunas tienen tipos de letra extravagantes, texto adicional o logotipos que confunden al sistema.
  • Riesgos para la privacidad y seguridad de los datos: Almacenar los datos del vehículo de forma segura es importante. Las medidas de seguridad adecuadas pueden impedir el acceso no autorizado y mantener la información protegida. Con las salvaguardias adecuadas, los sistemas ANPR pueden ser seguros y fiables.

Cómo mejora YOLO11 los sistemas ANPR

Ultralytics YOLO11 puede hacer que los sistemas ANPR sean más rápidos y precisos. Procesa las imágenes con rapidez manteniendo la precisión y no requiere una gran potencia de cálculo, por lo que funciona bien en todo tipo de sistemas, desde pequeñas cámaras de seguridad hasta grandes sistemas de tráfico.

Con un entrenamiento personalizado, YOLO11 puede adaptarse a diferentes estilos de matrícula, idiomas y entornos. También funciona bien en condiciones difíciles, como poca luz, desenfoque de movimiento y ángulos difíciles, cuando se entrena a medida con conjuntos de datos especializados que incluyen imágenes de estas condiciones.

Al identificar los vehículos al instante, YOLO11 ayuda a reducir los tiempos de espera, evitar errores y mejorar la seguridad. Esto hace que el tráfico sea más fluido y las operaciones más eficientes en aparcamientos, peajes y sistemas de vigilancia.

Construir un sistema ANPR con YOLO11 y GPT-4o Mini

A continuación, vamos a ver cómo construir un sistema ANPR utilizando YOLO11 y GPT-4o Mini. 

Exploraremos el código mostrado en el cuadernoGoogle Collab de Ultralytics para esta solución. El cuaderno Google Colab es fácil de usar y cualquiera puede crear un sistema ANPR sin necesidad de una configuración complicada.

Paso 1: Configurar el entorno

Para empezar, tendremos que instalar nuestras dependencias, o los paquetes de software y bibliotecas esenciales necesarios para hacer funcionar nuestro sistema ANPR. Estas dependencias ayudan en tareas como la detección de objetos, el procesamiento de imágenes y el reconocimiento de texto, garantizando que el sistema funcione eficazmente.

Instalaremos el paquetePython Ultralytics como se muestra a continuación. Este paquete proporciona modelos preentrenados, utilidades de entrenamiento y herramientas de inferencia, que facilitan la detección y el reconocimiento de matrículas con YOLO11.

Fig 2. Instalar el paquetePython Ultralytics . 

También necesitaremos configurar GPT-4o Mini para el reconocimiento de texto. Como GPT-4o Mini se encarga de extraer el texto de las placas detectadas, necesitamos una clave API para acceder al modelo. Esta clave puede obtenerse registrándote en la API de GPT-4o Mini. Una vez que tengas la clave, puedes añadirla al cuaderno Colab para que el sistema pueda conectarse al modelo y procesar los números de matrícula.

Tras completar la configuración y ejecutar el código de instalación, YOLO11 estará listo para detectar matrículas, y GPT-4o Mini estará configurado para reconocerlas y extraer texto de ellas.

Paso 2: Descarga el modelo entrenado a medida

Ahora que todo está configurado, el siguiente paso es descargar el modelo YOLO11 que ha sido entrenado a medida para detectar matrículas. Como este modelo ya ha sido entrenado para detectar matrículas, no hace falta entrenarlo desde cero. Sólo tienes que descargarlo y ya está listo para usar. Esto ahorra tiempo y facilita mucho el proceso.

Además, descargaremos un archivo de vídeo de muestra para probar el sistema. Si quieres, también puedes ejecutar esta solución con tus propios archivos de vídeo. Una vez descargados, el modelo y los archivos de vídeo se almacenarán en el entorno del portátil.

Fig. 3. Descarga del modelo y del archivo de vídeo.

Paso 3: Carga el vídeo e inicia la detección

Una vez que el modelo está listo, es hora de verlo en acción. En primer lugar, se carga el archivo de vídeo para procesarlo, asegurándose de que se abre correctamente. A continuación, se configura un grabador de vídeo para guardar las secuencias procesadas con las matrículas detectadas, manteniendo el tamaño y la velocidad de fotogramas originales. Por último, se carga el modelo para detectar matrículas en cada fotograma del vídeo.

Fig. 4. Lectura del vídeo y carga del modelo.

Una vez cargado el modelo, el sistema empezará a analizar cada fotograma del vídeo para detectar matrículas. Cuando se encuentra una matrícula, el sistema la resalta con un recuadro de detección, facilitando su identificación. Este paso garantiza que sólo se capturen los detalles relevantes, filtrando la información de fondo innecesaria. Una vez detectadas con éxito las matrículas, el vídeo está listo para la siguiente fase.

Paso 4: Extraer el texto de las matrículas

Tras detectar una matrícula, el siguiente paso es el reconocimiento del texto. El sistema recorta primero la matrícula del fotograma de vídeo, eliminando cualquier distracción para obtener una visión clara. Esto ayuda a centrarse en los detalles, mejorando la precisión incluso en condiciones difíciles, como poca luz o movimiento borroso.

Una vez aislada la placa, GPT-4o Mini analiza la imagen, extrae los números y las letras, y los convierte en texto legible. El texto reconocido se añade de nuevo al vídeo, etiquetando cada placa detectada en tiempo real.

Una vez completados estos pasos, el sistema ANPR es totalmente funcional y está listo para reconocer matrículas con facilidad. 

Paso 5: Guardar el vídeo procesado

El paso final guarda el vídeo procesado y limpia los archivos temporales, asegurando que todo funcione sin problemas. 

Cada fotograma procesado, con las placas detectadas y el texto reconocido, se escribe en el vídeo de salida final. Una vez procesados todos los fotogramas, el sistema cierra el archivo de vídeo del que estaba leyendo, liberando memoria y recursos del sistema. También finaliza y guarda el vídeo de salida, dejándolo listo para su reproducción o análisis posterior.

Fig 5. Utilizando YOLO11 y GPT-4o Mini para ANPR.

Despliegue de un sistema ANPR

Tras construir y probar una solución ANPR, el siguiente paso es desplegarla en un entorno real. La mayoría de los modelos de Vision AI dependen de la informática de alto rendimiento, pero Ultralytics YOLO11 está optimizado para Edge AI. Puede funcionar eficazmente en dispositivos pequeños sin necesidad de procesamiento en la nube ni de una conexión constante a Internet, lo que la convierte en una gran elección para lugares con recursos limitados.

Por ejemplo, una comunidad cerrada puede desplegar YOLO11 en un dispositivo de borde para identificar los vehículos a medida que entran, eliminando la necesidad de grandes servidores. Todo se procesa in situ en tiempo real, garantizando un acceso fluido, reduciendo la congestión y mejorando la seguridad.

Fig. 6. Detección de matrículas con YOLO11.

Mientras tanto, en zonas con conectividad estable a Internet, el ANPR basado en la nube puede gestionar varias cámaras simultáneamente. Por ejemplo, en un centro comercial, puede rastrear vehículos en distintas entradas y almacenar los números de matrícula en un sistema central, lo que facilita la supervisión del aparcamiento, la mejora de la seguridad y la gestión del flujo de vehículos a distancia.

El camino que queda por recorrer para el ANPR

Configurar un sistema de reconocimiento automático de matrículas (ANPR) es sencillo con Ultralytics YOLO11. Detecta con precisión las matrículas y puede entrenarse a medida para adaptarse a distintos entornos y requisitos.

Los sistemas ANPR aumentan la seguridad, agilizan la gestión del aparcamiento y mejoran la vigilancia del tráfico. Al automatizar el reconocimiento de matrículas, reducen los errores, aceleran la identificación y hacen más eficaz el seguimiento de vehículos en diversas aplicaciones.

Únete a nuestra comunidad y visita nuestro repositorio de GitHub para ver la IA en acción. Explora nuestras opciones de licencia y descubre más sobre la IA Vision en la fabricación y la IA en los coches autoconducidos en nuestras páginas de soluciones.

Logotipo de FacebookLogotipo de TwitterLogotipo de LinkedInSímbolo de enlace de copia

Leer más en esta categoría

¡Construyamos juntos el futuro
de la IA!

Comienza tu viaje con el futuro del aprendizaje automático