Aprende a utilizar Albumentaciones para aumentos al entrenar a medida Ultralytics YOLO11 para mejorar el rendimiento del modelo con datos de entrenamiento diversos.
Cuando se construye una solución de visión por ordenador, recopilar un conjunto variado de imágenes para entrenar los modelos de IA de visión puede ser una parte crucial del proceso. A menudo requiere mucho tiempo y dinero, y a veces, las imágenes recopiladas siguen sin ser lo suficientemente variadas como para que los modelos aprendan eficazmente.
Por ejemplo, modelos de visión por ordenador como Ultralytics YOLO11 pueden entrenarse a medida en conjuntos de datos de imágenes para diversas tareas de visión informática relacionadas con diferentes aplicaciones. La diversidad de datos es clave porque ayuda al modelo a generalizar mejor, permitiéndole reconocer objetos y patrones en una amplia gama de escenarios del mundo real.
Si tienes problemas con la falta de datos diversos, las técnicas de aumento de datos de imagen pueden ser una gran solución. Métodos como girar, voltear y ajustar el brillo pueden ayudar a aumentar la variedad de tu conjunto de datos, mejorando la capacidad del modelo para manejar una gama más amplia de condiciones.
Por eso Ultralytics admite una integración para el aumento de datos de imágenes. Utilizando Albumentations, una popular herramienta que ofrece una colección de transformaciones, puedes crear datos visuales diversos. Esta integración simplifica el proceso de entrenamiento de YOLO11 aumentando automáticamente las imágenes de entrenamiento, lo que mejora el rendimiento del modelo.
En este artículo, exploraremos cómo puedes utilizar la integración de Albumentations, sus ventajas y su impacto en el entrenamiento de modelos.
Los modelos de visión por ordenador pueden aprender de un amplio conjunto de imágenes de alta calidad para reconocer objetos en distintos entornos. Recopilar grandes conjuntos de datos de fuentes del mundo real puede ser lento, costoso e ineficaz. Para agilizar esta tarea, puedes utilizar el aumento de datos de imágenes para crear nuevas variaciones de las imágenes existentes, ayudando a los modelos a aprender de diferentes escenarios sin recopilar más datos.
En concreto, puedes aprovechar Albumentations, una biblioteca de código abierto introducida en 2018 para aumentar eficazmente los datos de imagen. Admite diversas operaciones, desde simples cambios geométricos como rotaciones y giros, hasta ajustes más complejos como brillo, contraste y adición de ruido.
Albumentations es conocido por su alto rendimiento, lo que significa que puede procesar imágenes de forma rápida y eficaz. Construido sobre bibliotecas optimizadas como OpenCV y NumPy, maneja grandes conjuntos de datos con un tiempo de procesamiento mínimo, lo que lo hace ideal para aumentar rápidamente los datos durante el entrenamiento del modelo.
Aquí tienes otras características clave de Albumentaciones:
Puede que te preguntes: hay muchas formas de aplicar aumentos a un conjunto de datos, e incluso podrías crear los tuyos propios utilizando herramientas como OpenCV. Entonces, ¿por qué elegir una integración compatible con una biblioteca como Albumentations?
Crear aumentos manualmente con herramientas como OpenCV puede llevar mucho tiempo y requiere cierta experiencia. También puede ser complicado ajustar las transformaciones para obtener los mejores resultados. La integración de Albumentations facilita este proceso. Ofrece muchas transformaciones listas para usar que pueden ahorrarte tiempo y esfuerzo al preparar tu conjunto de datos.
Otra razón para elegir la integración de Albumentations es que funciona sin problemas con el canal deentrenamiento de modelos Ultralytics . Facilita mucho el entrenamiento personalizado de YOLO11, ya que los aumentos se aplican automáticamente durante el entrenamiento. Simplifica el proceso, para que puedas centrarte más en mejorar tu modelo en lugar de ocuparte de la preparación de los datos.
Curiosamente, utilizar las integraciones de Albumentations para entrenar YOLO11 es más sencillo de lo que podría parecer. Una vez configuradas las bibliotecas adecuadas, la integración aplica automáticamente aumentos de datos de imagen durante el entrenamiento. Ayuda al modelo a aprender de diferentes variaciones de imágenes utilizando el mismo conjunto de datos.
A continuación, vamos a ver cómo instalar y utilizar la integración de Albumentations en el entrenamiento personalizado de YOLO11.
Antes de aplicar aumentos, es necesario instalar tanto el paquetePython Ultralytics como Albumentations. La integración se ha construido de modo que ambas bibliotecas funcionen juntas a la perfección por defecto, así que no tienes que preocuparte de configuraciones complejas.
Todo el proceso de instalación puede completarse en un par de minutos con un solo comando pip, que es una herramienta de gestión de paquetes para instalar bibliotecas Python , como se muestra en la imagen siguiente.
Una vez instalado Albumentations, el modo de entrenamiento del modelo de Ultralytics aplica automáticamente aumentos de imagen durante el entrenamiento. Si Albumentations no está instalado, estos aumentos no se aplicarán. Para más detalles, puedes consultar la documentación oficial Ultralytics tralytics.
Vamos a comprender mejor lo que ocurre bajo el capó de la integración de Albumentaciones.
Aquí tienes un vistazo más de cerca a los aumentos que se aplican durante el entrenamiento de YOLO11 :
Si estás entrenando a YOLO11 a medida para una aplicación específica, la integración de Albumentations puede ayudar a mejorar el rendimiento del modelo adaptándose a diversas condiciones. Analicemos algunas aplicaciones del mundo real y los retos que puede resolver esta integración.
La IA de visión en la sanidad está ayudando a los médicos a analizar las imágenes médicas con mayor precisión para ayudar en los diagnósticos y mejorar la atención al paciente. De hecho, alrededor de una quinta parte de las organizaciones sanitarias ya utilizan soluciones de IA.
Sin embargo, la creación de estas soluciones de visión por ordenador conlleva su propio conjunto de retos. Las exploraciones médicas pueden variar mucho de un hospital a otro, influidas por factores como los distintos equipos, ajustes e incluso la experiencia de los técnicos. Las variaciones en el brillo, el contraste y la exposición pueden afectar a la coherencia y precisión de los modelos de IA de Visión, dificultando su rendimiento fiable en distintos entornos.
Aquí es donde la integración de herramientas como Albumentations resulta esencial. Al generar múltiples versiones aumentadas de la misma exploración, Albumentations permite al modelo aprender de una variedad de calidades de imagen. Esto ayuda a que el modelo sea más robusto, permitiéndole detectar enfermedades con precisión tanto en imágenes de alta como de baja calidad.
Otra aplicación interesante de la IA de Visión es la seguridad y la vigilancia. La detección de objetos en tiempo real puede ayudar a los equipos de seguridad a identificar rápidamente posibles amenazas.
Una preocupación fundamental relacionada con esta aplicación es que las cámaras de seguridad captan imágenes en diversas condiciones de iluminación a lo largo del día, y estas condiciones pueden afectar drásticamente a la forma en que un modelo entiende dichas imágenes. Factores como los entornos con poca luz, el deslumbramiento o la escasa visibilidad pueden dificultar que los modelos de visión por ordenador detecten objetos o reconozcan amenazas potenciales de forma coherente.
La integración de Albumentations ayuda aplicando transformaciones para imitar diferentes condiciones de iluminación. Esto permite que el modelo aprenda a detectar objetos tanto en entornos luminosos como con poca luz, lo que lo hace más fiable y mejora los tiempos de respuesta en condiciones difíciles.
Un derrame en el pasillo de un supermercado, un perro corriendo por la tienda o un niño tirando un expositor de productos son sólo algunos ejemplos de sucesos cotidianos que pueden ser casos límite para la IA de Visión en entornos minoristas . La visión por ordenador se utiliza cada vez más para mejorar la experiencia del cliente mediante el seguimiento del comportamiento de los compradores, el control del tráfico peatonal y la identificación de productos en las estanterías. Sin embargo, estas situaciones del mundo real pueden ser difíciles de comprender y procesar con precisión para los sistemas de IA.
Aunque no todos los escenarios pueden representarse en un conjunto de datos de visión por ordenador, la integración de Albumentations ayuda aumentando los datos para cubrir muchas situaciones posibles, como iluminación inesperada, ángulos inusuales u obstrucciones. Esto ayuda a los modelos de visión por ordenador a adaptarse a diversas condiciones, mejorando su capacidad para manejar casos límite y hacer predicciones precisas en entornos dinámicos de venta al por menor.
Recopilar datos diversos del mundo real para el entrenamiento de modelos puede ser complicado, pero Albumentations lo facilita creando variaciones de imágenes que ayudan a los modelos a adaptarse a condiciones diferentes.
La integración de Albumentations con el apoyo de Ultralytics simplifica el proceso de aplicación de estos aumentos durante el entrenamiento personalizado de YOLO11. El resultado es una mejor calidad del conjunto de datos, que beneficia a una amplia gama de industrias al producir modelos de IA de Visión más precisos y fiables.
Únete a nuestra comunidad y explora nuestro repositorio de GitHub para aprender más sobre IA, y consulta nuestras opciones de licencia para poner en marcha tus proyectos de IA de Visión. ¿Te interesan innovaciones como la IA en la fabricación o la visión por ordenador en la conducción autónoma? Visita nuestras páginas de soluciones para descubrir más.
Comienza tu viaje con el futuro del aprendizaje automático