Cheque verde
Enlace copiado en el portapapeles

Entrenamiento personalizado Ultralytics YOLO11 con conjuntos de datos de visión por ordenador

Descubre cómo la integración de Roboflow puede simplificar el entrenamiento personalizado Ultralytics YOLO11 facilitando el acceso a conjuntos de datos de visión por ordenador de código abierto.

Entrenar un modelo de visión por ordenador como Ultralytics YOLO11 normalmente implica recopilar imágenes para tu conjunto de datos, anotarlas, preparar los datos y ajustar el modelo para que cumpla tus requisitos específicos. Aunque el paqueteUltralytics Python hace que estos pasos sean sencillos y fáciles de seguir, el desarrollo de la IA de visión puede llevar mucho tiempo.

Esto es especialmente cierto cuando trabajas con un plazo de entrega ajustado o desarrollas un prototipo. En estas situaciones, disponer de herramientas o integraciones que simplifiquen partes del proceso -como agilizar la preparación de conjuntos de datos o automatizar tareas repetitivas- puede suponer una gran diferencia. Al reducir el tiempo y el esfuerzo necesarios, estas soluciones te ayudan a centrarte en construir y perfeccionar tu modelo. Eso es exactamente lo que ofrece la integración de Roboflow .

La integración de Roboflow te permite acceder fácilmente a conjuntos de datos de Roboflow Universe, una gran biblioteca de conjuntos de datos de visión por ordenador de código abierto. En lugar de pasar horas recopilando y organizando datos, puedes encontrar y utilizar rápidamente conjuntos de datos existentes para poner en marcha tu proceso de entrenamiento YOLO11 . Esta integración hace que sea mucho más rápido y sencillo experimentar e iterar en el desarrollo de tu modelo de visión por ordenador.

En este artículo, nos sumergiremos en cómo puedes aprovechar la integración de Roboflow para desarrollar modelos más rápidamente. ¡Vamos a empezar!

¿Qué es Roboflow Universe?

Roboflow Universe es una plataforma mantenida por Roboflow, una empresa centrada en simplificar el desarrollo de la visión por ordenador. Consta de más de 350 millones de imágenes, 500.000 conjuntos de datos y 100.000 modelos afinados para tareas como la detección de objetos, la clasificación de imágenes y la segmentación. Con contribuciones de desarrolladores e investigadores de todo el mundo, Roboflow Universe es un centro de colaboración para cualquiera que desee poner en marcha o mejorar sus proyectos de visión computerizada.

Fig. 1. Ejemplos de conjuntos de datos de detección de objetos en Roboflow Universe.

Roboflow Universo incluye las siguientes características clave:

  • Herramientas de exploración de conjuntos de datos: Explora, filtra y visualiza conjuntos de datos para encontrar rápidamente los recursos que se ajustan a los requisitos de tu proyecto.
  • Opciones de exportación: Exporta datos en formatos como COCO, YOLO, TFRecord, CSV y otros para adaptarlos a tu flujo de trabajo.
  • Análisis de conjuntos de datos: Obtén información sobre varios conjuntos de datos con herramientas analíticas que proporcionan visualizaciones de distribuciones de etiquetas, desequilibrios de clases y calidad del conjunto de datos. 
  • Seguimiento de versiones: Visualiza y accede a las distintas versiones de los conjuntos de datos cargados por los colaboradores, lo que te permite realizar un seguimiento de las actualizaciones, comparar los cambios y elegir la versión que mejor se adapte a las necesidades de tu proyecto. 

La integración de Roboflow te ayuda a encontrar los datos correctos

Encontrar el conjunto de datos adecuado suele ser una de las partes más difíciles de crear un modelo de visión por ordenador. Crear un conjunto de datos suele implicar reunir grandes cantidades de imágenes, asegurarte de que son relevantes para tu tarea y, a continuación, etiquetarlas con precisión. 

Este proceso puede requerir mucho tiempo y recursos, sobre todo si estás experimentando con diferentes enfoques en un corto período de tiempo. Incluso encontrar conjuntos de datos preexistentes puede ser complicado, ya que a menudo están dispersos por plataformas, no están documentados adecuadamente o carecen de las anotaciones específicas que necesitas.

Por ejemplo, si estás creando una aplicación de visión por ordenador para detectar malas hierbas en campos agrícolas, quizá quieras probar distintos enfoques de la IA de Visión, como la detección de objetos frente a la segmentación de instancias. Esto te permite experimentar y averiguar qué método funciona mejor antes de dedicar tiempo y esfuerzo a recopilar y etiquetar tu propio conjunto de datos.

Fig 2. Detección de piezas de automóvil mediante YOLO11.

Utilizando la integración de Roboflow , puedes explorar diversos conjuntos de datos relacionados con la agricultura, incluidos los centrados en la detección de malas hierbas, la salud de los cultivos o la supervisión de los campos. Estos conjuntos de datos listos para usar te permiten probar diferentes técnicas y perfeccionar tu modelo sin el esfuerzo inicial de crear tus propios datos. 

Cómo funciona la integración en Roboflow

Ahora que hemos hablado de cómo puedes utilizar la integración Roboflow para encontrar los conjuntos de datos adecuados, veamos cómo encaja en tu flujo de trabajo. Una vez que hayas elegido un conjunto de datos del Universo Roboflow , puedes exportarlo o descargarlo en el formato YOLO11 . Una vez exportado tu conjunto de datos, puedes utilizarlo para entrenar de forma personalizada YOLO11 utilizando el paquete Ultralytics Python . 

Al descargar tu conjunto de datos, puede que te des cuenta de que Roboflow Universe también admite otros formatos para entrenar diferentes modelos. Entonces, ¿por qué deberías elegir el entrenamiento personalizado Ultralytics YOLO11 ? 

YOLO11 es la última versión de los modelos Ultralytics YOLO y se ha creado para ofrecer una detección de objetos más rápida y precisa. Utiliza un 22% menos de parámetros (los valores internos que un modelo ajusta durante el entrenamiento para hacer predicciones) que YOLOv8m, pero consigue una precisión media (mAP) mayor en el conjunto de datos COCO. Este equilibrio entre velocidad y precisión hace que YOLO11 sea una opción versátil para una amplia gama de aplicaciones de visión por ordenador, especialmente cuando se entrenan modelos personalizados para adaptarse a tareas específicas.

A continuación te explicamos cómo funciona el entrenamiento personalizado YOLO11:

  • Alimentación de datos: El modelo YOLO11 procesa tu conjunto de datos, aprendiendo a detectar y clasificar objetos a partir de las imágenes y sus anotaciones.
  • Predicción y retroalimentación: El modelo hace predicciones sobre los objetos de las imágenes y las compara con las respuestas correctas proporcionadas en el conjunto de datos.
  • Seguimiento del rendimiento: Se controlan métricas como la precisión (detecciones correctas), el recuerdo (detecciones fallidas) y la pérdida (errores de predicción) para medir el progreso.
  • Aprendizaje iterativo: El modelo ajusta sus parámetros a lo largo de varias rondas (épocas) para mejorar la precisión de la detección y minimizar los errores.
  • Salida final del modelo: Tras el entrenamiento, el modelo optimizado se guarda y está listo para su despliegue.

Otras integraciones centradas en el desarrollo de la visión por ordenador

A medida que explores la integración de Roboflow , te darás cuenta de otras integraciones mencionadas en la documentación deUltralytics . Apoyamos una variedad de integraciones relacionadas con diversas etapas del desarrollo de la visión por ordenador. 

Esto es para proporcionar a nuestra comunidad una gama de opciones, para que puedas elegir lo que mejor se adapte a tu flujo de trabajo específico.

Fig. 3. Una visión general de las integraciones que admite Ultralytics.

Además de los conjuntos de datos, otras integraciones compatibles conUltralytics se centran en diversas partes del proceso de visión por ordenador, como el entrenamiento, la implementación y la optimización. He aquí algunos ejemplos de otras integraciones que apoyamos:

  • Integraciones de formación: Las integraciones como Amazon SageMaker y Paperspace Gradient agilizan los flujos de trabajo de formación al ofrecer plataformas basadas en la nube para un desarrollo y prueba eficientes de los modelos.
  • Integraciones de flujo de trabajo y seguimiento de experimentos: ClearML, MLFlow, y Weights & Biases (W&B) ayudan a automatizar los flujos de trabajo, hacer un seguimiento de los experimentos y mejorar la colaboración, facilitando la gestión de los proyectos de aprendizaje automático.
  • Optimización e integraciones de despliegue: CoreML, ONNX, y OpenVINO permiten un despliegue optimizado en varios dispositivos y marcos de trabajo, garantizando un rendimiento eficaz en plataformas como el hardware de Apple y las CPU de Intel .
  • Integraciones de monitorización y visualización: TensorBoard y Weights & Biases proporcionan herramientas para visualizar el progreso del entrenamiento y controlar el rendimiento, proporcionando información detallada para refinar los modelos.

YOLO11 aplicaciones y papel de las integraciones

Las integraciones que apoyan el desarrollo de la visión por ordenador, combinadas con las fiables capacidades de YOLO11, facilitan la resolución de retos del mundo real. Considera innovaciones como la visión por ordenador en la fabricación, donde la IA de visión se utiliza para detectar defectos en una línea de producción, como arañazos en piezas metálicas o componentes que faltan. La recopilación de los datos adecuados para estas tareas puede ser a menudo lenta y difícil, y requiere el acceso a entornos especializados. 

Normalmente consiste en instalar cámaras o sensores a lo largo de las líneas de producción para captar imágenes de los productos. Estas imágenes deben tomarse en grandes volúmenes, a menudo con iluminación y ángulos constantes, para garantizar la claridad y la uniformidad. 

Una vez capturadas, las imágenes deben anotarse meticulosamente con etiquetas precisas para cada tipo de defecto, como arañazos, abolladuras o componentes que faltan. Este proceso requiere mucho tiempo y recursos, así como experiencia, para garantizar que el conjunto de datos refleje con precisión la variabilidad del mundo real. Hay que tener en cuenta factores como los diferentes tamaños, formas y materiales de los defectos para crear un conjunto de datos sólido y fiable.

Las integraciones que proporcionan conjuntos de datos ya preparados facilitan tareas como el control de calidad industrial, y con las capacidades de detección en tiempo real de YOLO11, los fabricantes pueden supervisar las líneas de producción, detectar defectos al instante y mejorar la eficacia.

Fig. 4. Un ejemplo de utilización de Ultraytics YOLO11 para detectar y contar latas en fabricación.

Más allá de la fabricación, las integraciones relacionadas con conjuntos de datos pueden utilizarse en muchas otras industrias. Combinando la velocidad y precisión de YOLO11con conjuntos de datos de fácil acceso, las empresas pueden desarrollar e implantar rápidamente soluciones adaptadas a sus necesidades específicas. Tomemos, por ejemplo, la sanidad: las integraciones de conjuntos de datos pueden ayudar a desarrollar soluciones para analizar imágenes médicas y detectar anomalías como tumores. Del mismo modo, en la conducción autónoma, estas integraciones pueden ayudar a identificar vehículos, peatones y señales de tráfico para mejorar la seguridad.

Puntos clave

Encontrar el conjunto de datos adecuado suele ser una de las partes que más tiempo consume en la construcción de un modelo de visión por ordenador. Sin embargo, la integración de Roboflow facilita la búsqueda del mejor conjunto de datos para el entrenamiento personalizado de tus modelos Ultralytics YOLO , incluso si eres nuevo en visión por ordenador. 

Con acceso a una amplia colección de conjuntos de datos para tareas de visión por ordenador como la detección de objetos, la clasificación de imágenes o la segmentación de instancias, Roboflow Universe elimina las complicaciones del proceso de descubrimiento de datos. Te ayuda a empezar rápidamente y a centrarte en construir tu modelo en lugar de perder tiempo recopilando y organizando datos. Este enfoque simplificado permite a los desarrolladores crear prototipos, iterar y desarrollar soluciones de visión por ordenador de forma más eficiente.

Para saber más, visita nuestro repositorio de GitHub y participa en nuestra comunidad. Explora las innovaciones en áreas como la IA en los coches autoconducidos y la visión por ordenador en la agricultura en nuestras páginas de soluciones. 🚀

Logotipo de FacebookLogotipo de TwitterLogotipo de LinkedInSímbolo de enlace de copia

Leer más en esta categoría

¡Construyamos juntos el futuro
de la IA!

Comienza tu viaje con el futuro del aprendizaje automático