Cheque verde
Enlace copiado en el portapapeles

La importancia de los conjuntos de datos de visión por ordenador de alta calidad

Acompáñanos a explorar la necesidad de datos de alta calidad cuando se construyen modelos de visión por ordenador. Descubre cómo la calidad de los datos puede influir en el rendimiento del modelo.

En 2019, la adopción de la inteligencia artificial (IA) en las empresas había aumentado un 270% en los cuatro años anteriores. Este crecimiento ha impulsado la rápida integración de aplicaciones de visión por ordenador (VC), sistemas de IA que permiten a las máquinas interpretar y analizar datos visuales del mundo que les rodea. Estas aplicaciones impulsan una amplia gama de tecnologías, desde la detección de enfermedades en imágenes médicas y la habilitación de vehículos autónomos hasta la optimización del flujo de tráfico en el transporte y la mejora de la vigilancia en los sistemas de seguridad. 

La notable precisión y el incomparable rendimiento de los modelos de visión por ordenador de vanguardia como Ultralytics YOLO11 han impulsado en gran medida este crecimiento exponencial. Sin embargo, el rendimiento de estos modelos depende en gran medida de la calidad y cantidad de los datos utilizados para entrenar, validar y probar los modelos. 

Sin suficientes datos de alta calidad, los modelos de visión por ordenador pueden ser difíciles de entrenar y ajustar con eficacia para cumplir las normas del sector. En este artículo, exploraremos el papel vital de los datos en la creación de modelos de visión por ordenador y por qué los datos de alta calidad son tan importantes en la visión por ordenador. También repasaremos algunos consejos que te ayudarán a crear conjuntos de datos de alta calidad mientras trabajas en el entrenamiento de modelos de visión por ordenador personalizados. ¡Vamos a empezar!

El papel de los datos en la construcción de modelos de visión por ordenador

Los modelos de visión por ordenador pueden entrenarse en grandes conjuntos de datos de imágenes y vídeos para reconocer patrones y hacer predicciones precisas. Por ejemplo, un modelo de detección de objetos puede entrenarse con cientos -o incluso miles- de imágenes y vídeos etiquetados para identificar objetos con precisión. 

La calidad y la cantidad de estos datos de entrenamiento influyen en el rendimiento del modelo

Dado que los modelos de visión por ordenador sólo pueden aprender de los datos a los que están expuestos, proporcionar datos de alta calidad y ejemplos diversos es crucial para su éxito. Sin conjuntos de datos suficientes y diversos, estos modelos pueden no analizar con precisión los escenarios del mundo real y podrían producir resultados sesgados o inexactos. 

Por eso es importante comprender claramente el papel de los datos en el entrenamiento de modelos . Antes de repasar las características de los datos de alta calidad, vamos a comprender los tipos de conjuntos de datos que puedes encontrarte al entrenar modelos de visión por ordenador.

Tipos de conjuntos de datos de visión artificial

En visión por ordenador, los datos utilizados en el proceso de entrenamiento se clasifican en tres tipos, cada uno de los cuales tiene una finalidad específica. He aquí un rápido vistazo a cada tipo:

  • Datos de entrenamiento: Es el conjunto de datos primario utilizado para entrenar el modelo desde cero. Consiste en imágenes y vídeos con etiquetas predefinidas, que permiten al modelo aprender patrones y reconocer objetos. 
  • Datos de validación: Se trata de un conjunto de datos utilizados para comprobar el rendimiento de un modelo mientras se entrena. Ayuda a garantizar que el modelo funciona correctamente con datos nuevos y desconocidos.
  • Comprobación de datos: Conjunto independiente de datos que se utiliza para evaluar el rendimiento final de un modelo entrenado. Comprueba lo bien que el modelo puede hacer predicciones con datos completamente nuevos y desconocidos.
Fig. 1. Cómo se clasifican los datos en visión por ordenador.

Los 5 rasgos principales de los conjuntos de datos de visión computerizada de alta calidad

Independientemente del tipo de conjunto de datos, los datos de alta calidad son esenciales para construir modelos de visión por ordenador con éxito. He aquí algunas de las características clave que hacen que un conjunto de datos sea de alta calidad:

  • Precisión: Lo ideal es que los datos reflejen fielmente situaciones del mundo real e incluyan etiquetas correctas. Por ejemplo, cuando se trata de la IA de Visión en la sanidad, las imágenes de radiografías o escáneres deben estar etiquetadas con precisión para ayudar al modelo a aprender correctamente. 
  • La diversidad: Un buen conjunto de datos incluye una variedad de ejemplos para ayudar al modelo a funcionar bien en diferentes situaciones. Por ejemplo, si un modelo está aprendiendo a detectar coches, el conjunto de datos debe incluir coches de distintas formas, tamaños y colores en distintos escenarios (de día, de noche, con lluvia, etc.).
  • Coherencia: Los conjuntos de datos de alta calidad siguen un formato y unas normas de calidad uniformes. Por ejemplo, las imágenes deben tener resoluciones similares (no unas borrosas y otras nítidas) y pasar por los mismos pasos de preprocesamiento, como el cambio de tamaño o los ajustes de color, para que el modelo aprenda a partir de información coherente.
  • Puntualidad: Los conjuntos de datos que se actualizan periódicamente pueden seguir el ritmo de los cambios del mundo real. Supongamos que estás entrenando un modelo para detectar todo tipo de vehículos. Si aparecen otros nuevos, como los patinetes eléctricos, debes añadirlos al conjunto de datos para asegurarte de que el modelo sigue siendo preciso y está actualizado.
  • Privacidad: Si un conjunto de datos incluye información sensible, como fotos de personas, debe seguir las normas de privacidad. Técnicas como la anonimización (eliminar los detalles identificables) y el enmascaramiento de datos (ocultar las partes sensibles) pueden proteger la privacidad, al tiempo que permiten utilizar los datos de forma segura.

Retos causados por datos de baja calidad

Aunque comprender los rasgos de los datos de alta calidad es importante, es igual de vital considerar cómo los datos de baja calidad pueden afectar a tus modelos de visión por ordenador.

Problemas como la sobreadaptación y la inadaptación pueden afectar gravemente al rendimiento del modelo. El sobreajuste se produce cuando un modelo funciona bien con los datos de entrenamiento, pero tiene dificultades con los datos nuevos o desconocidos, a menudo porque el conjunto de datos carece de variedad. El infraajuste, por otra parte, se produce cuando el conjunto de datos no proporciona suficientes ejemplos o calidad para que el modelo aprenda patrones significativos. Para evitar estos problemas, es esencial mantener conjuntos de datos diversos, imparciales y de alta calidad, que garanticen un rendimiento fiable tanto en el entrenamiento como en las aplicaciones del mundo real.

Fig. 2. Infraadaptación Vs. Sobreajuste.

Los datos de baja calidad también pueden dificultar que los modelos extraigan y aprendan patrones significativos de los datos brutos, un proceso conocido como extracción de características. Si el conjunto de datos está incompleto, es irrelevante o carece de diversidad, el modelo puede tener dificultades para funcionar eficazmente. 

A veces, los datos de baja calidad pueden ser el resultado de simplificar los datos. Simplificar los datos puede ayudar a ahorrar espacio de almacenamiento y reducir los costes de procesamiento, pero una simplificación excesiva puede eliminar detalles importantes que el modelo necesita para funcionar bien. Por eso es tan importante mantener datos de alta calidad a lo largo de todo el proceso de visión por ordenador, desde la recopilación hasta la implementación. Como regla general, los conjuntos de datos deben incluir características esenciales sin dejar de ser diversos y precisos para garantizar predicciones fiables del modelo.

Fig. 3. Comprender la extracción de características.

Consejos para mantener la calidad de tu conjunto de datos de visión artificial

Ahora que hemos comprendido la importancia de los datos de alta calidad y el impacto de los datos de baja calidad, vamos a explorar cómo asegurarte de que tu conjunto de datos cumple unos estándares elevados.

Todo empieza con una recogida de datos fiable. Utilizar fuentes diversas, como el crowdsourcing, datos de regiones geográficas variadas y la generación de datos sintéticos , reduce el sesgo y ayuda a los modelos a manejar escenarios del mundo real. Una vez recogidos los datos, el preprocesamiento es fundamental. Técnicas como la normalización, que escala los valores de los píxeles a un rango coherente, y el aumento, que aplica transformaciones como la rotación, el giro y el zoom, mejoran el conjunto de datos. Estos pasos ayudan a que tu modelo generalice mejor y sea más robusto, reduciendo el riesgo de sobreajuste.

Dividir adecuadamente los conjuntos de datos es otro paso clave. Un enfoque habitual es asignar el 70% de los datos al entrenamiento, el 15% a la validación y el 15% a las pruebas. Comprobar dos veces que no hay solapamiento entre estos conjuntos evita la fuga de datos y garantiza una evaluación precisa del modelo.

Fig. 4. Una división común de datos entre entrenamiento, validación y prueba.

También puedes utilizar modelos preentrenados como YOLO11 para ahorrar tiempo y recursos informáticos. YOLO11 Los modelos de visión artificial, entrenados en grandes conjuntos de datos y diseñados para diversas tareas de visión informática, pueden ajustarse en tu conjunto de datos específico para satisfacer tus necesidades. Ajustando el modelo a tus datos, puedes evitar el sobreajuste y mantener un rendimiento sólido. 

El camino que queda por recorrer para los conjuntos de datos de visión computerizada

La comunidad de la IA se ha centrado tradicionalmente en mejorar el rendimiento construyendo modelos más profundos con más capas. Sin embargo, a medida que la IA sigue evolucionando, la atención está pasando de la optimización de los modelos a la mejora de la calidad de los conjuntos de datos. Andrew Ng, a menudo conocido como el "padre de la IA", cree que "el cambio más importante que debe experimentar el mundo de la IA en esta década será un cambio hacia una IA centrada en los datos". 

Este enfoque hace hincapié en refinar los conjuntos de datos mejorando la precisión de las etiquetas, eliminando los ejemplos ruidosos y garantizando la diversidad. Para la visión por ordenador, estos principios son fundamentales para abordar problemas como el sesgo y los datos de baja calidad, permitiendo que los modelos funcionen de forma fiable en escenarios del mundo real.

De cara al futuro, el avance de la visión por ordenador dependerá de la creación de conjuntos de datos más pequeños y de alta calidad, en lugar de recopilar grandes cantidades de datos. Según Andrew Ng, "la mejora de los datos no es un paso único de preprocesamiento; es una parte esencial del proceso iterativo de desarrollo de modelos de aprendizaje automático ". Si nos centramos en los principios centrados en los datos, la visión computerizada seguirá siendo más accesible, eficiente e impactante en diversos sectores.

Puntos clave

Los datos desempeñan un papel fundamental a lo largo del ciclo de vida de un modelo de visión. Desde la recogida de datos hasta el preprocesamiento, el entrenamiento, la validación y las pruebas, la calidad de los datos influye directamente en el rendimiento y la fiabilidad del modelo. Al dar prioridad a los datos de alta calidad y al etiquetado preciso, podemos construir modelos de visión por ordenador robustos que ofrezcan resultados fiables y precisos. 

A medida que avanzamos hacia un futuro impulsado por los datos, es esencial abordar las consideraciones éticas para mitigar los riesgos relacionados con la parcialidad y la normativa sobre privacidad. En última instancia, garantizar la integridad e imparcialidad de los datos es clave para liberar todo el potencial de las tecnologías de visión computerizada.

Únete a nuestra comunidad y consulta nuestro repositorio de GitHub para aprender más sobre IA. Consulta nuestras páginas de soluciones para explorar más aplicaciones de la IA en sectores como la agricultura y la fabricación.

Logotipo de FacebookLogotipo de TwitterLogotipo de LinkedInSímbolo de enlace de copia

Leer más en esta categoría

¡Construyamos juntos el futuro
de la IA!

Comienza tu viaje con el futuro del aprendizaje automático