Glosario

Validación cruzada

Descubre el poder de la validación cruzada en el aprendizaje automático para mejorar la precisión del modelo, evitar el sobreajuste y garantizar un rendimiento sólido.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La validación cruzada es un método estadístico utilizado para evaluar el rendimiento y la capacidad de generalización de los modelos de aprendizaje automático (AM). En lugar de dividir los datos una sola vez en conjuntos de entrenamiento y de prueba, la Validación Cruzada divide sistemáticamente los datos en múltiples subconjuntos, o "pliegues". El modelo se entrena en algunos pliegues y se prueba en el pliegue restante, y este proceso se repite varias veces, reservando cada vez un pliegue distinto para la prueba. Este enfoque proporciona una estimación más sólida de cómo es probable que funcione el modelo en datos no vistos, en comparación con una única división de entrenamiento y prueba, lo que ayuda a evitar problemas como el sobreajuste.

Cómo funciona la validación cruzada

El tipo más común de validación cruzada es la validación cruzada K-Fold. Aquí tienes un desglose simplificado del proceso:

  1. Baraja el Conjunto de Datos: Baraja aleatoriamente el conjunto de datos para asegurarte de que los puntos de datos se distribuyen sin un sesgo de orden inherente.
  2. Dividir en Pliegues: Divide el conjunto de datos en "K" pliegues de tamaño igual (o casi igual). Una opción habitual para K es 5 ó 10.
  3. Entrenamiento iterativo y validación:
    • Selecciona un pliegue como dato de validación.
    • Entrena el modelo con los K-1 pliegues restantes(datos de entrenamiento).
    • Evalúa el rendimiento del modelo (por ejemplo, la precisión) en el pliegue de validación retenido.
    • Repite este proceso K veces, utilizando cada pliegue exactamente una vez como conjunto de validación.
  4. Rendimiento medio: Calcula la media de las puntuaciones de rendimiento obtenidas en cada iteración. Esta puntuación media proporciona una estimación más fiable del rendimiento de generalización del modelo.

Bibliotecas populares como Scikit-learn proporcionan implementaciones eficientes de varias técnicas de Validación Cruzada.

¿Por qué utilizar la validación cruzada?

La validación cruzada es una técnica fundamental en la evaluación de modelos por varias razones:

  • Estimación fiable del rendimiento: Al promediar los resultados de varias divisiones, se obtiene una estimación menos sesgada del rendimiento del modelo en los nuevos datos, en comparación con una única división de entrenamiento/validación.
  • Uso eficiente de los datos: Permite utilizar casi todos los datos tanto para el entrenamiento como para la validación en diferentes iteraciones, lo que resulta especialmente útil para conjuntos de datos más pequeños.
  • Selección y ajuste de modelos: Es crucial para comparar diferentes modelos o sintonizar hiperparámetros, ayudando a seleccionar la configuración que mejor generaliza.
  • Detectar el sobreajuste/infraajuste: Ayuda a identificar si un modelo es demasiado complejo (sobreajuste) o demasiado simple(infraajuste) observando las variaciones de rendimiento en diferentes pliegues.

Validación cruzada vs. división simple entrenar/validar

Mientras que una simple división entrenamiento/validación implica reservar una parte de los datos únicamente para la validación, la validación cruzada utiliza los datos de forma más eficaz. En una división simple, la métrica de rendimiento depende en gran medida de qué puntos de datos específicos terminan en el conjunto de validación. La validación cruzada mitiga esta dependencia garantizando que cada punto de datos se utilice para la validación exactamente una vez, lo que conduce a una evaluación más estable y fiable. Ultralytics ofrece orientación sobre la aplicación de la Validación Cruzada K-Fold con Ultralytics YOLO.

Aplicaciones en el mundo real

La validación cruzada se utiliza ampliamente en varios dominios de IA y ML:

  1. Análisis de imágenes médicas: Al desarrollar un modelo de IA para detectar tumores en exploraciones mediante técnicas como la segmentación de imágenes, la validación cruzada ayuda a garantizar que el modelo funcione de forma fiable en exploraciones de diferentes pacientes y equipos, proporcionando confianza antes de su despliegue clínico. Esto implica entrenar y probar diferentes subconjuntos de datos de imágenes médicas de pacientes.
  2. Detección de Objetos en Sistemas Autónomos: Por una Ultralytics YOLO entrenado para la detección de objetos (por ejemplo, la identificación de peatones para vehículos autónomos), la validación cruzada K-Fold puede evaluar lo bien que el modelo generaliza a través de diversas condiciones ambientales (iluminación, clima) presentes en el conjunto de datos antes del despliegue del modelo. Plataformas como Ultralytics HUB pueden facilitar la gestión de estos procesos de entrenamiento.

Al proporcionar una evaluación sólida de la generalización del modelo, la validación cruzada es una herramienta indispensable para construir sistemas de IA fiables y eficaces.

Leer todo