Glosario

Validación cruzada

¡Descubre el poder de la validación cruzada en el aprendizaje automático! Aprende cómo evita el sobreajuste, garantiza la precisión y ayuda a la selección de modelos.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La validación cruzada es una técnica estadística utilizada en el aprendizaje automático y la inteligencia artificial para evaluar el rendimiento de un modelo probándolo en subconjuntos de datos que no se utilizaron durante el entrenamiento. Garantiza que el modelo se generaliza bien a los nuevos datos no vistos y ayuda a evitar el sobreajuste. Al dividir el conjunto de datos en varias partes o "pliegues", la validación cruzada prueba sistemáticamente el modelo en diferentes partes de los datos, proporcionando una medida sólida de su eficacia.

Cómo funciona la validación cruzada

La idea central de la validación cruzada es dividir varias veces el conjunto de datos en subconjuntos de entrenamiento y de prueba. El modelo se entrena en un subconjunto y se prueba en otro, rotando a través del conjunto de datos para garantizar que cada punto de datos se utiliza para el entrenamiento y la validación al menos una vez. La técnica más utilizada es Validación cruzada K-Folddonde el conjunto de datos se divide en K pliegues de igual tamaño:

  • El modelo se entrena con K-1 pliegues y probado en el pliegue restante.
  • Este proceso se repite K veces, utilizando cada vez un pliegue diferente como conjunto de pruebas.
  • Los resultados se promedian en todas las iteraciones para obtener una métrica de rendimiento final.

Otras variantes son la validación cruzada de dejar uno fuera (LOOCV), en la que cada punto de datos se utiliza una vez como conjunto de prueba, y la validación cruzada estratificada de K pliegues, que mantiene la distribución de clases en todos los pliegues, lo que la hace ideal para conjuntos de datos desequilibrados.

Ventajas de la validación cruzada

La validación cruzada ofrece varias ventajas en la evaluación de modelos:

  • Mejor generalización: Al probar con datos no vistos, la validación cruzada garantiza que el modelo no se ajuste en exceso al conjunto de datos de entrenamiento.
  • Métricas fiables: Los resultados promediados de múltiples pliegues proporcionan una estimación más precisa y estable del rendimiento del modelo.
  • Selección de modelos: La validación cruzada ayuda a comparar distintos modelos o configuraciones de hiperparámetros para elegir el de mejor rendimiento.

Obtén más información sobre cómo evitar la sobreadaptación y la generalización en el aprendizaje automático en la página del glosario sobre Sobreadaptación.

Aplicaciones en IA y ML

La validación cruzada se utiliza ampliamente en diversas aplicaciones de IA y ML para garantizar que los modelos son sólidos y fiables:

1. Ajuste de hiperparámetros

La validación cruzada desempeña un papel fundamental en la optimización de los hiperparámetros mediante técnicas como la búsqueda en cuadrícula o la búsqueda aleatoria. Evaluando múltiples combinaciones de parámetros en diferentes pliegues, los profesionales pueden identificar la mejor configuración. Explora más sobre el ajuste de hiperparámetros para mejorar el rendimiento del modelo.

2. Comparación de modelos

Al seleccionar entre distintos algoritmos, como las Máquinas de vectores de soporte (SVM) o los Bosques aleatorios, la validación cruzada proporciona una comparación justa al evaluar cada modelo en condiciones idénticas. Más información sobre los bosques aleatorios y las máquinas de vectores de apoyo (SVM).

3. Aplicaciones en el mundo real

  • Sanidad: En el análisis de imágenes médicas, la validación cruzada garantiza que los modelos de diagnóstico, como los que identifican tumores cerebrales, se generalicen bien en diversos conjuntos de datos de pacientes. Explora el impacto de la IA en la asistencia sanitaria a través de AI in Healthcare.
  • Venta al por menor: En la previsión de la demanda en el comercio minorista, la validación cruzada ayuda a los modelos a predecir las ventas futuras con mayor precisión utilizando subconjuntos de datos históricos para la validación. Descubre cómo la IA transforma el comercio minorista en IA para una gestión más inteligente del inventario minorista.

Validación cruzada vs. conceptos relacionados

Validación cruzada vs. datos de validación

Mientras que la validación cruzada implica la partición dinámica del conjunto de datos, los datos de validación se refieren a un subconjunto fijo reservado para la evaluación del rendimiento durante el entrenamiento. Obtén más información en la página del glosario Datos de validación.

Validación cruzada frente a datos de prueba

Los datos de prueba se utilizan para la evaluación final tras el entrenamiento y la validación del modelo, mientras que la validación cruzada divide los datos de entrenamiento en varios subconjuntos para la evaluación intermedia. Para más detalles, visita la página del glosario Datos de prueba.

Prevención de la validación cruzada frente a la sobreadaptación

La validación cruzada es una estrategia clave para identificar y mitigar el sobreajuste. Aunque técnicas como las capas de abandono o la regularización también ayudan, la validación cruzada proporciona pruebas empíricas del rendimiento del modelo. Más información en la página del glosario Regularización.

Conclusión

La validación cruzada es una herramienta indispensable en el aprendizaje automático, que garantiza que los modelos sean precisos y generalizables. Al probar rigurosamente sobre datos no vistos y promediar los resultados, proporciona métricas de rendimiento fiables que guían la selección y el ajuste del modelo. Para una aplicación práctica de la validación cruzada en la detección de objetos, explora la Validación Cruzada K-Fold para la Detección de Objetos utilizando Ultralytics YOLO en Ultralytics HUB.

Para empezar con proyectos de IA o entrenamiento de modelos, visita Ultralytics HUB para acceder a herramientas y recursos intuitivos.

Leer todo