Glosario

Datos de prueba

Mejora los modelos ML con datos de prueba para una evaluación imparcial y una mejor generalización, crucial para las aplicaciones de IA en sanidad y agricultura.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Los datos de prueba desempeñan un papel crucial en la evaluación de los modelos de aprendizaje automático, ya que proporcionan una medida objetiva del rendimiento de un modelo en datos no vistos. Es un componente esencial en el ciclo de desarrollo de cualquier aplicación de aprendizaje automático.

¿Qué son los datos de prueba?

Los datos de prueba son un subconjunto de datos que se utilizan para proporcionar una evaluación final del rendimiento de un modelo después de haberlo entrenado y validado. A diferencia de los datos de entrenamiento, que se utilizan para enseñar al modelo, y de los datos de validación, que afinan sus parámetros, los datos de prueba se reservan para evaluar la capacidad predictiva del modelo.

Para comprender mejor cómo encajan los datos de prueba en el ciclo de vida del aprendizaje automático, consulta el artículo detallado Datos de entrenamiento.

Importancia en el aprendizaje automático

Los datos de las pruebas son vitales por varias razones:

  • Evaluación imparcial: Los datos de prueba garantizan que el modelo no se ha limitado a memorizar los datos de entrenamiento, un problema común conocido como sobreajuste.
  • Generalización del modelo: Ayuda a determinar lo bien que funcionará el modelo con datos nuevos y no vistos, algo crucial para las aplicaciones del mundo real.
  • Métricas de rendimiento: Los datos de prueba se utilizan para calcular métricas de rendimiento clave como la exactitud, la precisión, la recuperación y la puntuación F1.

Aplicaciones en IA y ML

Los datos de prueba se utilizan en diversas aplicaciones de aprendizaje automático, como:

  • La IA en la sanidad: Los modelos necesitan datos de prueba fiables para garantizar la precisión en aplicaciones sensibles como el diagnóstico de enfermedades. Más información sobre la IA en la sanidad.
  • La IA en la agricultura: Probar modelos con datos diversos ayuda a mejorar tareas como la supervisión de cultivos y la detección de plagas. La IA en la agricultura proporciona conocimientos más profundos.

Diferencia con los datos de validación

Aunque tanto los datos de validación como los de prueba evalúan el rendimiento del modelo, tienen finalidades distintas. Los datos de validación se emplean durante el proceso de entrenamiento para afinar los parámetros del modelo, mientras que los datos de prueba sólo se utilizan al final para evaluar el modelo final. Puedes obtener más información al respecto en la descripción general de los datos de validación.

Ejemplos reales

Vehículos autónomos

En AI in Self-Driving, los datos de las pruebas garantizan que los modelos de coche autoconducido detectan y responden con precisión a las señales de tráfico, los peatones y otros vehículos, fomentando la seguridad y la eficiencia.

Venta al por menor y gestión de inventarios

En entornos minoristas, los datos de prueba se utilizan para validar modelos de IA que rastrean y gestionan el inventario. Modelos como Ultralytics YOLO pueden mejorar drásticamente los procesos de inventario al proporcionar detección de objetos en tiempo real.

Conclusión

Los datos de prueba son una parte fundamental del desarrollo de modelos de IA sólidos y fiables. Al garantizar una evaluación imparcial y mejorar la generalización de los modelos, contribuye al éxito de la implantación de aplicaciones de IA en diversos sectores. Para profundizar en la importancia de la evaluación de modelos, considera la posibilidad de leer sobre la IA y su impacto transformador.

Leer todo