Glosario

Insuficiente

Descubre qué es el desajuste, sus causas, signos y soluciones. Aprende a mejorar el rendimiento del modelo y a evitar los problemas de inadaptación.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La inadaptación se produce cuando un modelo de aprendizaje automático es demasiado simple para captar la estructura subyacente de los datos. Esto suele ocurrir cuando el modelo tiene muy pocos parámetros o características en relación con la complejidad de los datos que intenta aprender. Como resultado, el modelo no aprende adecuadamente de los datos de entrenamiento y obtiene malos resultados no sólo en el conjunto de entrenamiento, sino también en datos no vistos, como un conjunto de validación o prueba.

Características clave de la inadaptación

Los modelos inadaptados suelen caracterizarse por un sesgo elevado y una varianza baja. El sesgo se refiere al error introducido al aproximar un problema del mundo real, que puede ser complejo, mediante un modelo simplificado. Un modelo inadaptado hace suposiciones demasiado simplistas sobre los datos, lo que conduce a errores sistemáticos. La varianza, por otra parte, se refiere a la sensibilidad del modelo a las fluctuaciones de los datos de entrenamiento. Los modelos desajustados presentan una varianza baja porque son demasiado simples para que les afecten mucho los cambios en los datos de entrenamiento. Sin embargo, esta simplicidad también significa que no pueden captar pautas y matices importantes de los datos.

Causas de la inadaptación

Varios factores pueden contribuir a un ajuste insuficiente:

  • Complejidad del modelo: Utilizar un modelo demasiado simple para la complejidad de los datos. Por ejemplo, intentar ajustar un modelo lineal a unos datos con una relación muy poco lineal.
  • Entrenamiento insuficiente: No entrenar el modelo durante suficientes épocas o utilizar una tasa de aprendizaje demasiado alta, haciendo que el modelo converja prematuramente antes de que pueda aprender los patrones subyacentes.
  • Mala ingeniería de características: No incluir características relevantes o utilizar características que no representan adecuadamente la estructura subyacente de los datos. Una ingeniería de características eficaz es crucial para construir modelos que puedan generalizar bien.
  • Regularización excesiva: Aplicar demasiada regularización, lo que penaliza la complejidad del modelo y puede impedir que éste aprenda patrones importantes.

Detectar la inadaptación

Identificar la inadaptación es esencial para mejorar el rendimiento del modelo. Los signos de inadaptación incluyen:

  • Error de entrenamiento elevado: El modelo funciona mal en los datos de entrenamiento, lo que indica que no ha aprendido los patrones subyacentes.
  • Alto error de validación/prueba: Un mal rendimiento en los conjuntos de validación o prueba, similar al error de entrenamiento, sugiere que el modelo es demasiado simplista.
  • Curvas de aprendizaje: Trazar el rendimiento del modelo en los conjuntos de entrenamiento y validación a lo largo del tiempo puede revelar un ajuste insuficiente. Si ambas curvas se estabilizan en una tasa de error elevada, es probable que el modelo no esté bien ajustado.

Abordar la inadaptación

Para combatir la inadaptación, considera las siguientes estrategias:

  • Aumenta la complejidad del modelo: Utiliza un modelo más complejo con más parámetros o capas. Por ejemplo, pasa de un modelo lineal a un modelo polinómico o de una red neuronal superficial a una profunda.
  • Entrenar más tiempo: aumenta el número de épocas de entrenamiento o ajusta la tasa de aprendizaje para que el modelo tenga más tiempo para aprender de los datos.
  • Mejora la ingeniería de características: Añade características más relevantes o transforma las existentes para representar mejor la estructura de los datos. Técnicas como la creación de términos de interacción o características polinómicas pueden ayudar.
  • Reducir Regularización: Disminuye la cantidad de regularización aplicada al modelo, permitiéndole ajustarse más a los datos de entrenamiento.

Infraadaptación vs. Sobreadaptación

Es importante distinguir entre infraadaptación y sobreadaptación. Mientras que el infraajuste se produce cuando un modelo es demasiado simple, el sobreajuste ocurre cuando un modelo es demasiado complejo y empieza a memorizar los datos de entrenamiento, incluidos el ruido y los valores atípicos. Los modelos sobreajustados funcionan excepcionalmente bien con los datos de entrenamiento, pero mal con los datos no vistos. Equilibrar la complejidad del modelo y el entrenamiento es crucial para evitar tanto el infraajuste como el sobreajuste.

Ejemplos reales

Ejemplo 1: Predecir el precio de la vivienda

Imagina que estás construyendo un modelo para predecir el precio de la vivienda en función de su tamaño. Si utilizas un modelo de regresión lineal simple y supones que los precios de la vivienda aumentan linealmente con el tamaño, podrías no ajustarte bien a los datos. En realidad, la relación entre el tamaño de la casa y el precio es probablemente más compleja, e implica factores como rendimientos decrecientes para tamaños mayores o precios superiores para determinados rangos de tamaño. Un modelo lineal no captaría estos matices, lo que daría lugar a un mal rendimiento predictivo tanto en los datos de entrenamiento como en los nuevos.

Ejemplo 2: Clasificación de imágenes

Considera una tarea de clasificación de imágenes en la que intentas clasificar imágenes de animales en diferentes categorías. Si utilizas un modelo muy simple, como la regresión logística, podrías no ajustarte bien a los datos. La clasificación de imágenes suele requerir la captura de patrones y características complejas en las imágenes, algo que un modelo simple no puede hacer. Como resultado, el modelo funcionaría mal tanto en el conjunto de entrenamiento como en las nuevas imágenes no vistas. Utilizar un modelo más complejo, como una red neuronal convolucional (CNN), puede mejorar significativamente el rendimiento.

Al comprender las causas y los signos de la inadaptación, los profesionales pueden tomar las medidas adecuadas para mejorar sus modelos. Herramientas como Ultralytics YOLOv8 proporcionan capacidades avanzadas para construir y ajustar modelos complejos, ayudando a evitar la inadaptación y a mejorar el rendimiento en diversas tareas de visión por ordenador. Para más información sobre el entrenamiento y la optimización de modelos, visita el Blog deUltralytics .

Leer todo