Glosario

Conjunto

¡Aumenta la precisión predictiva con métodos de conjunto! Aprende cómo la combinación de varios modelos mejora el rendimiento en la detección de objetos, la PNL y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

En el aprendizaje automático, un método Ensemble es una técnica que combina las predicciones de múltiples modelos individuales para producir una predicción más precisa y robusta que la que podría lograr cualquier modelo por sí solo. Funciona según el principio descrito a menudo como la"sabiduría de la multitud", según el cual la decisión colectiva de varios modelos diversos suele ser superior a la decisión de un modelo especializado. Este enfoque es especialmente potente en tareas complejas dentro de la inteligencia artificial (IA), como la detección de objetos, la clasificación de imágenes y el procesamiento del lenguaje natural, en las que confiar en una única perspectiva podría dar lugar a errores o limitaciones.

Conceptos básicos de los métodos de conjunto

Los métodos de conjunto aprovechan la diversidad entre múltiples modelos (a menudo llamados aprendices base o aprendices débiles) para reducir los errores de predicción y mejorar el rendimiento general. La idea central es que los distintos modelos pueden cometer distintos tipos de errores en subconjuntos diferentes de los datos. Combinando sus predicciones, estos errores a menudo pueden promediarse o anularse entre sí, dando lugar a un modelo final más estable y generalizado que funcione bien en datos no vistos. La clave del éxito de los métodos de conjunto es garantizar una diversidad suficiente entre los modelos base. Esta diversidad puede conseguirse mediante varias estrategias, como utilizar diferentes algoritmos de aprendizaje (p. ej., combinar árboles de decisión y SVM), entrenar modelos en diferentes subconjuntos de los datos de entrenamiento (como en el Bagging), o utilizar diferentes hiperparámetros para el mismo algoritmo.

Ventajas de utilizar métodos de conjunto

El empleo de métodos de conjunto ofrece varias ventajas significativas en el aprendizaje automático (AM):

  • Mayor precisión predictiva: Los conjuntos suelen alcanzar una mayor precisión que cualquier modelo individual.
  • Mayor robustez y estabilidad: La predicción final es menos sensible a las peculiaridades de un único modelo o a las variaciones de los datos de entrenamiento.
  • Menor riesgo de sobreajuste: Al promediar las predicciones, los conjuntos pueden mitigar la tendencia de los modelos complejos a sobreajustarse a los datos de entrenamiento.

Tipos de métodos de conjunto

Existen varias técnicas populares de conjunto, cada una con un enfoque distinto para combinar modelos:

  • Bagging (Agregación Bootstrap): Entrena múltiples instancias del mismo algoritmo base en diferentes subconjuntos aleatorios de los datos de entrenamiento (extraídos con reemplazo) y promedia sus predicciones. Random Forest es un ejemplo bien conocido.
  • Refuerzo: Construye modelos secuencialmente, y cada nuevo modelo se centra en corregir los errores cometidos por los anteriores. Algunos ejemplos son AdaBoost, Gradient Boosting Machines (GBM), XGBoost y LightGBM.
  • Apilamiento (generalización apilada): Combina las predicciones de varios modelos base diferentes (aprendices heterogéneos) entrenando un metamodelo (por ejemplo, regresión logística) para aprender a combinar mejor sus resultados.

El término "Ensamblaje de modelos" suele utilizarse indistintamente con "Conjunto" y se refiere al mismo concepto de combinar varios modelos. Puedes explorar estrategias para Ensamblar modelos con YOLOv5.

Aplicaciones reales de los métodos de conjunto

Los métodos de conjunto se utilizan ampliamente en diversos ámbitos para mejorar el rendimiento de los sistemas de IA:

  1. Visión por ordenador: En tareas como la detección de objetos utilizando modelos como Ultralytics YOLOel ensamblaje puede implicar la combinación de predicciones de modelos entrenados con diferentes aumentos o en diferentes etapas(puntos de control). Esto mejora la robustez de la detección en escenarios desafiantes como condiciones meteorológicas variables u oclusiones de objetos, cruciales para aplicaciones como vehículos autónomos y sistemas de seguridad.
  2. Diagnóstico médico: Los conjuntos se utilizan en el análisis de imágenes médicas para combinar diagnósticos de distintos algoritmos o modelos entrenados con datos de pacientes diversos. Por ejemplo, combinar las salidas de una CNN y un Transformador de Visión (ViT ) podría proporcionar una predicción más fiable para detectar anomalías en las exploraciones, reduciendo el riesgo de diagnósticos erróneos.

Aunque potentes, los conjuntos aumentan la complejidad y los requisitos computacionales para el entrenamiento y el despliegue de modelos. Sin embargo, las importantes ganancias de rendimiento suelen justificar estos costes en aplicaciones críticas. Plataformas como Ultralytics HUB pueden simplificar la gestión y el entrenamiento de múltiples modelos, facilitando la creación de conjuntos eficaces.

Leer todo