Glosario

Bosque aleatorio

Descubre cómo Random Forest, un potente algoritmo de aprendizaje por conjuntos, destaca en clasificación, regresión y aplicaciones de IA del mundo real.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Bosque Aleatorio es un algoritmo de aprendizaje automático (AM) versátil y potente, muy utilizado para tareas de clasificación y regresión. Pertenece a la familia de los métodos de aprendizaje por conjuntos, que combinan múltiples modelos individuales para lograr una mayor precisión y robustez de la predicción que la que podría lograr cualquier modelo por sí solo. Propuesto por Leo Breiman, se basa en el concepto de los árboles de decisión introduciendo la aleatoriedad.

Cómo funcionan los bosques aleatorios

En esencia, un Bosque Aleatorio funciona construyendo una multitud de árboles de decisión durante la fase de entrenamiento. Cada árbol se entrena con un subconjunto aleatorio diferente de los datos de entrenamiento (una técnica llamada bagging o agregación bootstrap) y utiliza sólo un subconjunto aleatorio de características para decidir la mejor división en cada nodo. Esta doble aleatoriedad ayuda a descorrelacionar los árboles, haciendo que el conjunto sea más robusto.

Para un problema de clasificación, el resultado final del Bosque Aleatorio es la clase seleccionada por el voto mayoritario de todos los árboles individuales. Para un problema de regresión, la predicción suele ser la predicción media de los árboles individuales. Este enfoque aprovecha la "sabiduría de la multitud", donde un conjunto diverso de modelos realiza colectivamente predicciones más precisas y reduce significativamente el riesgo de sobreajuste, un problema común con los árboles de decisión individuales.

Características principales

Varios aspectos clave definen un Bosque Aleatorio:

  • Método Ensemble: Combina las predicciones de varios árboles de decisión.
  • Ensacado: Cada árbol se entrena con una muestra bootstrap del conjunto de datos original. Más información sobre la agregación por bootstrap (ensacado).
  • Aleatoriedad de las características: En cada división de nodos, sólo se considera un subconjunto aleatorio de características.
  • Varianza reducida: Promediar las predicciones de muchos árboles descorrelacionados reduce la varianza global del modelo.
  • Importancia de las características: Puede proporcionar estimaciones de la importancia de las características, indicando qué variables de entrada son las más influyentes en las predicciones.

Aplicaciones de Random Forest

Los Bosques Aleatorios se aplican en una amplia gama de dominios debido a su precisión, robustez y facilidad de uso. He aquí un par de ejemplos concretos:

  1. Finanzas: Se utiliza mucho para tareas como la puntuación crediticia y la detección del fraude, donde es crucial identificar patrones complejos en los datos financieros.
  2. Sanidad: Se aplica en áreas como la predicción de enfermedades basada en historiales de pacientes e incluso en el análisis de imágenes médicas para identificar anomalías, aunque el aprendizaje profundo suele dominar en las tareas basadas en imágenes. Explora las soluciones de IA en sanidad.

Tecnologías y herramientas

Varias bibliotecas populares de aprendizaje automático proporcionan implementaciones del algoritmo Random Forest. Scikit-learn, una biblioteca Python muy utilizada, ofrece una completa implementación de Random Forest con opciones para el ajuste de hiperparámetros. Otras bibliotecas, como XGBoost y LightGBM, proporcionan implementaciones eficientes de métodos de conjunto basados en árboles, a menudo optimizados para la velocidad y el rendimiento en grandes conjuntos de datos.

Mientras que los Bosques Aleatorios destacan con datos estructurados o tabulares, suelen ser menos adecuados para tareas que implican datos no estructurados, como las imágenes, en comparación con los modelos de Aprendizaje Profundo. Para tareas de visión por ordenador de vanguardia, como la detección de objetos o la segmentación de imágenes, modelos como Ultralytics YOLO suelen ser preferibles. Puedes entrenar y desplegar modelos YOLO utilizando plataformas como Ultralytics HUB, que simplifica el ciclo de vida de MLOps para proyectos de IA de visión. Explora varias SolucionesUltralytics que utilizan modelos YOLO para aplicaciones del mundo real.

Leer todo