Glossario

Foresta casuale

Scopri come Random Forest, un potente algoritmo di apprendimento collettivo, eccelle nella classificazione, nella regressione e nelle applicazioni di intelligenza artificiale del mondo reale.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Random Forest è un algoritmo di apprendimento automatico (ML) versatile e potente, ampiamente utilizzato per compiti di classificazione e regressione. Appartiene alla famiglia dei metodi di apprendimento d'insieme, che combinano più modelli individuali per ottenere un'accuratezza e una robustezza di previsione migliori di quelle che un singolo modello potrebbe ottenere da solo. Proposto da Leo Breiman, si basa sul concetto di albero decisionale introducendo la casualità.

Come funzionano le Foreste Casuali

Nella sua essenza, una Foresta Casuale opera costruendo una moltitudine di alberi decisionali durante la fase di addestramento. Ogni albero viene addestrato su un diverso sottoinsieme casuale dei dati di formazione (una tecnica chiamata bagging o aggregazione bootstrap) e utilizza solo un sottoinsieme casuale di caratteristiche per decidere la migliore suddivisione in ogni nodo. Questa doppia casualità aiuta a decorare gli alberi, rendendo l'ensemble più robusto.

Per un problema di classificazione, l'output finale della Foresta Casuale è la classe selezionata dalla maggioranza dei voti di tutti i singoli alberi. Per un problema di regressione, la previsione è in genere la media delle previsioni dei singoli alberi. Questo approccio sfrutta la "saggezza della folla": un insieme eterogeneo di modelli fa previsioni più accurate e riduce significativamente il rischio di overfitting, un problema comune ai singoli alberi decisionali.

Caratteristiche principali

Diversi aspetti chiave definiscono una Foresta Casuale:

  • Metodo Ensemble: Combina le previsioni di più alberi decisionali.
  • Bagging: Ogni albero viene addestrato su un campione bootstrap del set di dati originale. Per saperne di più sull'aggregazione bootstrap (Bagging).
  • Casualità delle caratteristiche: Ad ogni divisione del nodo, viene considerato solo un sottoinsieme casuale di caratteristiche.
  • Varianza ridotta: La media delle previsioni di molti alberi decorrelati riduce la varianza complessiva del modello.
  • Importanza delle caratteristiche: Può fornire stime dell'importanza delle caratteristiche, indicando quali variabili di input sono più influenti nelle previsioni.

Applicazioni della foresta casuale

Le Foreste Casuali vengono applicate in un'ampia gamma di settori grazie alla loro accuratezza, robustezza e facilità d'uso. Ecco un paio di esempi concreti:

  1. Finanza: Utilizzata ampiamente per attività come il credit scoring e il rilevamento delle frodi, dove l'identificazione di modelli complessi nei dati finanziari è fondamentale.
  2. Sanità: Viene applicata in settori come la previsione delle malattie sulla base delle cartelle cliniche dei pazienti e anche nell'analisi delle immagini mediche per l'identificazione delle anomalie, anche se l'apprendimento profondo spesso domina nelle attività basate sulle immagini. Esplora le soluzioni di IA nel settore sanitario.

Tecnologie e strumenti

Diverse librerie per l'apprendimento automatico forniscono implementazioni dell'algoritmo Random Forest. Scikit-learn, una libreria Python molto utilizzata, offre un'implementazione completa di Random Forest con opzioni per la regolazione degli iperparametri. Altre librerie come XGBoost e LightGBM forniscono implementazioni efficienti di metodi di ensemble basati su alberi, spesso ottimizzati per la velocità e le prestazioni su grandi insiemi di dati.

Mentre le Foreste Casuali eccellono con i dati strutturati o tabellari, sono generalmente meno adatte a compiti che coinvolgono dati non strutturati come le immagini rispetto ai modelli di Deep Learning. Per attività di computer vision all'avanguardia come il rilevamento di oggetti o la segmentazione di immagini, modelli come Ultralytics YOLO sono in genere da preferire. Puoi addestrare e distribuire i modelli YOLO utilizzando piattaforme come Ultralytics HUB, che semplifica il ciclo di vita MLOps per i progetti di vision AI. Esplora le varie soluzioniUltralytics che utilizzano i modelli YOLO per applicazioni reali.

Leggi tutto