Glossario

Albero decisionale

Scopri la potenza degli alberi decisionali nell'apprendimento automatico per la classificazione, la regressione e le applicazioni reali come la sanità e la finanza.

Un albero decisionale è un modello versatile e interpretabile utilizzato nel Machine Learning (ML) per compiti di classificazione e regressione. Funziona come un diagramma di flusso, dove ogni nodo interno rappresenta un test su un attributo (caratteristica), ogni ramo rappresenta l'esito del test e ogni nodo foglia rappresenta un'etichetta di classe (nella classificazione) o un valore continuo (nella regressione). Questa struttura facilita la visualizzazione e la comprensione del modo in cui il modello arriva a una previsione, imitando i processi decisionali umani.

Come funzionano gli alberi decisionali

Gli alberi decisionali imparano dai dati creando un modello che prevede il valore di una variabile target in base a diverse caratteristiche di input. Si tratta di una forma di apprendimento supervisionato, il che significa che richiede dati di formazione etichettati. L'albero viene costruito dividendo ricorsivamente i dati in base alle caratteristiche che meglio separano la variabile target. Algoritmi comuni come CART (Classification and Regression Trees) e ID3 utilizzano criteri come l'impurità di Gini o il guadagno di informazioni per determinare la suddivisione ottimale a ogni nodo. Il processo continua fino a quando non viene soddisfatto un criterio di arresto, come il raggiungimento di una profondità massima o la presenza di nodi con campioni di una sola classe.

Tipi e varianti

I due tipi principali sono gli alberi di classificazione (che predicono etichette di classi discrete) e gli alberi di regressione (che predicono valori numerici continui). Sebbene i singoli alberi decisionali siano utili, a volte possono essere soggetti a errori o instabilità. Per risolvere questo problema, i metodi Ensemble come Random Forest combinano più alberi decisionali per migliorare le prestazioni predittive e la robustezza contro l'overfitting.

Vantaggi e svantaggi

Gli alberi decisionali offrono diversi vantaggi:

Interpretabilità: La struttura del diagramma di flusso è facile da visualizzare e da spiegare.
Preparazione minima dei dati: Spesso richiedono una minore pre-elaborazione dei dati rispetto ad altre tecniche, gestendo in modo naturale sia i dati numerici che quelli categorici.
Importanza delle caratteristiche: Eseguono implicitamente una selezione delle caratteristiche, indicando quali sono le caratteristiche più influenti nel processo decisionale.

Tuttavia, hanno anche degli svantaggi:

Overfitting: Gli alberi possono diventare eccessivamente complessi e adattarsi troppo ai dati di formazione, non riuscendo a generalizzare bene ai nuovi dati. Tecniche come il Pruning vengono utilizzate per semplificare l'albero e combattere questo fenomeno.
Instabilità: Piccole variazioni nei dati possono portare a strutture ad albero significativamente diverse.
Distorsione: gli alberi possono diventare distorti se alcune classi sono dominanti nel set di dati.

Applicazioni del mondo reale

Gli alberi decisionali vengono applicati in diversi campi:

Diagnosi medica: Assistere i medici prevedendo le malattie in base ai sintomi e all'anamnesi del paziente, fornendo un percorso decisionale chiaro. Ad esempio, possono aiutare a determinare i fattori di rischio per determinate patologie sulla base dei dati clinici(esempio di applicazione nel settore sanitario). Questo si allinea alle applicazioni più ampie dell'IA nell'assistenza sanitaria.
Analisi finanziaria: Utilizzata nel credit scoring per valutare il rischio di una richiesta di prestito in base alle informazioni del richiedente o per prevedere i movimenti del mercato azionario.
Previsione della rinuncia dei clienti: Le aziende utilizzano gli alberi decisionali per identificare i clienti che probabilmente se ne andranno in base ai loro modelli di utilizzo, ai dati demografici e alla cronologia delle interazioni, consentendo strategie di fidelizzazione proattive(vedi esempi su piattaforme come Kaggle).

Confronto con altri algoritmi

Foreste casuali: Pur essendo costruite a partire da alberi decisionali, le Foreste Casuali fanno una media delle previsioni di molti alberi, offrendo in genere una maggiore precisione e una migliore generalizzazione rispetto a un singolo albero.
Macchine vettoriali di supporto (SVM): Le SVM mirano a trovare l'iperpiano ottimale che separa le classi, spesso con buone prestazioni in spazi ad alta dimensionalità ma senza l'interpretabilità diretta degli alberi decisionali.
Reti neurali (NN): Le reti neurali, soprattutto quelle profonde utilizzate in modelli come Ultralytics YOLO per la Computer Vision (CV), possono modellare relazioni altamente complesse e non lineari ma sono tipicamente meno interpretabili ("scatole nere") degli alberi decisionali.

Gli alberi decisionali rimangono un algoritmo fondamentale nel ML grazie alla loro semplicità, interpretabilità e utilità come elementi costitutivi di modelli più complessi. Sono ampiamente implementati in librerie popolari come Scikit-learn.

Albero decisionale

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Una soluzione flessibile di licenze aziendali per alimentare la tua innovazione

Addestra i modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Addestra i modelli di YOLO in modo semplice con Ultralytics HUB

Come funzionano gli alberi decisionali

Tipi e varianti

Vantaggi e svantaggi

Applicazioni del mondo reale

Confronto con altri algoritmi

Leggi altri blog

Unisciti alla comunità di Ultralytics

Albero decisionale

Addestra i modelli YOLO semplicementecon Ultralytics HUB

Una soluzione flessibile di licenze aziendali per alimentare la tua innovazione

Addestra i modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Addestra i modelli di YOLO in modo semplice con Ultralytics HUB

Come funzionano gli alberi decisionali

Tipi e varianti

Vantaggi e svantaggi

Applicazioni del mondo reale

Confronto con altri algoritmi

Leggi altri blog

Unisciti alla comunità di Ultralytics

Addestra i modelli YOLO semplicemente
con Ultralytics HUB