X
YOLO Vision 2024 is here!
YOLO Vision 24
27 settembre 2024
YOLO Vision 24
Free hybrid event
Controllo verde
Link copiato negli appunti

Misurare le prestazioni dell'IA per valutare l'impatto delle tue innovazioni

Puoi monitorare il successo delle tue innovazioni AI con i giusti KPI e metriche di performance. Scopri come monitorare e ottimizzare l'impatto delle applicazioni di IA.

In precedenza abbiamo analizzato come l'IA possa essere utilizzata in diversi settori come quello sanitario, manifatturiero e turistico. Abbiamo anche analizzato come l'IA possa migliorare le attività lavorative di tutti i giorni e abbiamo discusso le principali idee imprenditoriali sull'IA. Tutte queste discussioni portano inevitabilmente alla stessa domanda chiave: come possiamo misurare il successo di queste implementazioni dell'IA? Si tratta di una domanda importante perché la semplice implementazione di soluzioni di IA non è sufficiente. È necessario assicurarsi che queste soluzioni producano effettivamente dei risultati. 

Possiamo misurare le metriche di performance dell'IA per determinare se un modello di IA è davvero efficace nel rendere i processi più efficienti, nel promuovere l'innovazione o nel risolvere i problemi. Concentrandoci sui giusti indicatori di performance (KPI), possiamo capire quanto una soluzione di IA stia funzionando bene e dove potrebbe aver bisogno di miglioramenti.

In questo articolo vedremo come misurare il successo delle implementazioni di IA con i KPI più rilevanti. Parleremo delle differenze tra i KPI aziendali e i KPI di performance dell'IA, analizzeremo le metriche chiave come la precisione e il richiamo e ti aiuteremo a scegliere i KPI migliori per le tue specifiche soluzioni di IA.

La differenza tra i KPI di business e i KPI di performance dell'AI

Figura 1. Confronto tra i KPI aziendali dell'AI e i KPI delle prestazioni dell'AI.

Quando si pensa ai KPI, è naturale pensare che si tratti di metriche aziendali come il ritorno sugli investimenti (ROI), i risparmi sui costi o i ricavi generati, soprattutto quando si parla di AI aziendale. Questi KPI aziendali misurano l'impatto dell'IA sul successo complessivo di un'azienda e si allineano agli obiettivi aziendali più ampi. 

Tuttavia, i KPI di performance dell'IA si concentrano sul funzionamento del sistema stesso, utilizzando parametri come l'accuratezza, la precisione e il richiamo. Entreremo nel dettaglio di queste metriche più avanti, ma in sostanza, mentre i KPI di business mostrano i vantaggi finanziari e strategici dell'IA, i KPI di performance assicurano che un modello di IA stia facendo il suo lavoro in modo efficace.

Alcune metriche possono servire a entrambi gli scopi. Ad esempio, l'aumento dell'efficienza, come la riduzione del tempo o delle risorse necessarie per completare un'attività, può essere sia un KPI di performance (che mostra l'efficacia della soluzione di intelligenza artificiale) sia un KPI aziendale (che misura i risparmi sui costi e i miglioramenti della produttività). La soddisfazione dei clienti è un'altra metrica trasversale. Può riflettere il successo di uno strumento di assistenza clienti basato sull'intelligenza artificiale sia in termini di prestazioni tecniche che di impatto sugli obiettivi aziendali generali.

Comprendere le principali metriche delle prestazioni dell'intelligenza artificiale

Esistono alcune metriche comuni utilizzate per misurare le prestazioni di un modello di intelligenza artificiale. Per prima cosa, daremo un'occhiata alla loro definizione e a come vengono calcolate. Poi vedremo come monitorare queste metriche.

Precisione

La precisione è una metrica che misura l'accuratezza con cui un modello di intelligenza artificiale identifica i veri positivi (casi in cui il modello identifica correttamente un oggetto o una condizione come dovrebbe). Ad esempio, in un sistema di riconoscimento facciale, un vero positivo si verifica quando il sistema riconosce e identifica correttamente il volto di una persona che è stato addestrato a rilevare

Per calcolare la precisione, conta innanzitutto il numero di veri positivi. Puoi poi dividere questo dato per il numero totale di elementi che il modello ha etichettato come positivi. Questo totale include sia le identificazioni corrette che gli errori, chiamati falsi positivi. In sostanza, la precisione indica quante volte il modello è corretto quando afferma di aver riconosciuto qualcosa.


Precision = True Positives / (True Positives + False Positives)

Figura 2. Comprendere la precisione.

È particolarmente importante negli scenari in cui le conseguenze dei falsi positivi possono essere costose o dannose. Ad esempio, nella produzione automatizzata, un alto tasso di precisione indica che il sistema è in grado di segnalare con maggiore precisione i prodotti difettosi e di evitare l'inutile scarto o la rilavorazione di articoli buoni. Un altro buon esempio è la sorveglianza della sicurezza. Un'elevata precisione aiuta a minimizzare i falsi allarmi e a concentrarsi solo sulle minacce reali che richiedono una risposta di sicurezza.

Richiamo

Il richiamo aiuta a misurare la capacità di un modello di intelligenza artificiale di identificare tutte le istanze rilevanti, o veri positivi, all'interno di un set di dati. In parole povere, rappresenta la capacità di un sistema di intelligenza artificiale di catturare tutti i casi reali di una condizione o di un oggetto che è stato progettato per rilevare. Il richiamo può essere calcolato dividendo il numero di rilevamenti corretti per il numero totale di casi positivi che avrebbero dovuto essere rilevati (comprende sia i casi che il modello ha identificato correttamente sia quelli che ha mancato).


Recall = True Positives / (True Positives + False Negatives)

Consideriamo un sistema di imaging medico abilitato all'intelligenza artificiale utilizzato per il rilevamento dei tumori. Il richiamo, in questo contesto, riflette la percentuale di casi reali di cancro che il sistema identifica correttamente. Un'alta percentuale di identificazione è fondamentale in questi scenari, perché la mancata diagnosi di un cancro può portare a gravi conseguenze per la cura del paziente.

Precisione contro richiamo

Precisione e richiamo sono due facce della stessa medaglia quando si tratta di valutare le prestazioni di un modello di intelligenza artificiale e spesso richiedono un equilibrio. Il problema è che il miglioramento di una metrica può spesso andare a scapito dell'altra. 

Supponiamo che tu spinga per una maggiore precisione. Il modello potrebbe diventare più selettivo ed essere in grado di identificare solo i positivi di cui è molto sicuro. D'altra parte, se l'obiettivo è migliorare il richiamo, il modello potrebbe identificare un maggior numero di positivi, ma questo potrebbe includere un maggior numero di falsi positivi e finire per ridurre la precisione. 

Il segreto è trovare il giusto equilibrio tra precisione e richiamo in base alle esigenze specifiche della tua applicazione. Uno strumento utile a questo scopo è la curva precisione-richiamo, che mostra la relazione tra le due metriche a diverse soglie. Analizzando questa curva, puoi determinare il punto ottimale in cui il modello si comporta meglio per il tuo caso d'uso specifico. Capire il compromesso è utile per mettere a punto i modelli di intelligenza artificiale in modo da ottenere prestazioni ottimali per i casi d 'uso previsti.

Figura 3. Un esempio di curva di precisione-richiamo.

Precisione media (mAP)

La precisione media (mAP) è una metrica utilizzata per valutare le prestazioni dei modelli di intelligenza artificiale per compiti come il rilevamento di oggetti, in cui il modello deve identificare e classificare più oggetti all'interno di un'immagine. La mAP fornisce un singolo punteggio che mostra le prestazioni del modello in tutte le diverse categorie che è stato addestrato a riconoscere. Vediamo come viene calcolato.

L'area sotto la curva di precisione-richiamo indica la precisione media (AP) per quella classe. L'AP misura l'accuratezza con cui il modello fa previsioni per una specifica classe, considerando sia la precisione che il richiamo attraverso vari livelli di confidenza (i livelli di confidenza si riferiscono a quanto il modello è sicuro delle sue previsioni). Una volta calcolato l'AP per ogni classe, l'mAP viene determinato calcolando la media di questi valori AP per tutte le classi.

Figura 4. La precisione media delle varie classi.

La mAP è utile in applicazioni come la guida autonoma, dove è necessario rilevare simultaneamente più oggetti, come pedoni, veicoli e segnali stradali. Un punteggio elevato di mAP significa che il modello ha un rendimento costante in tutte le categorie, rendendolo affidabile e preciso in un'ampia gamma di scenari.

Calcola le metriche delle prestazioni senza sforzo

Le formule e i metodi di calcolo delle metriche chiave delle prestazioni dell'IA possono sembrare scoraggianti. Tuttavia, strumenti come il pacchettoUltralytics possono rendere tutto ciò semplice e veloce. Sia che tu stia lavorando al rilevamento di oggetti, alla segmentazione o alla classificazione, Ultralytics fornisce le utility necessarie per calcolare rapidamente metriche importanti come la precisione, il richiamo e la precisione media (mAP).

Per iniziare a calcolare le metriche delle prestazioni con Ultralytics, puoi installare il pacchetto Ultralytics come mostrato di seguito.


pip install ultralytics

Per questo esempio, caricheremo un modello preaddestrato di YOLOv8 e lo useremo per convalidare le metriche delle prestazioni, ma puoi caricare qualsiasi modello supportato fornito da Ultralytics. Ecco come fare:


from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")

Una volta caricato il modello, puoi eseguire la convalida sul tuo set di dati. Il seguente frammento di codice ti aiuterà a calcolare diverse metriche di performance, tra cui precisione, richiamo e mAP:


# Run the evaluation
results = model.val()

# Print specific metrics
print("Mean average precision:", results.box.map)
print("Precision:", results.box.p)
print("Recall:", results.box.r)

L'utilizzo di strumenti come Ultralytics rende il calcolo delle metriche di performance molto più semplice, così puoi dedicare più tempo a migliorare il tuo modello e meno a preoccuparti dei dettagli del processo di valutazione.

Come si misurano le prestazioni dell'IA dopo l'implementazione?

Quando si sviluppa un modello di intelligenza artificiale, è facile testarne le prestazioni in un ambiente controllato. Tuttavia, una volta che il modello viene distribuito, le cose possono diventare più complicate. Fortunatamente esistono strumenti e best practice che possono aiutarti a monitorare la tua soluzione di IA dopo la distribuzione

Strumenti come Prometheus, Grafana ed Evidently AI sono progettati per monitorare costantemente le prestazioni del tuo modello. Possono fornire approfondimenti in tempo reale, rilevare anomalie e avvisare di eventuali problemi. Questi strumenti vanno oltre il monitoraggio tradizionale offrendo soluzioni automatizzate e scalabili che si adattano alla natura dinamica dei modelli AI in produzione.

Per misurare il successo del tuo modello di IA dopo l'implementazione, ecco alcune best practice da seguire:

  • Stabilisci delle chiare metriche di performance: Stabilisci delle metriche chiave come l'accuratezza, la precisione e il tempo di risposta per verificare regolarmente l'efficacia del tuo modello.
  • Controlla regolarmente la deriva dei dati: Tieni d'occhio i cambiamenti nei dati che il tuo modello sta trattando, perché se non vengono gestiti correttamente possono influenzare le sue previsioni.
  • Effettuare test A/B: Utilizza i test A/B per confrontare le prestazioni del tuo modello attuale con quelle di nuove versioni o modifiche. In questo modo potrai valutare quantitativamente i miglioramenti o le regressioni nel comportamento del modello.
  • Documenta e verifica le prestazioni: Tieni un registro dettagliato delle metriche delle prestazioni e delle modifiche apportate al tuo sistema di IA. È fondamentale per gli audit, la conformità e il miglioramento dell'architettura del modello nel tempo.

La selezione di KPI ottimali per l'intelligenza artificiale è solo l'inizio

Il successo dell'implementazione e della gestione di una soluzione di IA dipende dalla scelta dei giusti KPI e dal loro aggiornamento. In generale, è fondamentale scegliere delle metriche che evidenzino l'efficacia della soluzione di IA dal punto di vista tecnico e dell'impatto sul business. Quando le cose cambiano, che si tratti di progressi tecnologici o di cambiamenti nella strategia aziendale, è importante rivedere e modificare questi KPI. 

Mantenendo dinamiche le tue valutazioni delle prestazioni, puoi mantenere il tuo sistema di AI pertinente ed efficace. Tenendo sotto controllo queste metriche, otterrai informazioni preziose che ti aiuteranno a migliorare le tue operazioni. Un approccio proattivo garantisce che i tuoi sforzi in materia di IA siano davvero validi e contribuiscano a far progredire la tua azienda!

Unisciti alla nostra comunità e innova con noi! Esplora il nostro repository GitHub per vedere i nostri progressi nel campo dell'IA. Scopri come stiamo rimodellando settori come quello manifatturiero e sanitario con una tecnologia AI all'avanguardia. 🚀

Logo di FacebookLogo di TwitterLogo di LinkedInSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico