Come utilizzare Ultralytics YOLO11 per la classificazione delle immagini

Abirami Vina

4 minuti di lettura

11 novembre 2024

Scoprite come il nuovo modello Ultralytics YOLO11 migliora la classificazione delle immagini, offrendo una maggiore precisione per le attività di agricoltura, vendita al dettaglio e monitoraggio della fauna selvatica.

Supponiamo che un robot stia guardando due gatti, uno nero e uno bianco, e che debba capire quale sia. Per farlo, può utilizzare la classificazione delle immagini, un'attività di computer vision che aiuta a identificare e classificare gli oggetti o le scene in un'immagine. Grazie ai recenti progressi dell'intelligenza artificiale (AI), la classificazione delle immagini può essere utilizzata in un'ampia gamma di applicazioni che vanno dal monitoraggio degli animali alla produzione e all'agricoltura con il rilevamento delle malattie delle colture.

Uno degli ultimi progressi nella classificazione delle immagini è il modello YOLO11 di Ultralytics. Presentato in occasione dell'evento ibrido annuale di Ultralytics, YOLO Vision 2024 (YV24), YOLO11 è progettato per affrontare con facilità e precisione un'ampia gamma di compiti di Vision AI, tra cui la classificazione delle immagini.

In questo articolo esploreremo i fondamenti della classificazione delle immagini, discuteremo le applicazioni reali e vi mostreremo come potete utilizzare YOLO11 per la classificazione delle immagini attraverso il pacchetto Ultralytics Python. Inoltre, vedremo come provare le funzionalità di YOLO11 sull'HUB Ultralytics in pochi semplici passi. Iniziamo!

__wf_reserved_inherit
Figura 1. Un esempio di utilizzo di Ultralytics YOLO11 per classificare un gatto persiano.

Che cos'è la classificazione delle immagini?

La classificazione delle immagini funziona assegnando un'etichetta o un tag a un'immagine in base a modelli appresi da immagini precedentemente etichettate. Analizzando attentamente i pixel di un'immagine, un modello di computer vision può trovare la migliore corrispondenza per l'immagine. Modelli affidabili come YOLO11 possono gestire questo processo senza problemi. L'architettura del modello di YOLO11 consente di elaborare immagini o fotogrammi video quasi istantaneamente, rendendolo ideale per le applicazioni che richiedono una classificazione rapida e accurata delle immagini.

Per comprendere veramente la portata della classificazione delle immagini, è utile distinguerla da altre attività come il rilevamento degli oggetti. Mentre la classificazione delle immagini etichetta un'intera immagine, il rilevamento degli oggetti identifica e localizza ogni oggetto all'interno dell'immagine. 

__wf_reserved_inherit
Figura 2. Confronto tra classificazione delle immagini, rilevamento degli oggetti e segmentazione delle immagini.

Consideriamo l'immagine di una giraffa. Nella classificazione delle immagini, il modello potrebbe etichettare l'intera immagine semplicemente come una giraffa, in base al suo contenuto complessivo. Tuttavia, nel caso del rilevamento di oggetti, il modello non si limita a identificare la giraffa, ma posiziona anche un riquadro di delimitazione intorno alla giraffa, individuando la sua esatta posizione all'interno dell'immagine.

Immaginiamo ora la giraffa vicino a un albero in una savana con altri animali. Un modello di classificazione delle immagini potrebbe etichettare l'intera scena come savana o solo come fauna selvatica. Tuttavia, con il rilevamento degli oggetti, il modello identificherebbe ogni elemento singolarmente, riconoscendo la giraffa, l'albero e gli altri animali, ciascuno con le proprie caselle di delimitazione.

Applicazioni di classificazione delle immagini YOLO11

L'accuratezza e le prestazioni del modello YOLO11 di Ultralytics per la classificazione delle immagini lo rendono utile in un'ampia gamma di settori. Esploriamo alcune delle principali applicazioni di YOLO11 nella classificazione delle immagini.

Classificazione delle immagini YOLO11 in agricoltura

La classificazione delle immagini può aiutare a semplificare molte funzioni nel settore agricolo e dell'allevamento. In particolare, utilizzando modelli di classificazione delle immagini come YOLO11, gli agricoltori possono monitorare costantemente lo stato di salute delle loro colture, rilevare gravi malattie e identificare eventuali infestazioni di parassiti con elevata precisione. 

Ecco come funziona:

  • Acquisizione di immagini: I dispositivi dell'Internet of Things (IoT), come telecamere e droni, possono essere utilizzati per catturare immagini in tempo reale delle colture da varie angolazioni e posizioni nei campi.
  • Elaborazione: A seconda delle risorse e della connettività disponibili, le immagini possono essere elaborate in loco tramite l'edge computing o caricate nel cloud per un'analisi più intensiva.
  • Classificazione delle immagini con YOLO11: il modello YOLO11 può analizzare queste immagini per classificare le varie condizioni delle colture. Le classi più comuni possono essere sane, malate, infestate da parassiti o carenti di nutrienti, aiutando a individuare i problemi specifici che interessano le diverse aree del campo.
  • Generazione di informazioni: Sulla base delle classificazioni, YOLO11 fornisce approfondimenti sugli indicatori di salute delle colture, aiutando gli agricoltori a rilevare i primi segni di malattia, a identificare i punti caldi dei parassiti o a individuare le carenze di nutrienti.
  • Processo decisionale informato: Grazie a queste informazioni, gli agricoltori possono prendere decisioni mirate su irrigazione, fertilizzazione e controllo dei parassiti, applicando le risorse solo dove sono più necessarie.
__wf_reserved_inherit
Figura 3. Un esempio di diverse classi di foglie, da sane a infette.

Classificazione delle immagini YOLO11 nella vendita al dettaglio

La classificazione delle immagini può migliorare significativamente l'esperienza di acquisto al dettaglio, rendendola più personalizzata e facile da usare. I rivenditori possono utilizzare modelli di visione computerizzata addestrati su misura per riconoscere i prodotti presenti nel loro inventario e integrare questa funzionalità nelle loro applicazioni mobili o nei loro siti web. I clienti possono quindi cercare i prodotti semplicemente caricando una foto, rendendo gli acquisti più veloci e convenienti.

Una volta che un cliente carica un'immagine su un sistema di ricerca visuale, dietro le quinte accadono diverse cose prima che i risultati della ricerca vengano visualizzati. 

In primo luogo, il rilevamento degli oggetti può essere utilizzato per individuare gli elementi principali dell'immagine, come identificare un capo di abbigliamento o un mobile e separarlo dallo sfondo. Successivamente, la classificazione dell'immagine può essere utilizzata per classificare ulteriormente ogni elemento, riconoscendo se si tratta di una giacca, una camicia, un divano o un tavolo. 

Grazie a queste informazioni, il sistema può individuare prodotti simili disponibili per l'acquisto, il che è particolarmente utile per trovare articoli unici o di tendenza difficili da descrivere con le sole parole. La stessa tecnologia può anche aiutare a semplificare altre attività di vendita al dettaglio, come la gestione dell'inventario, riconoscendo e categorizzando automaticamente gli articoli.

__wf_reserved_inherit
Figura 4. Una piattaforma di ricerca visiva basata sulla classificazione delle immagini in azione.

Monitoraggio della fauna selvatica con la classificazione delle immagini YOLO11

Tradizionalmente, il monitoraggio degli animali in natura è un compito noioso che coinvolge molte persone che selezionano e analizzano manualmente migliaia di foto. Con modalità di visione computerizzata come YOLO11, i ricercatori possono monitorare automaticamente gli animali a un ritmo più veloce. Le telecamere possono essere posizionate negli habitat naturali per scattare foto. Il modello AI di visione può quindi essere utilizzato per analizzare queste foto e classificare gli animali al loro interno (se presenti). Questo sistema può aiutare i ricercatori a studiare e seguire le popolazioni di animali, i loro modelli di migrazione, ecc.

Un altro modo in cui i modelli di intelligenza artificiale e di computer vision come YOLO11 possono aiutare in questo campo è quello di semplificare il processo di classificazione delle specie in pericolo. Identificando le potenziali specie o categorie di razze a cui un animale può appartenere, questi modelli possono fornire dati essenziali per i ricercatori. Ad esempio, l'Università della Tasmania (UTAS) ha sviluppato un sistema basato sulla classificazione delle immagini per monitorare la fauna selvatica della Tasmania. Le previsioni dei modelli possono aiutare scienziati e ricercatori a tenere d'occhio l'attività e il comportamento degli animali, che possono segnalare minacce come il bracconaggio o la perdita di habitat

__wf_reserved_inherit
Figura 5. YOLO11 prevede le possibili razze a cui potrebbe appartenere un cane.

Prova di classificazione delle immagini con il modello YOLO11

Ora che abbiamo discusso di cosa sia la classificazione delle immagini e abbiamo esplorato alcune delle sue applicazioni. Vediamo come provare la classificazione delle immagini con il nuovo modello YOLO11. Ci sono due modi semplici per iniziare: utilizzando il pacchetto Ultralytics Python o tramite Ultralytics HUB. Vediamo entrambe le opzioni.

Esecuzione di inferenze con YOLO11

Per iniziare a utilizzare il pacchetto Ultralytics Python, è sufficiente installarlo utilizzando pip, conda o Docker. In caso di problemi, consultate la nostra Guida ai problemi comuni per trovare suggerimenti utili per la risoluzione dei problemi.

Una volta installato il pacchetto, è possibile utilizzare il codice seguente per caricare una variante del modello di classificazione delle immagini YOLO11 ed eseguire un'inferenza su un'immagine. Eseguire un'inferenza significa usare un modello addestrato per fare previsioni su nuovi dati non visti. Potete fare una prova con un'immagine a vostra scelta!

__wf_reserved_inherit
Figura 6. Esecuzione di inferenze con il modello YOLO11.

Formazione di un modello di classificazione YOLO11 personalizzato

È possibile utilizzare lo stesso pacchetto Python per addestrare un modello di classificazione YOLO11 personalizzato. L'addestramento personalizzato consente di mettere a punto un modello YOLO11 per le proprie esigenze specifiche. Ad esempio, se state sviluppando un'applicazione per classificare le diverse razze di gatti, potete addestrare un modello YOLO11 su misura per questo scopo.

Il codice seguente mostra come caricare e addestrare un modello di classificazione delle immagini YOLO11. Consente di trasferire i pesi pre-addestrati, utilizzando le conoscenze di un modello esistente per aumentare le prestazioni del proprio modello. È possibile specificare un set di dati, come il set di dati "fashion-mnist", che è un noto insieme di immagini in scala di grigi di capi di abbigliamento (camicie, pantaloni, scarpe, ecc.). L'addestramento del modello su questo set di dati gli consente di riconoscere diverse categorie di abbigliamento. È possibile sostituire "fashion-mnist" con qualsiasi set di dati adatto al proprio progetto, come le razze di gatti o i tipi di piante.

__wf_reserved_inherit
Figura 7. Addestramento personalizzato di un modello YOLO11 per la classificazione delle immagini.

Prova YOLO11 su Ultralytics HUB

Sebbene l'utilizzo del pacchetto Ultralytics sia semplice, richiede una certa conoscenza di Python. Se siete alla ricerca di un'opzione più semplice per i principianti, potete utilizzare Ultralytics HUB, una piattaforma progettata per rendere semplice e accessibile la formazione e la distribuzione di diversi modelli YOLO. Per iniziare, è necessario creare un account.

Una volta effettuato l'accesso, passare alla sezione "Modelli" e selezionare il modello YOLO11 per la classificazione delle immagini. È disponibile una serie di modelli di diverse dimensioni: nano, piccolo, medio, grande ed extra-large. Dopo aver scelto un modello, è possibile caricare un'immagine nella sezione "Anteprima", dove le previsioni appariranno sul lato sinistro della pagina una volta elaborata l'immagine.

__wf_reserved_inherit
Figura 8. Utilizzo di Ultralytics HUB per eseguire un'inferenza.

Punti di forza

YOLO11 offre potenti capacità di classificazione delle immagini che aprono nuove possibilità in diversi settori. Dal miglioramento del monitoraggio delle colture in agricoltura, alla ricerca di prodotti nella vendita al dettaglio, fino al supporto della conservazione della fauna selvatica, la velocità e la precisione di YOLO11 lo rendono ideale per diverse applicazioni. Grazie alle opzioni di formazione personalizzata tramite il pacchetto Python di Ultralytics o alla configurazione semplice e senza codice su Ultralytics HUB, gli utenti possono incorporare facilmente YOLO11 nei loro flussi di lavoro. Mentre un numero sempre maggiore di industrie abbraccia le soluzioni di intelligenza artificiale, YOLO11 offre uno strumento flessibile e ad alte prestazioni che supporta l'innovazione e i progressi pratici.

Per saperne di più, visitate il nostro repository GitHub e partecipate alla nostra comunità. Esplorate le applicazioni dell'intelligenza artificiale nelle auto a guida autonoma e nell'assistenza sanitaria sulle nostre pagine dedicate alle soluzioni. 🚀

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti