Controllo verde
Link copiato negli appunti

Come utilizzare Ultralytics YOLO11 per la classificazione delle immagini

Scopri come il nuovo modello Ultralytics YOLO11 migliora la classificazione delle immagini, offrendo una maggiore precisione per le attività di agricoltura, vendita al dettaglio e monitoraggio della fauna selvatica.

Supponiamo che un robot stia guardando due gatti, uno nero e uno bianco, e che debba capire quale sia. Per farlo, può utilizzare la classificazione delle immagini, un'attività di computer vision che aiuta a identificare e classificare gli oggetti o le scene in un'immagine. Infatti, grazie ai recenti progressi dell'intelligenza artificiale (AI), la classificazione delle immagini può essere utilizzata in un'ampia gamma di applicazioni che vanno dal monitoraggio degli animali alla produzione e all'agricoltura con il rilevamento delle malattie dei raccolti.

Uno dei più recenti progressi nella classificazione delle immagini è il modelloUltralytics YOLO11 . Presentato all' evento annuale ibridoUltralytics', YOLO Vision 2024 (YV24), YOLO11 è stato progettato per affrontare con facilità e precisione un'ampia gamma di compiti di intelligenza artificiale, tra cui la classificazione delle immagini.

In questo articolo esploreremo i fondamenti della classificazione delle immagini, discuteremo delle applicazioni reali e ti mostreremo come puoi utilizzare il pacchetto YOLO11 per la classificazione delle immagini attraverso il pacchettoUltralytics Python . Vedremo anche come puoi provare le funzionalità diYOLO11 sull'HUB Ultralytics in pochi semplici passi. Iniziamo!

Figura 1. Un esempio di utilizzo di Ultralytics YOLO11 per classificare un gatto persiano.

Che cos'è la classificazione delle immagini?

La classificazione delle immagini funziona assegnando un'etichetta o un tag a un'immagine sulla base di modelli appresi da immagini precedentemente etichettate. Analizzando attentamente i pixel di un'immagine, un modello di computer vision può trovare la migliore corrispondenza per l'immagine. Modelli affidabili come YOLO11 possono gestire questo processo senza problemi. YOLO11L'architettura del modello di Cyber Vision è in grado di elaborare immagini o fotogrammi video quasi istantaneamente, il che lo rende ideale per le applicazioni che necessitano di una classificazione rapida e accurata delle immagini.

Per comprendere veramente la portata della classificazione delle immagini, è utile distinguerla da altri compiti come il rilevamento degli oggetti. Mentre la classificazione delle immagini etichetta un'intera immagine, il rilevamento degli oggetti identifica e localizza ogni oggetto all'interno dell'immagine. 

Figura 2. Un confronto tra la classificazione delle immagini, il rilevamento degli oggetti e la segmentazione delle immagini.

Consideriamo l'immagine di una giraffa. Nella classificazione delle immagini, il modello potrebbe etichettare l'intera immagine semplicemente come una giraffa in base al suo contenuto complessivo. Tuttavia, con il rilevamento degli oggetti, il modello non si limita a identificare la giraffa, ma posiziona anche un riquadro di delimitazione intorno alla giraffa, individuando la sua esatta posizione all'interno dell'immagine.

Ora immagina che la giraffa si trovi vicino a un albero in una savana con altri animali. Un modello di classificazione delle immagini potrebbe etichettare l'intera scena come savana o solo come fauna selvatica. Tuttavia, con il rilevamento degli oggetti, il modello identificherebbe ogni elemento singolarmente, riconoscendo la giraffa, l'albero e gli altri animali, ognuno con le proprie caselle di delimitazione.

YOLO11 Applicazioni di classificazione delle immagini

L'accuratezza e le prestazioni del modello Ultralytics YOLO11 per la classificazione delle immagini lo rendono utile in un'ampia gamma di settori. Esploriamo alcune delle principali applicazioni di YOLO11 nella classificazione delle immagini.

YOLO11 Classificazione delle immagini in agricoltura

La classificazione delle immagini può aiutare a semplificare molte funzioni nel settore agricolo e dell'allevamento. In particolare, utilizzando modelli di classificazione delle immagini come YOLO11, gli agricoltori possono monitorare costantemente lo stato di salute delle loro colture, rilevare gravi malattie e identificare eventuali infestazioni di parassiti con un'elevata precisione. 

Ecco come funziona:

  • Acquisizione di immagini: I dispositivi dell'Internet of Things (IoT), come telecamere e droni, possono essere utilizzati per catturare immagini in tempo reale delle colture da varie angolazioni e posizioni nei campi.
  • Elaborazione: A seconda delle risorse e della connettività disponibili, le immagini possono essere elaborate in loco attraverso l'edge computing o caricate sul cloud per un'analisi più intensiva.
  • Classificazione delle immagini con YOLO11: il modello YOLO11 può analizzare queste immagini per classificare le varie condizioni delle colture. Le classi più comuni possono essere: sane, malate, infestate da parassiti o carenti di sostanze nutritive, aiutando a individuare i problemi specifici che interessano le diverse aree del campo.
  • Generazione di informazioni: Sulla base delle classificazioni, YOLO11 fornisce approfondimenti sugli indicatori di salute delle colture, aiutando gli agricoltori a rilevare i primi segni di malattia, a identificare i punti critici dei parassiti o a individuare le carenze nutritive.
  • Processo decisionale informato: Grazie a queste informazioni, gli agricoltori possono prendere decisioni mirate su irrigazione, fertilizzazione e controllo dei parassiti, applicando le risorse solo dove sono più necessarie.
Figura 3. Un esempio di diverse classi di foglie, da sane a infette.

YOLO11 Classificazione delle immagini nella vendita al dettaglio

La classificazione delle immagini può migliorare significativamente l'esperienza di acquisto al dettaglio, rendendola più personalizzata e facile da usare. I rivenditori possono utilizzare modelli di computer vision addestrati su misura per riconoscere i prodotti presenti nel loro inventario e integrare questa funzionalità nelle loro applicazioni mobili o nei loro siti web. I clienti possono quindi cercare i prodotti semplicemente caricando una foto, rendendo lo shopping più veloce e conveniente.

Una volta che un cliente carica un'immagine in un sistema di ricerca visuale, dietro le quinte accadono diverse cose prima che vengano visualizzati i risultati della ricerca. 

In primo luogo, il rilevamento degli oggetti può essere utilizzato per individuare gli elementi principali dell'immagine, come ad esempio identificare un capo di abbigliamento o un mobile e separarlo dallo sfondo. Successivamente, la classificazione dell'immagine può essere utilizzata per classificare ulteriormente ogni oggetto, riconoscendo se si tratta di una giacca, una camicia, un divano o un tavolo. 

Grazie a queste informazioni, il sistema può individuare prodotti simili disponibili per l'acquisto, il che è particolarmente utile per trovare articoli unici o di tendenza che sono difficili da descrivere con le sole parole. La stessa tecnologia può anche aiutare a semplificare altre attività di vendita al dettaglio, come la gestione dell'inventario, riconoscendo e categorizzando automaticamente gli articoli.

Figura 4. Una piattaforma di ricerca visiva basata sulla classificazione delle immagini in azione.

Monitoraggio della fauna selvatica con la classificazione delle immagini di YOLO11

Tradizionalmente, il monitoraggio degli animali in natura è un compito noioso che richiede l'intervento di molte persone che selezionano e analizzano manualmente migliaia di foto. Grazie a modalità di visione computerizzata come YOLO11, i ricercatori possono monitorare automaticamente gli animali a una velocità maggiore. Le telecamere possono essere posizionate negli habitat naturali per scattare foto. Il modello AI di visione può essere utilizzato per analizzare queste foto e classificare gli animali presenti (se ce ne sono). Un sistema di questo tipo può aiutare i ricercatori a studiare e seguire le popolazioni di animali, i loro modelli di migrazione, ecc.

Un altro modo in cui i modelli di intelligenza artificiale e di computer vision come YOLO11 possono aiutare in questo campo è quello di semplificare il processo di classificazione delle specie in pericolo. Identificando le potenziali specie o categorie di razze a cui un animale può appartenere, questi modelli possono fornire dati essenziali per i ricercatori. Ad esempio, l'Università della Tasmania (UTAS) ha sviluppato un sistema basato sulla classificazione delle immagini per monitorare la fauna selvatica della Tasmania. Le previsioni dei modelli possono aiutare scienziati e ricercatori a tenere d'occhio l'attività e il comportamento degli animali, che possono segnalare minacce come il bracconaggio o la perdita di habitat

Fig 5. YOLO11 prevede le possibili razze a cui potrebbe appartenere un cane.

Prova la classificazione delle immagini con il modello YOLO11

Ora che abbiamo parlato di classificazione delle immagini e abbiamo esplorato alcune delle sue applicazioni. Vediamo come puoi provare la classificazione delle immagini con il nuovo modello YOLO11 . Ci sono due modi semplici per iniziare: utilizzare il pacchettoUltralytics Python oppure Ultralytics HUB. Ti illustreremo entrambe le opzioni.

Eseguire inferenze utilizzando YOLO11

Per iniziare a utilizzare il pacchetto Ultralytics Python , è sufficiente installarlo utilizzando pip, conda o Docker. Se dovessi riscontrare dei problemi, consulta la nostra Guida ai problemi comuni per trovare utili suggerimenti per la risoluzione dei problemi.

Una volta installato il pacchetto, puoi utilizzare il codice seguente per caricare una variante del modello di classificazione delle immagini YOLO11 ed eseguire un'inferenza su un'immagine. Eseguire un'inferenza significa utilizzare un modello addestrato per fare previsioni su nuovi dati non visti. Puoi fare una prova con un'immagine a tua scelta!

Figura 6. Esecuzione di inferenze con il modello YOLO11 .

Formazione di un modello di classificazione personalizzato YOLO11

Puoi anche utilizzare lo stesso pacchetto Python per addestrare un modello di classificazione YOLO11 personalizzato. L'addestramento personalizzato ti permette di mettere a punto un modello YOLO11 per le tue esigenze specifiche. Ad esempio, se stai sviluppando un'applicazione per classificare le diverse razze di gatti, puoi addestrare un modello YOLO11 personalizzato solo per questo scopo.

Il codice qui sotto mostra come caricare e addestrare un modello di classificazione delle immagini YOLO11 . Ti permette di trasferire i pesi pre-addestrati, utilizzando le conoscenze di un modello esistente per aumentare le prestazioni del tuo modello. Puoi specificare un set di dati, come il set di dati "fashion-mnist", che è un noto insieme di immagini in scala di grigi di capi di abbigliamento (camicie, pantaloni, scarpe, ecc.). L'addestramento del modello su questo set di dati gli permette di riconoscere diverse categorie di abbigliamento. Puoi sostituire il dataset "fashion-mnist" con qualsiasi altro dataset adatto al tuo progetto, come ad esempio le razze di gatti o i tipi di piante.

Figura 7. Addestramento personalizzato di un modello YOLO11 per la classificazione delle immagini.

Prova YOLO11 su Ultralytics HUB

Sebbene l'utilizzo del pacchetto Ultralytics sia semplice, richiede una certa conoscenza di Python. Se cerchi un'opzione più facile da usare per i principianti, puoi utilizzare l'HUB di Ultralytics , una piattaforma progettata per rendere semplice e accessibile la formazione e l'implementazione di diversi modelli di YOLO . Per iniziare, dovrai creare un account.

Una volta effettuato l'accesso, vai alla sezione "Modelli" e seleziona il modello YOLO11 per la classificazione delle immagini. Vedrai una serie di modelli di varie dimensioni: nano, piccolo, medio, grande ed extra-large. Dopo aver scelto un modello, puoi caricare un'immagine nella sezione "Anteprima", dove le previsioni appariranno sul lato sinistro della pagina una volta elaborata l'immagine.

Figura 8. Utilizzo di Ultralytics HUB per eseguire un'inferenza.

Punti di forza

YOLO11 offre potenti funzionalità di classificazione delle immagini che aprono nuove possibilità in diversi settori. Dal miglioramento del monitoraggio delle colture in agricoltura, al miglioramento della ricerca dei prodotti nella vendita al dettaglio, fino al supporto della conservazione della fauna selvatica, la velocità e la precisione di YOLO11lo rendono ideale per diverse applicazioni. Grazie alle opzioni di formazione personalizzata tramite il pacchetto Ultralytics Python o di configurazione semplice e senza codice su Ultralytics HUB, gli utenti possono facilmente incorporare YOLO11 nei loro flussi di lavoro. Dato che sempre più industrie adottano soluzioni di intelligenza artificiale, YOLO11 offre uno strumento flessibile e ad alte prestazioni che supporta l'innovazione e i progressi pratici.

Per saperne di più, visita il nostro repository GitHub e partecipa alla nostra comunità. Scopri le applicazioni dell'intelligenza artificiale nelle auto a guida autonoma e nell'assistenza sanitaria sulle nostre pagine dedicate alle soluzioni. 🚀

Logo di FacebookLogo di TwitterLogo di LinkedInSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico