Controllo verde
Link copiato negli appunti

SharkEye utilizza Ultralytics YOLOv8 per il rilevamento degli oggetti

Scopri come SharkEye, presentato a YOLO Vision 2024, sfrutta Ultralytics YOLOv8 per il rilevamento di oggetti in tempo reale e la sicurezza in spiaggia.

Monitorare gli animali nel loro habitat naturale, che si tratti di bestiame al pascolo in una fattoria o di squali che si muovono vicino alla riva, è sempre stato importante per la loro sicurezza e il loro benessere. Tuttavia, osservarli manualmente non è facile. Spesso richiede ore di pazienza e un'attenta concentrazione, poiché gli osservatori devono osservare da vicino qualsiasi cambiamento di comportamento o movimento. Anche in questo caso, è facile perdere segnali sottili ma importanti.

Grazie all'intervento dell'intelligenza artificiale (AI), questo processo sta diventando più veloce, più intelligente e molto più efficiente, riducendo lo sforzo degli osservatori umani e migliorando la precisione. In particolare, la computer vision può essere utilizzata per seguire gli animali, individuare i pericoli e prendere decisioni in tempo reale. Compiti che un tempo richiedevano ore possono ora essere svolti in pochi minuti, aprendo nuovi modi per comprendere il comportamento degli animali.

A YOLO Vision 2024 (YV24), un evento ibrido annuale ospitato da Ultralytics, esperti e innovatori si sono riuniti per esplorare il modo in cui l'IA affronta le sfide quotidiane. Tra gli argomenti presentati vi sono i progressi nel rilevamento di oggetti in tempo reale e nel monitoraggio degli animali, a dimostrazione di come l'IA stia migliorando la sicurezza e l'efficienza in vari settori.

Uno dei momenti salienti dell'evento è stato l'intervento di Jim Griffin, fondatore di AI Master Group, che ha dimostrato come Vision AI stia rendendo più sicure le spiagge individuando gli squali prima che si avvicinino troppo alla riva. Ha spiegato come hanno utilizzato Ultralytics YOLOv8un modello di visione computerizzata all'avanguardia, per identificare con precisione gli squali in tempo reale, anche in condizioni difficili come onde agitate, riflessi e ostacoli subacquei.

In questo articolo daremo un'occhiata più da vicino al progetto SharkEye e condivideremo gli spunti interessanti del discorso di Jim.

Conoscere SharkEye: Un'applicazione di computer vision

Jim ha iniziato il suo intervento presentando Padaro Beach, una nota destinazione per il surf in California dove surfisti e squali spesso condividono le stesse acque. Sottolineando la vera sfida dell'individuazione degli squali, ha detto: "Ovviamente è facile individuare uno squalo se ti morde, quindi quello che volevamo fare era identificare gli squali in anticipo".

Figura 1. Jim sul palco di YOLO Vision 2024.

SharkEye è stato creato per affrontare questo problema, con il supporto dell'Università della California, Santa Barbara. Jim ha descritto come sono stati utilizzati droni con telecamere AI ad alta risoluzione per volare a circa 200 piedi sopra l'acqua, scansionando l'oceano in tempo reale.

Se viene individuato uno squalo, gli avvisi via SMS raggiungono circa 80 persone, tra cui bagnini, proprietari di negozi di surf e chiunque si sia iscritto agli aggiornamenti. Jim ha sottolineato come queste notifiche istantanee permettano di reagire rapidamente, rendendo più sicuri i frequentatori delle spiagge quando uno squalo si avvicina alla riva.

Jim ha anche ricordato che SharkEye dispone di un cruscotto in tempo reale in cui gli utenti possono vedere le statistiche di rilevamento degli squali. Per esempio, in 12 settimane il sistema ha individuato due squali grandi e 15 piccoli, con una media di poco più di uno squalo a settimana.

Ha poi presentato Neil Nathan, lo scienziato che ha guidato gli sforzi di SharkEye. Nonostante abbia una formazione in studi ambientali piuttosto che in informatica, Nathan ha guidato con successo il progetto. Jim ha sottolineato come i moderni strumenti di intelligenza artificiale, come quelli utilizzati in SharkEye, siano progettati per essere accessibili, consentendo a persone con un background non tecnico di sviluppare soluzioni d'impatto.

Utilizzo di Ultralytics YOLOv8 per rilevare gli squali

Approfondendo i dettagli, Jim ha spiegato cosa c'è sotto il cofano di SharkEye e come la soluzione per il rilevamento degli squali non si limiti a un semplice compito di rilevamento di oggetti. Doveva affrontare condizioni dinamiche e imprevedibili come le alghe galleggianti che potevano essere facilmente scambiate per squali. A differenza dell'individuazione di un oggetto fermo, l'identificazione di uno squalo richiede precisione e adattabilità, rendendo YOLOv8 la scelta ideale.

Un altro vantaggio di YOLOv8 è che può essere implementato su un drone senza fare affidamento sui server cloud. Jim ha spiegato come questo approccio abbia permesso a SharkEye di inviare avvisi immediati, una parte essenziale per garantire risposte tempestive in condizioni oceaniche imprevedibili.

Rilevamento degli oggetti con sole sei righe di codice

Dopo aver illustrato il funzionamento di SharkEye e lo sforzo collaborativo che c'è dietro, Jim ha mostrato una demo dal vivo.

Jim Griffin ha iniziato la sua dimostrazione dal vivo guidando il pubblico attraverso un esempio familiare: un frammento di codice "hello world" per i modelliUltralytics YOLO . Con sole sei righe di codice Python , ha mostrato come un modello Ultralytics YOLOv8 pre-addestrato possa rilevare senza problemi un autobus in un'immagine. 

Figura 2. Una dimostrazione di Jim a YOLO Vision 2024.

La sua dimostrazione ha utilizzato il modello YOLOv8 Nano, una versione leggera per dispositivi a bassa potenza come i droni. Lo stesso modello è stato utilizzato in SharkEye per il rilevamento degli squali in tempo reale. 

Per fornire un contesto più ampio, Jim ha detto che il modello della demo è stato addestrato su COCO128, un sottoinsieme più piccolo del dataset COCO, ampiamente utilizzato . Il dataset COCO contiene oltre 20.000 immagini di 80 diverse categorie di oggetti. Mentre COCO128 funziona bene per le dimostrazioni veloci, Jim ha sottolineato che SharkEye aveva bisogno di qualcosa di più robusto, un dataset per il rilevamento degli squali specifico per le applicazioni, in grado di gestire le complessità degli scenari reali.

Addestramento personalizzato di YOLOv8 per SharkEye 

Secondo Jim, la parte più difficile del progetto SharkEye non è stata l'addestramento del modello AI, ma la raccolta dei dati giusti. Ha commentato: "Il lavoro principale di questo progetto non è stata l'intelligenza artificiale. Il lavoro principale di questo progetto è stato far volare quei droni per cinque anni, raccogliere le immagini da quei video e etichettarle in modo appropriato".

Ha descritto come il team ha raccolto 15.000 immagini presso la spiaggia di Padaro. Ogni immagine doveva essere etichettata manualmente per distinguere tra squali, alghe e altri oggetti presenti nell'acqua. Sebbene il processo sia stato lento e impegnativo, ha gettato le basi per tutto ciò che è seguito.

Figura 3. Utilizzo di droni per catturare immagini di squali per il rilevamento di oggetti in tempo reale.

Una volta pronto il set di dati, Ultralytics YOLOV8 è stato addestrato su misura. Jim ha dichiarato: "L'addestramento vero e proprio non è stata la parte più difficile: ci sono volute solo 20 ore su GPU T4 [unità di elaborazione grafica]". Ha anche aggiunto che il tempo si sarebbe potuto ridurre a meno di cinque ore con hardware più potente, come le GPU A100.

Valutazione di SharkEye: Precisione più che richiamo

Poi, Jim ha parlato di come sono state valutate le prestazioni di SharkEye. Ha illustrato che il parametro chiave era la precisione, ossia l'accuratezza con cui il sistema identificava gli squali reali. Con SharkEye che ha raggiunto un impressionante 92% di precisione, il modello si è dimostrato molto efficace nell'identificare accuratamente gli squali nel complesso ambiente oceanico.

Approfondendo l'importanza della precisione, Jim ha chiarito perché in questo caso la precisione è più importante del richiamo. "La maggior parte delle volte le persone sono interessate al richiamo, soprattutto in settori come l'assistenza sanitaria dove la mancanza di un caso positivo può essere critica. Ma in questo caso non sapevamo quanti squali ci fossero in giro, quindi ci interessava la precisione", ha spiegato. SharkEye ha fatto in modo che i falsi allarmi fossero ridotti al minimo concentrandosi sulla precisione, rendendo più facile per i bagnini e gli altri soccorritori intervenire rapidamente.

Figura 4. Jim presenta SharkEye a YOLO Vision 2024.

Ha concluso il suo intervento confrontando l'IA con le prestazioni umane, notando che la precisione del 92% di SharkEye supera di gran lunga il 60% di precisione degli esperti umani. Ha sottolineato questo divario dicendo: "È perché siamo umani. Per quanto esperti possiamo essere io e te, se dobbiamo stare seduti davanti a uno schermo tutto il giorno a cercare squali, prima o poi lasceremo vagare la mente". A differenza delle persone, i modelli di intelligenza artificiale non si stancano e non si distraggono, rappresentando una soluzione affidabile per le attività che richiedono un monitoraggio continuo.

Ultralytics YOLO11: l'ultimo YOLO

Un'intrigante citazione tratta dall'intervento di Jim Griffin, "Sei righe di codice potrebbero salvarti la vita un giorno", coglie perfettamente quanto l'intelligenza artificiale sia diventata avanzata ma accessibile. I modelliYOLO di Ultralytics sono stati creati con questo obiettivo, rendendo la tecnologia di computer vision all'avanguardia accessibile a sviluppatori e aziende di ogni dimensione. Ultralytics YOLO11 si basa su questo principio con inferenze più rapide e una maggiore precisione. 

Ecco una rapida panoramica di ciò che contraddistingue YOLO11 :

  • Architettura riprogettata: L'architettura migliorata di backbone e neck consente una migliore estrazione delle caratteristiche e una maggiore precisione.
  • Facilità d'uso: È possibile accedervi tramite strumenti di codifica Python o senza codice come Ultralytics HUB.
  • Flessibilità tra i vari compiti: YOLO11 supporta attività di computer vision come il rilevamento di oggetti, la segmentazione di istanze, la classificazione di immagini, il tracking, la stima della posa e le bounding box orientate (OBB).
  • Accuratezza migliorata: YOLO11 raggiunge una precisione media (mAP) superiore del 22% rispetto a YOLOv8m sul set di dati COCO, offrendo rilevamenti più precisi.

Queste caratteristiche rendono YOLO11 ideale per il monitoraggio del comportamento degli animali in ambienti dinamici, sia in fattoria che in natura.

Punti di forza

I progressi nell'IA della visione stanno rendendo più facile affrontare le sfide del mondo reale, fornendo strumenti pratici per vari settori. Ad esempio, modelli di computer vision come YOLO11 possono essere utilizzati per il monitoraggio e la localizzazione in tempo reale degli animali, anche in condizioni difficili. 

Il keynote di Jim Griffin a YV24 ha illustrato come YOLOv8 possa essere utilizzato per risolvere problemi complessi con un minimo di codifica. Il progetto SharkEye, che combina i droni con l'intelligenza artificiale per rilevare gli squali in tempo reale, ha mostrato come la tecnologia può migliorare la sicurezza sulle spiagge. 

Si è trattato di un affascinante caso di studio su come l'IA accessibile permetta a persone di diversa estrazione di creare soluzioni efficaci. Con la sua continua evoluzione, l'IA sta trasformando i settori industriali e rende possibile ai singoli individui sfruttare il suo potenziale per rendere il mondo più sicuro, più intelligente e più efficiente.

Entra a far parte della nostra comunità ed esplora il nostro repository GitHub per approfondire il tema dell'IA. Dalla computer vision in agricoltura all'IA nelle auto a guida autonoma, scopri come queste tecnologie stanno guidando l'innovazione. Scopri le nostre opzioni di licenza per iniziare i tuoi progetti di IA oggi stesso!

Logo di FacebookLogo di TwitterLogo di LinkedInSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico