Unisciti a noi per rivedere il keynote di David Scott su YOLO Vision 2024 sull'analisi del comportamento guidata dall'intelligenza artificiale e le sue applicazioni reali in settori come l'allevamento.
Per molti anni, le innovazioni nel campo della computer vision si sono concentrate su compiti come il rilevamento degli oggetti, ovvero l'identificazione di oggetti come un cane o un'auto in immagini e video. Questi approcci hanno consentito applicazioni in settori come i veicoli autonomi, la produzione e la sanità.
Tuttavia, questi compiti spesso si concentrano solo sull'identificazione di un oggetto. E se i sistemi Vision AI potessero fare un passo avanti? Ad esempio, invece di rilevare semplicemente un cane, potrebbero capire che il cane sta inseguendo una palla o che un'auto sta frenando improvvisamente perché un pedone sta attraversando. Questo passaggio dal riconoscimento di base alla comprensione contestuale rappresenta una svolta importante verso un'intelligenza artificiale comportamentale più intelligente e consapevole del contesto.
A YOLO Vision 2024 (YV24), l'evento ibrido annuale di Ultralyticsche celebra i progressi della Vision AI, il concetto di analisi del comportamento guidata dall'AI è stato al centro dell'attenzione durante un interessante intervento di David Scott, CEO di The Main Branch.
Nel suo intervento, David ha esplorato il passaggio dalle attività di computer vision di base al tracciamento comportamentale. Con oltre 25 anni di esperienza nella realizzazione di applicazioni tecnologiche all'avanguardia, ha mostrato l'impatto di questo salto. Ha sottolineato come la decodifica di schemi e comportamenti stia rimodellando settori come l'agricoltura e il benessere degli animali.
In questo articolo, ripercorreremo i punti salienti dell'intervento di David ed esploreremo come il tracciamento comportamentale renda l'IA più pratica.
David Scott ha iniziato il suo keynote con un coraggioso controllo della realtà e ha detto: "Un mio collega dice spesso: 'La scienza non vende', il che offende molti di noi qui perché ci piace molto la scienza. L'intelligenza artificiale è davvero fantastica, perché la gente non dovrebbe comprarla? Ma la realtà è che le persone non vogliono comprarla solo perché noi pensiamo che sia fantastica; hanno bisogno di un motivo per comprarla".
Ha poi spiegato che nella sua azienda, The Main Branch, l'attenzione è sempre rivolta a risolvere problemi reali con l'IA, non solo a mostrarne le capacità. Molti clienti vengono a parlarci di come utilizzare l'IA in generale, ma per lui si tratta di un approccio arretrato: è come avere una soluzione senza un problema. Invece, l'azienda lavora con clienti che presentano sfide specifiche, in modo da poter creare soluzioni di IA che facciano davvero la differenza.
David ha anche condiviso che il loro lavoro spesso va oltre il semplice riconoscimento degli oggetti in una scena. Individuare ciò che c'è è solo il primo passo. Il vero valore deriva dal capire cosa fare con quelle informazioni e renderle utili all'interno di una catena di valore più ampia.
Un passo fondamentale per rendere l'IA veramente utile è andare oltre le attività di computer vision di base, come il rilevamento degli oggetti, e utilizzare queste intuizioni per il tracciamento comportamentale. David ha sottolineato che l'IA comportamentale si concentra sulla comprensione delle azioni e dei modelli, non solo sull'identificazione degli oggetti. In questo modo l'intelligenza artificiale è in grado di riconoscere gli eventi significativi e di fornire informazioni utili all'azione.
Ha fatto l'esempio di un animale che si rotola sul pavimento, che potrebbe indicare una malattia. Mentre le persone non possono sorvegliare un animale 24 ore su 24, i sistemi di sorveglianza basati sull'intelligenza artificiale con funzionalità di tracciamento comportamentale possono farlo. Queste soluzioni possono monitorare continuamente gli oggetti, rilevare comportamenti specifici, inviare un avviso e consentire un'azione tempestiva. Questo trasforma i dati grezzi in qualcosa di pratico e prezioso.
David ha anche dimostrato che questo approccio rende l'IA non solo interessante, ma anche di grande impatto. Affrontando problemi reali, come monitorare i comportamenti e agire di conseguenza, il tracciamento comportamentale può diventare una parte fondamentale di soluzioni di IA efficaci in vari settori.
David Scott ha poi illustrato come Ultralytics YOLOv8, un modello di visione computerizzata, ha rappresentato una svolta per i progetti di tracciamento comportamentale del suo team. Ha fornito loro una solida base per rilevare, classificare e seguire gli oggetti. Il suo team ha fatto un ulteriore passo avanti e ha addestrato YOLOv8 in modo da concentrarsi sul monitoraggio dei comportamenti nel tempo, rendendolo più pratico e utile per le situazioni del mondo reale.
È interessante notare che con il rilascio di Ultralytics YOLO11, soluzioni come quelle create da The Main Branch possono diventare ancora più affidabili e precise. Quest'ultimo modello offre caratteristiche come una maggiore precisione e un'elaborazione più veloce che migliorano la sua capacità di tracciare i comportamenti. Ne parleremo in modo più approfondito dopo aver compreso meglio le applicazioni per cui l'intelligenza artificiale comportamentale può essere utilizzata.
Esploriamo quindi le soluzioni di cui ha parlato David e come la tecnologia di tracciamento comportamentale viene utilizzata in applicazioni reali per risolvere le sfide quotidiane e avere un impatto significativo.
Innanzitutto, David ha condiviso un'entusiasmante sfida affrontata con un progetto chiamato HerdSense, che prevedeva il monitoraggio della salute di migliaia di mucche in un enorme allevamento. L'obiettivo era quello di seguire il comportamento delle singole mucche per identificare potenziali problemi di salute. Ciò significava tenere d'occhio decine di migliaia di animali contemporaneamente e non era un compito semplice.
Per iniziare a risolvere il problema dell'identificazione di ogni mucca e del monitoraggio dei suoi comportamenti, il team di David ha condotto un workshop di due giorni per delineare tutti i possibili comportamenti da monitorare. In totale hanno identificato oltre 200 comportamenti.
Ognuno dei 200 comportamenti dipendeva dalla capacità di riconoscere con precisione le singole mucche, poiché tutti i dati dovevano essere legati a specifici animali. Una delle principali preoccupazioni era quella di seguire le mucche quando si raggruppavano in gruppi, il che rendeva difficile vedere i singoli animali.
Il team di David ha sviluppato un sistema di visione computerizzata per garantire che ogni mucca fosse identificata in modo coerente, anche in situazioni difficili. Sono stati in grado di confermare che alla stessa mucca sarebbe stato assegnato sempre lo stesso ID, anche se fosse scomparsa dalla vista, si fosse mescolata con altre o fosse riapparsa in seguito.
Proseguendo, David ha presentato un altro affascinante progetto in cui sono state applicate tecniche di tracciamento comportamentale simili per monitorare i cavalli. In questo progetto, il team di David non ha avuto bisogno di tracciare gli ID dei singoli cavalli così da vicino come hanno fatto con le mucche. Invece, si sono concentrati su comportamenti specifici e hanno monitorato dettagli come i modelli alimentari e i livelli generali di attività per individuare tempestivamente eventuali problemi di salute. L'identificazione di piccoli cambiamenti nel comportamento potrebbe portare a interventi più rapidi per fornire cure migliori e prevenire i problemi prima che diventino gravi.
David ha anche parlato della complessità del tracciamento comportamentale attraverso un esempio interessante. Durante la ricerca di modi per migliorare l'analisi comportamentale, il suo team si è imbattuto in un'azienda che sosteneva di poter rilevare il taccheggio analizzando pose specifiche, come quella di chi tiene la mano in tasca. All'inizio sembrava un'idea intelligente: certi movimenti potevano suggerire un comportamento sospetto, no?
Tuttavia, quando David ha approfondito la ricerca, si è reso conto dei limiti di questo metodo. Una singola posa, come una mano in tasca, non significa necessariamente che qualcuno stia rubando. Potrebbe semplicemente indicare che è rilassato, che sta pensando o addirittura che ha freddo. Il problema di concentrarsi su pose isolate è che si ignora il contesto più ampio. Il comportamento non è una singola azione, ma un insieme di azioni che si susseguono nel tempo, modellate dal contesto e dalle intenzioni.
David ha sottolineato che il vero tracking comportamentale è molto più complesso e richiede un approccio olistico. Si tratta di analizzare sequenze di azioni e di capire cosa significano in un quadro più ampio. Sebbene l'industria dell'intelligenza artificiale stia facendo passi da gigante, ha sottolineato che c'è ancora del lavoro da fare per far progredire il tracciamento comportamentale in modo da fornire informazioni significative e accurate.
Successivamente, David ha portato il pubblico dietro le quinte per mostrare come il suo team ha realizzato una soluzione di computer vision per monitorare la salute delle mucche con l'aiuto di YOLOv8 e delle sue capacità di stima della posa.
Hanno iniziato creando un set di dati personalizzato per la stima della posa di una mucca, aumentando il numero standard di punti chiave da 17 a 145 per rendere il modello migliore nell'analisi del movimento. Poi, il modello è stato addestrato su un enorme dataset di oltre 2 milioni di immagini e 110 milioni di esempi comportamentali.
Utilizzando un'infrastruttura hardware avanzata, il team di David è stato in grado di addestrare il modello in soli due giorni, invece delle settimane che sarebbero state necessarie con un hardware convenzionale. Il modello addestrato è stato poi integrato con un tracker di comportamento personalizzato che ha analizzato più fotogrammi video simultaneamente per rilevare gli schemi delle azioni delle mucche.
Il risultato è stato una soluzione basata sull'intelligenza artificiale in grado di rilevare e seguire otto diversi comportamenti delle vacche, come mangiare, bere e sdraiarsi, per individuare piccoli cambiamenti comportamentali che potrebbero segnalare problemi di salute. Questo permette agli allevatori di agire rapidamente e di migliorare la gestione della mandria.
David ha concluso il suo intervento condividendo una lezione importante con il pubblico: "Se non dai all'IA lo spazio per fallire, ti stai preparando al fallimento perché, in fin dei conti, è una statistica". Ha sottolineato che l'IA, nonostante i suoi punti di forza, non è impeccabile. È uno strumento che impara da schemi e ci saranno sempre momenti in cui non riuscirà a fare bene le cose. Invece di temere questi errori, la chiave è costruire sistemi in grado di gestirli e continuare a migliorare nel tempo.
Questo vale anche per i modelli di computer vision. Ad esempio, Ultralytics YOLO11 , l'ultima versione dei modelli Ultralytics YOLO , è stata realizzata tenendo conto della necessità di portare le cose a un livello superiore rispetto a YOLOv8.
In particolare, YOLO11 offre prestazioni migliori, soprattutto per quanto riguarda le applicazioni in tempo reale in cui la precisione è fondamentale, come l'agricoltura e la sanità. Grazie alle sue caratteristiche avanzate, YOLO11 sta ridefinendo il modo in cui le industrie utilizzano l'IA, fornendo intuizioni innovative in tempo reale e aiutandole ad affrontare le sfide in modo più efficace.
Il keynote di David a YV24 ci ha ricordato che l'IA è più di una semplice innovazione: è uno strumento potente per risolvere problemi reali e migliorare il nostro modo di vivere e lavorare. Concentrandosi sul comportamento, l'IA sta già avendo un impatto in settori come il monitoraggio della salute degli animali e il riconoscimento di modelli significativi nelle azioni quotidiane.
Il potenziale dell'IA comportamentale è entusiasmante e siamo solo all'inizio. Trasformando i dati grezzi in informazioni utili, l'IA comportamentale passa dal monitoraggio passivo alla risoluzione attiva dei problemi. Con il suo ulteriore sviluppo, l'IA comportamentale è destinata a prendere decisioni più intelligenti, a semplificare i processi e ad apportare miglioramenti significativi alle nostre vite.
Resta in contatto con la nostra comunità per saperne di più sull'IA e sulle sue applicazioni reali. Visita il nostro repository GitHub per scoprire le innovazioni in settori come l'IA in agricoltura e la computer vision nella produzione.
Inizia il tuo viaggio nel futuro dell'apprendimento automatico