Come utilizzare Ultralytics YOLO11 per la segmentazione delle istanze

Abirami Vina

5 minuti di lettura

5 novembre 2024

Scoprite come il nuovo modello YOLO11 di Ultralytics può essere utilizzato per la segmentazione delle istanze e per ottenere una maggiore precisione in applicazioni come la gestione dei rifiuti e il monitoraggio delle torce.

La computer vision, un campo dell'intelligenza artificiale (AI) che aiuta le macchine a interpretare e comprendere le informazioni visive, consente di eseguire operazioni come la segmentazione delle istanze. La segmentazione delle istanze può essere utilizzata per analizzare un'immagine o un fotogramma video per marcare i confini esatti di ogni oggetto distinto nell'immagine, anche quando sono presenti più oggetti dello stesso tipo. Grazie all'elevato livello di precisione, la segmentazione delle istanze ha un'ampia gamma di applicazioni, dall'aiuto alle auto a guida autonoma nel rilevare gli ostacoli sulla strada all'identificazione dei tumori nelle scansioni mediche.

Nel corso degli anni, la segmentazione delle istanze si è evoluta in modo significativo. Un recente sviluppo è stato introdotto durante l'evento ibrido annuale di Ultralytics, YOLO Vision 2024 (YV24), sotto forma del modello Ultralytics YOLO11. Il nuovo modello supporta le stesse attività di computer vision (compresa la segmentazione delle istanze) del modello Ultralytics YOLOv8, per cui gli utenti che conoscono le versioni precedenti possono adottare il nuovo modello senza problemi.

__wf_reserved_inherit
Figura 1. Un esempio di utilizzo del modello Ultralytics YOLO11 per la segmentazione delle istanze.

In questo articolo esploreremo la segmentazione delle istanze e come si differenzia da altri compiti di computer vision come la segmentazione semantica, oltre a discutere alcune delle sue applicazioni. Inoltre, spiegheremo come utilizzare il modello di segmentazione delle istanze YOLO11 utilizzando il pacchetto Ultralytics Python e la piattaforma Ultralytics HUB. Iniziamo!

Che cos'è la segmentazione delle istanze?

La segmentazione delle istanze può essere utilizzata per identificare gli oggetti in un'immagine e delinearli a livello di pixel. Il processo prevede innanzitutto l'individuazione degli oggetti e il disegno di riquadri di delimitazione attorno ad essi. Quindi, un algoritmo di segmentazione classifica ogni pixel all'interno del rettangolo di selezione per creare una maschera precisa per ogni oggetto.

La segmentazione delle istanze è anche diversa da compiti come la segmentazione semantica e la segmentazione panottica. La segmentazione semantica etichetta ogni pixel in base alla categoria generale di un oggetto, senza distinguere le singole istanze. La segmentazione panottica, invece, combina sia la segmentazione delle istanze che quella semantica, etichettando ogni pixel con un ID di classe e uno di istanza, identificando i singoli oggetti all'interno di ogni categoria.

__wf_reserved_inherit
Figura 2. Utilizzo di YOLO11 per rilevare e segmentare una persona e un cane.

Le capacità della segmentazione delle istanze possono essere applicate in vari scenari che possono richiedere modelli diversi. Ad esempio, un modello leggero potrebbe essere ideale per l'elaborazione in tempo reale nelle applicazioni mobili, mentre un modello più complesso potrebbe essere utilizzato per attività di alta precisione come il controllo di qualità nella produzione.

Come i modelli precedenti, anche il modello di segmentazione delle istanze YOLO11 è disponibile in diverse varianti a seconda delle esigenze. Queste varianti includono YOLO11n-seg (Nano), YOLO11s-seg (Small), YOLO11m-seg (Medium), YOLO11l-seg (Large) e YOLO11x-seg (Extra Large). Questi modelli variano in termini di dimensioni, velocità di elaborazione, precisione e potenza di calcolo richiesta. In base alle vostre esigenze specifiche, potete scegliere il modello più adatto alla vostra applicazione.

Applicazioni di segmentazione delle istanze per YOLO11

Le avanzate capacità di segmentazione delle istanze di YOLO11 aprono una serie di applicazioni in diversi settori. Vediamo nel dettaglio alcune di queste applicazioni.

Utilizzo della segmentazione YOLO11 nell'industria del petrolio e del gas

L'estrazione di petrolio e gas comporta la gestione di fluttuazioni di pressione estremamente elevate. Tecniche come il gas flaring aiutano a bruciare il gas naturale prodotto durante l'estrazione del petrolio. È necessario per ragioni di sicurezza. Per esempio, nell'estrazione del petrolio greggio, un improvviso o significativo picco di pressione potrebbe portare a un'esplosione. Anche se non è frequente, gli incidenti industriali nel settore della produzione di petrolio e gas possono provocare incendi intensi, difficili da contenere e controllare. Il gas flaring aiuta gli operatori a depressurizzare in modo sicuro le apparecchiature e a gestire le imprevedibili e forti fluttuazioni di pressione bruciando il gas in eccesso.

I sistemi di intelligenza artificiale possono migliorare questo processo di monitoraggio e il rischio di incidenti può essere ridotto utilizzando un sistema di monitoraggio della torcia basato sulla segmentazione delle istanze. Il monitoraggio del gas flaring è importante anche per motivi ambientali, in quanto una quantità eccessiva di gas flaring può avere un impatto negativo sull'ambiente. 

I modelli di segmentazione delle istanze di Ultralytics YOLO11 possono essere utilizzati per monitorare la quantità di fuoco e fumo causata dal flaring. È possibile calcolare l'area in pixel dei bagliori e dei fumi rilevati e segmentati. Grazie a queste informazioni, gli operatori possono conoscere in tempo reale i fuochi e i fumi causati dal flaring, aiutandoli a prevenire incidenti e impatti ambientali negativi. 

__wf_reserved_inherit
Figura 3. Un esempio di monitoraggio delle torce con YOLO11 nella produzione di petrolio e gas.

Segmentazione delle istanze con YOLO11 per la gestione dei rifiuti in plastica 

Gli operatori degli impianti di gestione e riciclaggio dei rifiuti possono utilizzare i sistemi basati sulla segmentazione di YOLO11 per identificare i materiali di scarto in plastica. YOLO11 può essere integrato con sistemi di smistamento robotizzati per identificare con precisione diversi materiali di scarto, come cartone e plastica (da trattare separatamente). È particolarmente importante se si considera che dei 7 miliardi di tonnellate di rifiuti in plastica generati a livello globale, solo il 10% circa viene riciclato.

L'automatizzazione dell'identificazione e dello smistamento dei rifiuti in plastica riduce significativamente il tempo necessario rispetto ai metodi tradizionali, in cui gli operatori smistano gli articoli a mano. I modelli di visione computerizzata sono in grado di segmentare anche le plastiche morbide, come gli involucri e i sacchetti, che sono particolarmente impegnativi perché spesso si aggrovigliano. I modelli YOLO11 possono anche essere addestrati in modo personalizzato per segmentare diversi tipi di plastica. Nelle sezioni che seguono si spiegherà meglio come è possibile addestrare un modello YOLO11 in modo personalizzato.

__wf_reserved_inherit
Figura 4. Identificazione dei rifiuti plastici con Ultralytics YOLO11. 

YOLO11 segmentazione dei veicoli autonomi

Un altro caso d'uso interessante della segmentazione delle istanze è quello delle automobili autonome. YOLO11 consente alle auto a guida autonoma di migliorare la sicurezza dei passeggeri e degli altri utenti della strada riconoscendo accuratamente gli oggetti a livello di pixel. Il sistema di telecamere a bordo dell'auto può acquisire immagini dell'ambiente circostante e analizzarle utilizzando YOLO11 e la segmentazione delle istanze. Ogni oggetto (pedoni, semafori, altri veicoli, ecc.) all'interno dell'immagine viene segmentato e gli viene assegnata un'etichetta. Un tale livello di precisione consente alle auto autonome di identificare ogni singolo oggetto che le circonda. 

__wf_reserved_inherit
Figura 5. Utilizzo di YOLO11 e della segmentazione delle istanze per identificare veicoli e pedoni sulla strada.

Prova di segmentazione dell'istanza con il modello YOLO11

Ora che abbiamo esplorato la segmentazione delle istanze e discusso alcune delle sue applicazioni, vediamo come provarla utilizzando il modello YOLO11 di Ultralytics. 

Ci sono due modi per farlo: si può usare il pacchetto Ultralytics Python o Ultralytics HUB. Li esploreremo entrambi, iniziando dal pacchetto Python.

Esecuzione di inferenze con YOLO11

L'esecuzione di un'inferenza implica l'uso del modello per analizzare nuovi dati non visti in precedenza. Per eseguire un'inferenza utilizzando il modello di segmentazione delle istanze YOLO11 tramite codice, è necessario installare il pacchetto Ultralytics Python utilizzando pip, conda o docker. In caso di problemi durante l'installazione, è possibile consultare la nostra Guida ai problemi comuni per ottenere assistenza nella risoluzione dei problemi. Una volta installato il pacchetto, è possibile eseguire il codice mostrato di seguito per caricare il modello di segmentazione delle istanze YOLO11 ed eseguire le previsioni su un'immagine.

__wf_reserved_inherit
Figura 6. Esecuzione di un'inferenza su un'immagine con YOLO11n-seg.

Formazione di un modello YOLO11 personalizzato

Con la stessa impostazione del codice, è possibile addestrare un modello YOLO11 personalizzato. Grazie alla messa a punto di un modello YOLO11, è possibile creare una versione personalizzata del modello che soddisfi meglio i requisiti specifici del progetto. Ad esempio, i rivenditori possono utilizzare un modello personalizzato per segmentare accuratamente le caratteristiche fisiche di un cliente e consigliare abiti che si adattino correttamente. Lo snippet di codice qui sotto mostra come caricare e addestrare un modello YOLO11 per la segmentazione delle istanze. È possibile partire da una configurazione YAML o da un modello pre-addestrato, trasferire i pesi e addestrarsi su un set di dati come COCO per ottenere una segmentazione efficace. 

Una volta completato, è possibile eseguire inferenze utilizzando il modello personalizzato per le proprie applicazioni specifiche. Utilizzando l'opzione di esportazione, è possibile esportare il modello personalizzato in un formato diverso.

Segmentazione dell'istanza YOLO11 su Ultralytics HUB

Dopo aver esplorato l'esecuzione di inferenze e l'addestramento personalizzato di un modello di segmentazione delle istanze YOLO11 attraverso il codice, analizziamo un'alternativa senza codice: Ultralytics HUB. Ultralytics HUB è una piattaforma Vision AI intuitiva che semplifica il processo di formazione e distribuzione dei modelli YOLO, compresi i modelli di segmentazione delle istanze YOLO11. 

Per eseguire l'inferenza sulle immagini, è sufficiente creare un account, accedere alla sezione 'Modelli' e selezionare la variante del modello di segmentazione dell'istanza YOLO11 di propria scelta. È possibile caricare un'immagine e visualizzare i risultati della predizione nella sezione di anteprima, come mostrato di seguito.

__wf_reserved_inherit
Figura 7. Esecuzione di inferenze su Ultralytics HUB.

Punti di forza

YOLO11 offre funzionalità affidabili di segmentazione delle istanze che aprono un mondo di possibilità in diversi settori. Dal miglioramento della sicurezza dei veicoli autonomi al monitoraggio del gas flaring nel settore petrolifero e del gas, fino all'automazione dello smistamento dei rifiuti negli impianti di riciclaggio, la precisione a livello di pixel di YOLO11 lo rende ideale per attività di segmentazione complesse. 

Grazie alle opzioni di formazione personalizzata tramite il pacchetto Ultralytics Python e alla configurazione senza codice tramite Ultralytics HUB, gli utenti possono integrare perfettamente YOLO11 nei loro flussi di lavoro. Che si tratti di applicazioni industriali, sanitarie, retail o di monitoraggio ambientale, YOLO11 offre flessibilità e precisione per soddisfare le diverse esigenze di segmentazione.

Per saperne di più, visitate il nostro repository GitHub e partecipate alla nostra comunità. Esplorate le applicazioni dell'intelligenza artificiale nelle auto a guida autonoma e nell'agricoltura sulle nostre pagine dedicate alle soluzioni. 🚀

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti