Glossario

Segmentazione panottica

Scopri come la segmentazione panottica unifica la segmentazione semantica e quella per istanze per una comprensione precisa della scena a livello di pixel nelle applicazioni di intelligenza artificiale.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

La segmentazione panottica è una tecnica avanzata di computer vision progettata per ottenere una comprensione completa e dettagliata di una scena visiva a livello di pixel. Combina in modo unico i punti di forza di altri due metodi di segmentazione chiave: la segmentazione semantica e la segmentazione di istanza. L'obiettivo principale della segmentazione panottica è quello di assegnare un'etichetta di classe (come "auto", "persona", "strada", "cielo") e un ID di istanza (per distinguere tra diversi oggetti della stessa classe) a ogni singolo pixel di un'immagine, fornendo un'interpretazione ricca e unificata della scena.

Comprendere l'approccio unificato

Per comprendere la segmentazione panottica, è utile confrontarla con attività correlate. Il rilevamento degli oggetti identifica gli oggetti utilizzando i riquadri di delimitazione, ma manca di dettagli a livello di pixel. La segmentazione semantica classifica ogni pixel in una categoria (ad esempio, tutte le auto sono etichettate come "auto"), ma non distingue i singoli oggetti all'interno della stessa categoria. La segmentazione per istanze risolve questo problema individuando e segmentando ogni istanza di oggetto distinta (ad esempio, auto 1, auto 2), ma in genere si concentra sugli oggetti contestabili ("cose") e potrebbe ignorare le regioni di sfondo ("cose" come erba, cielo o strada).

La segmentazione panottica colma questo divario fornendo una comprensione più olistica della scena. Assegna un'etichetta semantica a ogni pixel, sia che appartenga a una classe "thing" (oggetti conteggiabili come veicoli, pedoni, animali) o a una classe "stuff" (regioni amorfe come strade, muri, cielo). Inoltre, per i pixel appartenenti alle classi "cose", viene assegnato un ID di istanza unico, che separa ogni oggetto dagli altri dello stesso tipo. Questa etichettatura completa garantisce che nessun pixel venga lasciato non classificato, offrendo un'analisi completa dell'immagine.

Come funziona la segmentazione panottica

I modelli di segmentazione panottica si basano tipicamente su architetture di deep learning. Questi modelli spesso utilizzano un estrattore di caratteristiche condiviso (una rete dorsale) seguito da teste o rami specializzati che prevedono etichette semantiche per tutti i pixel e maschere di istanza per le classi di "cose". I risultati di questi rami vengono poi combinati o fusi in modo intelligente per produrre la mappa di segmentazione panottica finale, in cui ogni pixel ha sia un'etichetta semantica che, se applicabile, un ID di istanza.

Applicazioni del mondo reale

La comprensione completa della scena fornita dalla segmentazione panottica è molto preziosa in vari ambiti:

  • Guida autonoma: Per le auto a guida autonoma, distinguere tra i diversi veicoli e i pedoni (istanze) e comprendere la strada, i marciapiedi, i semafori e il cielo (contesto semantico) è fondamentale per una navigazione sicura. Aziende come Waymo e tecnologie come Tesla Autopilot si basano molto su una sofisticata percezione della scena.
  • Imaging medico: Nell'analisi delle immagini mediche, la segmentazione panottica è in grado di identificare e delineare con precisione singole cellule o tumori (istanze) e di classificare contemporaneamente i tessuti circostanti e le strutture di sfondo (etichette semantiche), aiutando la diagnosi e la pianificazione del trattamento. I dataset come PanNuke si concentrano su questo tipo di segmentazione nucleare.
  • Robotica e realtà aumentata: La comprensione dell'ambiente completo, compresi i singoli oggetti e il contesto di sfondo, è fondamentale per i robot che interagiscono con spazi complessi e per sovrapporre con precisione le informazioni digitali nelle applicazioni di realtà aumentata. Il campo della robotica trae grandi benefici da una mappatura ambientale dettagliata.

Segmentazione panottica con Ultralytics

Sebbene la segmentazione panottica sia un compito complesso, i progressi di modelli quali Ultralytics YOLO stanno superando i limiti delle prestazioni di segmentazione. Modelli come Ultralytics YOLOv8 forniscono solide capacità per i compiti di segmentazione delle immagini, costituendo una base per la costruzione di sistemi di percezione più complessi. Gli utenti possono sfruttare piattaforme come Ultralytics HUB per semplificare i flussi di lavoro, tra cui l'addestramento dei modelli su set di dati personalizzati e l'esplorazione di varie opzioni di distribuzione dei modelli.

Leggi tutto