Glossario

Segmentazione panottica

Scopri come la segmentazione panottica unifica la segmentazione semantica e quella per istanze per una comprensione precisa della scena a livello di pixel nelle applicazioni di intelligenza artificiale.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

La segmentazione panottica è un'attività di computer vision avanzata che mira a fornire una comprensione completa e coerente di un'immagine assegnando a ogni pixel sia un'etichetta di classe che un ID di istanza unico. Unifica efficacemente due importanti paradigmi di segmentazione: la segmentazione semantica, che etichetta ogni pixel con una categoria (come "auto", "strada", "cielo"), e la segmentazione di istanza, che identifica e delinea le singole istanze di oggetto (come "auto 1", "auto 2"). L'obiettivo è quello di creare una mappa completa della scena a livello di pixel che distingua tra i diversi oggetti della stessa classe e identifichi anche le regioni amorfe dello sfondo, spesso definite "cose" (ad esempio, strada, cielo, vegetazione) rispetto alle "cose" conteggiabili (ad esempio, auto, pedoni, biciclette). Questo approccio olistico fornisce un contesto della scena più ricco rispetto alla sola segmentazione semantica o di istanza.

Come funziona la segmentazione panottica

Gli algoritmi di segmentazione panottica elaborano un'immagine per produrre un'unica mappa di output in cui ogni pixel riceve un'etichetta semantica e, se appartiene a un oggetto conteggiabile ("cosa"), un ID di istanza unico. I pixel che appartengono a regioni di sfondo ("cose") condividono la stessa etichetta semantica ma in genere non hanno ID di istanza unici (o condividono un singolo ID per categoria di cose). Gli approcci moderni spesso sfruttano il deep learning, in particolare le architetture basate sulle reti neurali convoluzionali (CNN) o sui trasformatori. Alcuni metodi utilizzano rami di rete separati per la segmentazione semantica e delle istanze e poi fondono i risultati, mentre altri impiegano modelli end-to-end progettati specificamente per il compito panottico, come introdotto nell'articolo originale "Panoptic Segmentation". L'addestramento di questi modelli richiede dataset con annotazioni panottiche dettagliate, come il dataset COCO Panoptic o il dataset Cityscapes. Le prestazioni vengono spesso misurate utilizzando la metrica Panoptic Quality (PQ), che combina la qualità della segmentazione e la qualità del riconoscimento.

Segmentazione panottica e attività correlate

Comprendere le distinzioni tra la segmentazione panottica e le attività di computer vision correlate è fondamentale:

  • Segmentazione semantica: Assegna un'etichetta di classe (ad esempio, "auto", "persona", "strada") a ogni pixel. Identifica le categorie ma non distingue tra istanze distinte della stessa categoria. Ad esempio, tutte le auto potrebbero essere colorate allo stesso modo nella maschera di output.
  • Segmentazione delle istanze: Rileva e segmenta le istanze di singoli oggetti (ad esempio, "auto 1", "auto 2", "persona 1"). Si concentra sulle "cose" conteggiabili e in genere ignora le "cose" amorfe dello sfondo, come il cielo o la strada, o le considera come un'unica classe di sfondo. Ultralytics YOLO offre solide capacità di segmentazione delle istanze. Puoi saperne di più in questa guida sulla segmentazione delle istanze rispetto alla segmentazione semantica.
  • Rilevamento degli oggetti: Identifica la presenza e la posizione degli oggetti utilizzando caselle di delimitazione e assegna etichette di classe. Non fornisce maschere a livello di pixel né segmenta le regioni dello sfondo. Molti modelli di rilevamento degli oggetti all'avanguardia, come YOLOv10 e YOLO11sono disponibili per un confronto, ad esempio YOLO11 vs YOLOv10.

La segmentazione panottica combina in modo unico i punti di forza della segmentazione semantica e di quella per istanze, fornendo un risultato unificato che segmenta tutti i pixel in regioni di sfondo etichettate per classe o in istanze di oggetto distinte.

Applicazioni della segmentazione panottica

La comprensione completa della scena offerta dalla segmentazione panottica è preziosa in diversi ambiti:

  • Veicoli autonomi: Le auto a guida autonoma richiedono una comprensione completa dell'ambiente circostante. La segmentazione panottica permette loro di identificare simultaneamente la strada, i marciapiedi, gli edifici ("cose") e di distinguere le singole auto, i pedoni e i ciclisti ("cose"), anche quando gli oggetti si sovrappongono. Questa percezione dettagliata è fondamentale per una navigazione e un processo decisionale sicuri. Scopri come Ultralytics contribuisce all'intelligenza artificiale nelle soluzioni automobilistiche.
  • Analisi di immagini mediche: Nell'analisi di scansioni mediche come la risonanza magnetica o la tomografia computerizzata, la segmentazione panottica è in grado di differenziare vari tipi di tessuto ("cose") e di identificare e segmentare istanze specifiche di strutture come tumori, lesioni o singole cellule ("cose"). Questo aiuta la diagnosi, la pianificazione del trattamento e il monitoraggio della progressione della malattia. Leggi come utilizzare YOLO11 per il rilevamento dei tumori.
  • Robotica: I robot che operano in ambienti complessi traggono vantaggio dalla comprensione sia del layout (pareti, pavimenti - "cose") sia dei singoli oggetti con cui potrebbero interagire (strumenti, parti, persone - "cose"). Questo aiuta la navigazione, la manipolazione e l'interazione uomo-robot. Esplora l'IA nella robotica.
  • Realtà aumentata (AR): Le applicazioni AR possono utilizzare la segmentazione panottica per inserire in modo realistico gli oggetti virtuali in una scena del mondo reale, gestendo correttamente le occlusioni e le interazioni con le superfici di sfondo e gli oggetti in primo piano. Scopri i progressi della tecnologia AR.
  • Analisi delle immagini satellitari: Si utilizza per la mappatura dettagliata della copertura del suolo, distinguendo tra grandi aree come foreste o corpi idrici ("cose") e singole strutture come edifici o veicoli ("cose"). Scopri le tecniche di analisi delle immagini satellitari.

Mentre i modelli Ultralytics come YOLO11 offrono prestazioni all'avanguardia in compiti come il rilevamento di oggetti e la segmentazione di istanze, la segmentazione panottica rappresenta il livello successivo di comprensione integrata della scena, fondamentale per applicazioni di IA sempre più sofisticate. Puoi gestire e addestrare modelli per compiti correlati utilizzando piattaforme come Ultralytics HUB.

Leggi tutto