Glossario

Segmentazione semantica

Scopri la potenza della segmentazione semantica: classifica ogni pixel delle immagini per una comprensione precisa della scena. Esplora subito applicazioni e strumenti!

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

La segmentazione semantica è un compito fondamentale della computer vision che prevede l'assegnazione di un'etichetta di classe specifica a ogni singolo pixel di un'immagine. A differenza di altri compiti di visione che potrebbero identificare gli oggetti o classificare l'intera immagine, la segmentazione semantica fornisce una comprensione densa, a livello di pixel, del contenuto della scena. Ciò significa che non si limita a rilevare la presenza di un'auto, ma delinea con precisione quali pixel appartengono alla categoria delle auto, differenziandoli dai pixel appartenenti alla strada, al cielo o ai pedoni.

Che cos'è la segmentazione semantica?

L'obiettivo principale della segmentazione semantica è quello di suddividere un'immagine in regioni significative corrispondenti a diverse categorie di oggetti. Ad esempio, in un'immagine contenente più auto, pedoni e alberi, un modello di segmentazione semantica etichetterà tutti i pixel che compongono un'auto come "auto", tutti i pixel di un pedone come "pedone" e tutti i pixel di un albero come "albero". Tratta tutte le istanze della stessa classe di oggetti in modo identico. Questo contrasta con la classificazione delle immagini, che assegna un'unica etichetta all'intera immagine, e con il rilevamento degli oggetti, che disegna dei riquadri di delimitazione intorno agli oggetti rilevati ma non ne delinea la forma esatta.

I modelli di segmentazione semantica sono in genere addestrati con tecniche di apprendimento supervisionato, che richiedono set di dati con annotazioni dettagliate a livello di pixel. L'output è solitamente una mappa di segmentazione, ovvero un'immagine in cui il valore (o il colore) di ogni pixel corrisponde all'etichetta di classe prevista.

Differenze chiave rispetto ad altri compiti di segmentazione

È importante distinguere la segmentazione semantica dai compiti correlati:

  • Segmentazione delle istanze: Mentre la segmentazione semantica etichetta tutti i pixel appartenenti alla classe "auto" allo stesso modo, la segmentazione delle istanze fa un passo avanti. Identifica e segmenta separatamente ogni singola istanza di un oggetto. Quindi, tre auto diverse in un'immagine riceveranno ciascuna una maschera di segmentazione unica, anche se appartengono tutte alla classe "auto". Puoi scoprire come utilizzare Ultralytics YOLO per la segmentazione delle istanze.
  • Segmentazione panottica: Questo compito combina la segmentazione semantica e quella di istanza. Assegna un'etichetta di classe a ogni pixel (come la segmentazione semantica) e identifica in modo univoco ogni istanza di oggetto (come la segmentazione di istanza), fornendo una comprensione unificata della scena.

Applicazioni della segmentazione semantica

La comprensione dettagliata della scena fornita dalla segmentazione semantica è fondamentale per molte applicazioni del mondo reale:

  1. Guida autonoma: Le auto a guida autonoma si basano molto sulla segmentazione semantica per comprendere l'ambiente circostante. Classificando i pixel in categorie come "strada", "marciapiede", "pedone", "veicolo" e "ostacolo", il sistema di guida autonoma può prendere decisioni informate sulla navigazione e sulla sicurezza.
  2. Analisi delle immagini mediche: Nel settore sanitario, la segmentazione semantica aiuta ad analizzare scansioni mediche come risonanze magnetiche o TAC. Può delineare con precisione organi, tessuti o anomalie come i tumori, aiutando i medici nella diagnosi, nella pianificazione del trattamento e nel monitoraggio della progressione della malattia. Ad esempio, i modelliUltralytics YOLO possono essere utilizzati per il rilevamento dei tumori.
  3. Analisi delle immagini satellitari: Utilizzate per classificare i tipi di copertura del suolo (ad esempio, foreste, acqua, aree urbane), monitorare la deforestazione, mappare l'espansione urbana o valutare la salute delle colture nell'agricoltura di precisione. La Vision AI offre molti vantaggi all'agricoltura.
  4. Robotica: Consente ai robot di percepire l'ambiente circostante con maggiori dettagli, necessari per svolgere compiti come la manipolazione di oggetti e la navigazione in ambienti complessi. Scopri di più sull'integrazione della computer vision nella robotica.

Modelli e strumenti

La segmentazione semantica impiega spesso modelli di deep learning, in particolare le reti neurali convoluzionali (CNN). Architetture come le Fully Convolutional Networks (FCN) e le U-Net sono scelte popolari. Modelli moderni come Ultralytics YOLOv8 offrono anche potenti funzionalità per le attività di segmentazione. Strumenti come Ultralytics HUB offrono piattaforme per addestrare, gestire dataset come COCO e distribuire modelli di segmentazione in modo efficiente.

Leggi tutto