Glossario

Segmentazione delle immagini

Scopri la potenza della segmentazione delle immagini con Ultralytics YOLO . Esplora la precisione a livello di pixel, i tipi, le applicazioni e i casi d'uso dell'intelligenza artificiale nel mondo reale.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

La segmentazione delle immagini è una tecnica fondamentale della computer vision che suddivide un'immagine digitale in più segmenti o regioni, spesso in base alle caratteristiche dei pixel. L'obiettivo è quello di semplificare o modificare la rappresentazione di un'immagine in qualcosa di più significativo e facile da analizzare. Invece di limitarsi a identificare gli oggetti con dei riquadri di delimitazione come nel rilevamento degli oggetti, la segmentazione delle immagini assegna un'etichetta di classe specifica a ogni pixel, fornendo una comprensione molto più granulare del contenuto dell'immagine. Questa comprensione a livello di pixel è fondamentale per le attività che richiedono dettagli spaziali precisi.

Come funziona la segmentazione delle immagini

Gli algoritmi di segmentazione delle immagini analizzano un'immagine pixel per pixel, raggruppando in segmenti i pixel che condividono determinate proprietà (come il colore, l'intensità o la texture). Gli approcci moderni utilizzano spesso il deep learning, in particolare le reti neurali convoluzionali (CNN), che imparano a identificare modelli complessi e ad assegnare etichette appropriate a ogni pixel. Il risultato è tipicamente una maschera di segmentazione, ovvero un'immagine in cui il valore di ogni pixel corrisponde alla classe di appartenenza. Questa maschera evidenzia la forma e la posizione esatta di diversi oggetti o regioni all'interno dell'immagine. Esistono diverse tecniche di segmentazione delle immagini, che vanno dai metodi tradizionali come la soglia e il clustering ai modelli avanzati di deep learning.

Tipi di segmentazione delle immagini

La segmentazione delle immagini può essere ampiamente classificata in base al livello di dettaglio e di distinzione richiesto:

  • Segmentazione semantica: Assegna ogni pixel dell'immagine a una categoria predefinita (ad esempio, "auto", "strada", "cielo", "edificio"). Non distingue tra diverse istanze della stessa classe di oggetti. Ad esempio, a tutte le auto presenti in un'immagine verrebbe assegnata la stessa etichetta "auto" e lo stesso colore nella maschera di segmentazione.
  • Segmentazione delle istanze: Fa un passo avanti rispetto alla segmentazione semantica. Identifica ogni singola istanza di oggetto all'interno di un'immagine e assegna un'etichetta o una maschera unica a ciascuna di esse, anche se appartengono alla stessa classe. Ad esempio, ogni auto distinta in un'immagine riceverà un identificatore e una maschera unici.
  • Segmentazione panottica: Combina la segmentazione semantica e quella per istanze. Assegna un'etichetta di classe a ogni pixel (come la semantica) e identifica in modo univoco ogni istanza di oggetto (come l'istanza). In questo modo si ottiene una comprensione completa e unificata della scena.

Applicazioni della segmentazione delle immagini

L'analisi dettagliata a livello di pixel fornita dalla segmentazione delle immagini consente un'ampia gamma di applicazioni in diversi settori:

  • Analisi delle immagini mediche: La segmentazione è fondamentale per analizzare scansioni mediche come la TAC o la risonanza magnetica. Aiuta a identificare e delineare organi, tessuti o anomalie come i tumori con grande precisione, favorendo la diagnosi e la pianificazione del trattamento. Ad esempio, i modelliUltralytics YOLO possono essere utilizzati per il rilevamento dei tumori segmentando con precisione la regione tumorale dal tessuto sano circostante, fornendo informazioni fondamentali sulle sue dimensioni e sulla sua forma. Le comuni tecniche di imaging medico traggono notevoli vantaggi dalla segmentazione.
  • Veicoli autonomi: Le auto a guida autonoma si basano molto sulla segmentazione delle immagini per comprendere l'ambiente circostante. Segmentando la strada, la segnaletica, i pedoni, gli altri veicoli e gli ostacoli a livello di pixel, l'auto può navigare in sicurezza e prendere decisioni di guida informate. La comprensione dei confini precisi delle aree percorribili rispetto a quelle non percorribili è fondamentale per raggiungere livelli più elevati di automazione della guida.
  • Immagini satellitari: Utilizzate nell'analisi delle immagini satellitari per la mappatura della copertura del suolo, il monitoraggio della deforestazione, la pianificazione urbana e la valutazione dei disastri.
  • Agricoltura: Permette di applicare tecniche di agricoltura di precisione come l'identificazione di aree coltivate, il rilevamento di erbe infestanti o la valutazione della salute delle piante in base a regioni segmentate. Questo supporta le applicazioni dell'intelligenza artificiale in agricoltura.
  • Vendita al dettaglio: Analizzare la disposizione degli scaffali, monitorare i livelli delle scorte o capire il comportamento dei clienti attraverso dati visivi segmentati.

Segmentazione delle immagini e Ultralytics YOLO

Ultralytics YOLO offrono funzionalità all'avanguardia per diverse attività di computer vision, tra cui la segmentazione delle immagini. I modelli come YOLOv8 sono progettati per eseguire la segmentazione delle istanze in modo efficiente e accurato, rendendoli adatti alle applicazioni in tempo reale. Per saperne di più sulle funzionalità specifiche di segmentazione, puoi consultare la documentazione di Ultralytics . L'addestramento di modelli di segmentazione personalizzati su set di dati come il popolare set di dati COCO o sui tuoi dati è semplificato da strumenti come Ultralytics HUB, che semplifica il processo di addestramento, distribuzione e gestione dei modelli. Per una guida all'implementazione, consulta risorse come il tutorial sulla segmentazione con modelli Ultralytics YOLOv8 pre-addestrati in Python.

Leggi tutto