Glossario

Segmentazione dell'istanza

Scopri come la segmentazione delle istanze offre un riconoscimento degli oggetti perfetto al pixel per applicazioni come la guida autonoma, l'imaging medico e la robotica.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

La segmentazione delle istanze è una sofisticata tecnica di computer vision che estende le capacità di rilevamento degli oggetti non solo identificando la presenza e la posizione degli oggetti all'interno di un'immagine, ma anche delineando i confini esatti di ogni singola istanza di oggetto. Ciò significa che la segmentazione delle istanze è in grado di distinguere tra più oggetti della stessa classe che sono vicini tra loro o che si sovrappongono, fornendo una maschera a livello di pixel per ogni oggetto. Questo livello di dettaglio è fondamentale per le applicazioni che richiedono una comprensione precisa della scena, come la guida autonoma, l'imaging medico e la manipolazione robotica.

Differenze chiave rispetto ai termini correlati

Sebbene la segmentazione delle istanze sia correlata ad altre attività di computer vision, offre capacità uniche:

  • Rilevamento degli oggetti: Il rilevamento degli oggetti identifica la presenza e la posizione degli oggetti all'interno di un'immagine, in genere utilizzando i riquadri di delimitazione. Tuttavia, non fornisce informazioni sulla forma o sull'estensione degli oggetti. La segmentazione delle istanze va oltre, delineando i confini precisi di ogni oggetto.
  • Segmentazione semantica: La segmentazione semantica classifica ogni pixel di un'immagine in una classe specifica, colorando essenzialmente tutti i pixel appartenenti alla stessa classe con lo stesso colore. Tuttavia, non distingue tra diverse istanze della stessa classe. Ad esempio, tutte le auto presenti in un'immagine verrebbero etichettate come "auto", ma le singole auto non verrebbero distinte.
  • Segmentazione panottica: La segmentazione panottica combina la segmentazione semantica e quella di istanza, fornendo sia la classificazione a livello di pixel che la differenziazione delle singole istanze degli oggetti. Mentre la segmentazione panottica offre una comprensione completa della scena, la segmentazione di istanza si concentra in modo specifico sulla distinzione di singole istanze di oggetti.

Applicazioni del mondo reale

La segmentazione delle istanze viene utilizzata in una serie di applicazioni del mondo reale in cui la delimitazione precisa degli oggetti è essenziale:

  • Guida autonoma: Nelle auto a guida autonoma, la segmentazione delle istanze aiuta a identificare e distinguere i singoli veicoli, i pedoni e gli altri oggetti presenti sulla strada. Questo è fondamentale per prendere decisioni di guida accurate, come mantenere una distanza di sicurezza dalle altre auto o evitare collisioni con i pedoni. Ad esempio, il sistema è in grado di distinguere tra più auto in un ingorgo, consentendo al veicolo di navigare in modo sicuro in scenari complessi.
  • Imaging medico: La segmentazione delle istanze viene utilizzata per identificare e segmentare singole cellule, organi o tumori in immagini mediche come la risonanza magnetica o la TAC. Questa precisione è fondamentale per una diagnosi accurata, per la pianificazione del trattamento e per il monitoraggio della progressione della malattia. Ad esempio, la segmentazione dei singoli tumori in una scansione cerebrale può aiutare i medici a pianificare con maggiore precisione la radioterapia o la rimozione chirurgica. Scopri di più sull'IA nell'assistenza sanitaria.

Approfondimenti tecnici

I modelli di segmentazione delle istanze si basano tipicamente su architetture di rilevamento degli oggetti, come le reti neurali convoluzionali (CNN). Un approccio popolare è quello di utilizzare un rilevatore a due stadi, in cui il primo stadio propone regioni di interesse (bounding box) e il secondo stadio affina queste regioni per produrre maschere a livello di pixel. Mask R-CNN è un noto esempio di questo approccio, che estende il modello di rilevamento degli oggetti di Faster R-CNN aggiungendo un ramo per prevedere le maschere di segmentazione su ogni regione di interesse (RoI).

Strumenti e strutture

Diversi strumenti e framework supportano la segmentazione delle istanze, rendendola accessibile a ricercatori e sviluppatori:

  • TensorFlow e PyTorch: questi popolari framework di apprendimento automatico forniscono gli elementi di base per implementare modelli di segmentazione delle istanze. Offrono flessibilità e controllo sull'architettura del modello e sul processo di formazione. Scopri di più su TensorFlow e PyTorch.
  • Ultralytics YOLO: I modelli di Ultralytics YOLO , famosi per il rilevamento degli oggetti in tempo reale, supportano anche le attività di segmentazione delle istanze. Questi modelli offrono un equilibrio tra velocità e precisione che li rende adatti alle applicazioni in tempo reale.
  • Ultralytics HUB: questa piattaforma semplifica il processo di formazione e distribuzione dei modelli di segmentazione delle istanze, consentendo agli utenti di concentrarsi sulle loro applicazioni specifiche senza impantanarsi nei dettagli tecnici dell'implementazione dei modelli. Scopri come puoi sfruttare questo vantaggio con Ultralytics HUB.

Fornendo maschere dettagliate a livello di pixel per ogni istanza di oggetto, la segmentazione delle istanze migliora la capacità dei sistemi di intelligenza artificiale di comprendere e interagire con il mondo visivo, favorendo i progressi in vari campi.

Leggi tutto