Glossario

Rivelatori di oggetti a uno stadio

Scopri la velocità e l'efficienza dei rilevatori di oggetti a uno stadio come YOLO, ideali per applicazioni in tempo reale come la robotica e la sorveglianza.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Nel campo della computer vision (CV), in particolare nel rilevamento degli oggetti, la velocità e l'efficienza sono spesso fondamentali quanto la precisione. I rilevatori di oggetti a uno stadio sono progettati tenendo conto di queste priorità e offrono un approccio semplificato all'identificazione e alla localizzazione di oggetti all'interno di immagini o video. A differenza delle loro controparti a due stadi, i rilevatori a uno stadio eseguono la localizzazione e la classificazione degli oggetti in un unico passaggio della rete neurale, rendendoli significativamente più veloci e adatti alle applicazioni in tempo reale.

Principi fondamentali dei rivelatori a uno stadio

I rilevatori di oggetti a un solo stadio si caratterizzano per il loro design end-to-end, che evita una fase separata per proporre le regioni di interesse. Questo approccio diretto consente loro di prevedere i riquadri di delimitazione e le probabilità di classe direttamente dalle caratteristiche dell'immagine in ingresso elaborate da una rete dorsale. La rete elabora l'intera immagine una sola volta e produce le rilevazioni in un'unica fase. Questa architettura enfatizza la velocità, rendendola ideale per le applicazioni in cui è essenziale un'elaborazione rapida. Tra gli esempi più diffusi ci sono le reti Ultralytics YOLO di Ultralytics, noti per il loro equilibrio tra velocità ed efficienza (come ad es. YOLO11) e SSD(Single Shot MultiBox Detector).

Differenze rispetto ai rivelatori a due stadi

La differenza fondamentale tra i rilevatori di oggetti a uno e a due stadi sta nella loro pipeline operativa. I rilevatori a due fasi, come la famiglia R-CNN, generano prima numerose proposte di regioni (potenziali aree in cui potrebbero essere presenti degli oggetti) e poi classificano e perfezionano queste proposte in una seconda fase distinta. Questo processo in due fasi raggiunge generalmente una maggiore precisione, soprattutto per gli oggetti più piccoli, ma ha il costo di un aumento significativo del tempo di calcolo e di una minore velocità di inferenza. Al contrario, i rilevatori a un solo stadio uniscono queste fasi, eseguendo la localizzazione e la classificazione simultaneamente sull'intera immagine. Questo approccio unificato consente di ottenere notevoli guadagni in termini di velocità, anche se storicamente ha comportato un compromesso che a volte ha portato a un'accuratezza leggermente inferiore rispetto ai metodi a due fasi più avanzati, un divario che i moderni rilevatori a una fase lavorano continuamente per colmare. Le prestazioni vengono spesso misurate utilizzando parametri come la precisione media (mAP).

Applicazioni del mondo reale

La velocità e l'efficienza dei rilevatori di oggetti a uno stadio li rendono preziosi in numerosi scenari reali che richiedono un rapido processo decisionale:

Strumenti e strutture

Lo sviluppo e l'implementazione di rilevatori di oggetti a un solo stadio è facilitato da diversi strumenti e framework, tra cui:

Comprendendo i principi, i vantaggi e le applicazioni dei rilevatori di oggetti a uno stadio, gli sviluppatori e i ricercatori possono sfruttare efficacemente la loro velocità per un'ampia gamma di sfide di computer vision in tempo reale.

Leggi tutto