Glossario

Box di delimitazione

Scopri come i bounding box consentono il rilevamento degli oggetti, l'intelligenza artificiale e i sistemi di apprendimento automatico. Esplora il loro ruolo nelle applicazioni di computer vision!

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Un riquadro di delimitazione è una cornice rettangolare utilizzata nella computer vision (CV) per indicare la posizione e l'estensione di un oggetto all'interno di un'immagine o di un video. Questi riquadri sono tipicamente definiti dalle coordinate degli angoli in alto a sinistra e in basso a destra, fornendo un modo semplice ma efficace per specificare dove si trova un oggetto e quanto spazio occupa. I riquadri di delimitazione sono componenti fondamentali in varie attività di CV, tra cui il rilevamento di oggetti, il tracciamento di oggetti e l'annotazione di immagini, e costituiscono una pietra miliare di molti moderni sistemi di intelligenza artificiale (AI) e di apprendimento automatico (ML).

Importanza nel rilevamento degli oggetti

Le Bounding Box sono essenziali per l'addestramento e la valutazione dei modelli di rilevamento degli oggetti. Nei compiti affrontati da modelli come Ultralytics YOLOi riquadri di delimitazione servono come verità di base durante l'addestramento, insegnando al modello a localizzare con precisione gli oggetti. Durante l'inferenza, il modello predice i riquadri di delimitazione intorno agli oggetti rilevati. Questa capacità di localizzazione è fondamentale per le applicazioni che richiedono non solo l'identificazione degli oggetti ma anche la loro esatta posizione, come ad esempio nei veicoli autonomi o nei sistemi robotici. Il processo inizia spesso con un'attenta annotazione dei dati, in cui l'uomo o gli strumenti automatici disegnano i riquadri di delimitazione intorno agli oggetti nelle immagini di addestramento, spesso utilizzando strumenti come CVAT.

Concetti chiave relativi alle caselle di delimitazione

Diverse metriche e tecniche sono strettamente associate all'uso e alla valutazione dei bounding box nei modelli ML:

  • Intersezione su Unione (IoU): Una metrica utilizzata per misurare la sovrapposizione tra il rettangolo di selezione previsto e il rettangolo di selezione della verità a terra.
  • Non-Maximum Suppression (NMS): una tecnica utilizzata per eliminare le bounding box ridondanti che rilevano lo stesso oggetto, mantenendo solo quella con il punteggio di confidenza più alto.
  • Precisione media (mAP): Una metrica comune per valutare le prestazioni dei modelli di rilevamento degli oggetti, che si basa molto sul calcolo dell'IoU.
  • Caselle di ancoraggio: Caselle predefinite di varie dimensioni e rapporti di aspetto utilizzate da alcuni rilevatori per aiutare a prevedere in modo più efficace le bounding box. I dataset di benchmark come COCO sono spesso utilizzati per valutare i modelli basati su questi concetti.

Bounding Box e termini correlati

Mentre le bounding box localizzano gli oggetti con dei rettangoli, altre tecniche di computer vision offrono diversi livelli di dettaglio:

  • Segmentazione delle immagini: A differenza delle bounding box che forniscono una localizzazione rettangolare, segmentazione dell'immagine mira a classificare ogni pixel di un'immagine.
  • Riquadri di delimitazione orientati (OBB): I rettangoli di selezione standard sono allineati agli assi. Per gli oggetti ruotati, le Oriented Bounding Boxes (OBB) forniscono un'aderenza più stretta ruotando la scatola insieme all'oggetto. Questo è particolarmente utile in applicazioni come l'analisi di immagini aeree o il rilevamento di oggetti in scene disordinate, spesso valutate su set di dati come DOTA.

Applicazioni in scenari reali

Le caselle di delimitazione sono parte integrante di numerose applicazioni pratiche di intelligenza artificiale:

Veicoli autonomi

Nello sviluppo dell'intelligenza artificiale nelle auto a guida autonoma, i riquadri di delimitazione sono fondamentali per rilevare e seguire pedoni, ciclisti, altri veicoli e ostacoli stradali. Il rilevamento accurato e in tempo reale degli oggetti grazie ai riquadri di delimitazione consente al sistema del veicolo di prendere decisioni informate per una navigazione sicura e per evitare le collisioni, aderendo alle linee guida sulla sicurezza delineate da organizzazioni come la National Highway Traffic Safety Administration (NHTSA). Scopri di più sul ruolo dell'intelligenza artificiale nelle auto a guida autonoma.

Gestione dell'inventario al dettaglio

I rivenditori utilizzano il rilevamento di oggetti con caselle di delimitazione per monitorare automaticamente gli scaffali e gestire l'inventario. Le telecamere dotate di modelli di intelligenza artificiale possono rilevare i prodotti, contare i livelli delle scorte, identificare gli articoli fuori posto e tracciare le interazioni dei clienti con la merce. Questo migliora l'efficienza, riduce il lavoro manuale e fornisce dati preziosi per ottimizzare il layout del negozio e il rifornimento delle scorte. Gli approfondimenti sulle tendenze tecnologiche del retail evidenziano la crescente importanza dell'IA nel settore. Puoi trovare diverse soluzioniUltralytics per diversi settori.

Leggi tutto