Glossario

Box di delimitazione

Scopri come i bounding box consentono il rilevamento degli oggetti, l'intelligenza artificiale e i sistemi di apprendimento automatico. Esplora il loro ruolo nelle applicazioni di computer vision!

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Un riquadro di delimitazione è un riquadro rettangolare utilizzato nella computer vision (CV) per indicare la posizione e l'estensione approssimativa di un oggetto all'interno di un'immagine o di un video. Tipicamente definiti dalle coordinate degli angoli in alto a sinistra e in basso a destra (o punto centrale, larghezza e altezza), questi riquadri forniscono un metodo semplice ma efficace per specificare dove si trova un oggetto e quanto spazio occupa. I riquadri di delimitazione sono componenti fondamentali in varie attività CV, tra cui il rilevamento di oggetti, il tracciamento di oggetti e l'annotazione di immagini, e costituiscono una pietra miliare di molti moderni sistemi di intelligenza artificiale (AI) e di apprendimento automatico (ML). Sono essenziali per consentire alle macchine di capire non solo quali oggetti sono presenti, ma anche dove si trovano in una scena visiva.

Importanza nel rilevamento degli oggetti

Le Bounding Box sono fondamentali sia per l'addestramento che per la valutazione dei modelli di rilevamento degli oggetti. Nei compiti affrontati da modelli come Ultralytics YOLOi riquadri di delimitazione fungono da "verità di base" durante il processo di addestramento. Ciò significa che rappresentano la posizione e le dimensioni corrette degli oggetti nei dati di addestramento, insegnando al modello a localizzare con precisione gli oggetti. Questo processo inizia spesso con un'attenta annotazione dei dati, in cui l'uomo o gli strumenti automatici disegnano questi riquadri intorno agli oggetti nelle immagini, spesso utilizzando piattaforme come CVAT o integrandosi con piattaforme come Ultralytics HUB per la gestione dei set di dati. Durante l'inferenza, il modello addestrato predice i riquadri di delimitazione intorno agli oggetti rilevati, insieme alle etichette di classe e ai punteggi di confidenza. Questa capacità di localizzazione è fondamentale per le applicazioni che richiedono non solo l'identificazione degli oggetti, ma anche la loro posizione esatta.

Concetti chiave relativi alle caselle di delimitazione

Diverse metriche e tecniche sono strettamente associate all'uso e alla valutazione dei bounding box nei modelli ML:

  • Intersezione su Unione (IoU): Una metrica utilizzata per misurare la sovrapposizione tra il rettangolo di selezione previsto e il rettangolo di selezione della verità a terra. Quantifica l'accuratezza della localizzazione.
  • Soppressione non massima (NMS): Una tecnica di post-elaborazione utilizzata per eliminare i rettangoli di selezione ridondanti e sovrapposti per lo stesso oggetto, mantenendo solo la previsione più affidabile.
  • Precisione media (mAP): Una metrica standard per valutare le prestazioni dei modelli di rilevamento degli oggetti, che considera sia l'accuratezza della classificazione che quella della localizzazione (spesso basata su una soglia IoU). Vedi le metriche dettagliate delle prestazioni diYOLO .
  • Scatole di ancoraggio: Scatole predefinite di varie dimensioni e rapporti di aspetto utilizzate in alcuni rilevatori (come le vecchie versioni di YOLO ) per aiutare a prevedere in modo più efficace le bounding box. I modelli più recenti, tra cui YOLO11sono spesso privi di ancore, semplificando la testa di rilevamento.
  • Set di dati COCO: Un set di dati su larga scala per il rilevamento, la segmentazione e la didascalia degli oggetti, ampiamente utilizzato per il benchmarking dei modelli di rilevamento degli oggetti. Ultralytics offre un facile accesso a COCO e ad altri dataset di rilevamento.

Bounding Box e termini correlati

Mentre i rettangoli di delimitazione standard (allineati agli assi) localizzano gli oggetti con semplici rettangoli, altre tecniche di computer vision offrono diversi livelli di dettaglio o gestiscono scenari diversi:

Applicazioni in scenari reali

Le caselle di delimitazione sono parte integrante di numerose applicazioni pratiche di intelligenza artificiale:

  1. Veicoli autonomi: Le auto a guida autonoma si basano molto sul rilevamento degli oggetti per identificare e localizzare i pedoni, gli altri veicoli, i semafori e gli ostacoli utilizzando le bounding box. Questa consapevolezza spaziale, spesso ottenuta grazie a modelli di deep learning, è fondamentale per una navigazione e un processo decisionale sicuri. Aziende come Waymo mettono ampiamente in mostra questa tecnologia. Ultralytics offre approfondimenti sull'intelligenza artificiale nelle auto a guida autonoma.
  2. Retail Analytics: Nella vendita al dettaglio, le bounding box aiutano la gestione dell'inventario guidata dall'intelligenza artificiale, rilevando i prodotti sugli scaffali, monitorando i livelli delle scorte e analizzando il comportamento dei clienti attraverso l'interazione con gli scaffali o i modelli di traffico pedonale(conteggio degli oggetti).
  3. Sicurezza e sorveglianza: Le Bounding Box consentono ai sistemi di monitoraggio automatizzati di rilevare e tracciare individui o oggetti di interesse in tempo reale, attivando avvisi per accessi non autorizzati o attività sospette. Questo aspetto è fondamentale per le applicazioni edilizie come i sistemi di allarme di sicurezza.
  4. Analisi delle immagini mediche: Nel settore sanitario, i riquadri di delimitazione aiutano i radiologi e i medici a evidenziare potenziali anomalie come tumori o lesioni nelle scansioni (radiografie, TAC, risonanze magnetiche), favorendo una diagnosi più rapida e accurata. Vedi esempi in Radiologia: Intelligenza Artificiale e la panoramica di Ultralytics sull'analisi delle immagini mediche.
  5. Agricoltura: Le Bounding Box sono utilizzate nell'agricoltura di precisione per attività come l'identificazione dei frutti da raccogliere(rilevamento dei frutti), il monitoraggio della salute delle colture o l'individuazione dei parassiti.
Leggi tutto