Glossario

Rilevatori di oggetti One-Stage

Scopri i rilevatori di oggetti a stadio singolo per l'intelligenza artificiale in tempo reale ad alta velocità. Scopri come Ultralytics offre precisione ed efficienza eccellenti per l'intelligenza artificiale edge e l'implementazione.

I rilevatori di oggetti a stadio singolo sono una potente classe di architetture di deep learning progettate per eseguire attività di rilevamento di oggetti con velocità ed efficienza eccezionali. A differenza dei tradizionali rilevatori di oggetti a due stadi, che dividono il processo di rilevamento in fasi separate per la proposta di regione e la successiva classificazione, i modelli a stadio singolo analizzano l'intera immagine in un unico passaggio. Inquadrando il rilevamento come un problema di regressione diretta, queste reti prevedono simultaneamente le coordinate del riquadro di delimitazione e le probabilità di classe direttamente dai pixel di input. Questo approccio semplificato riduce significativamente il sovraccarico computazionale, rendendo i rilevatori monostadio la scelta preferita per le applicazioni che richiedono inferenza e implementazione in tempo reale su dispositivi AI edge con risorse limitate.

Principi operativi fondamentali

L'architettura di un rilevatore a stadio singolo è tipicamente incentrata su una rete neurale convoluzionale (CNN) che funge da backbone per l' estrazione delle caratteristiche. Quando un'immagine passa attraverso la rete, il modello genera una griglia di mappe di caratteristiche che codificano le informazioni spaziali e semantiche.

Le prime implementazioni, come il Single Shot MultiBox Detector (SSD), si basavano su riquadri di ancoraggio predefiniti a varie scale per localizzare gli oggetti. Tuttavia, i progressi moderni come Ultralytics YOLO11 e il più recente YOLO26 si sono in gran parte orientati verso progetti senza anchor. Queste nuove architetture prevedono direttamente il centro e le dimensioni degli oggetti, eliminando la necessità di una complessa regolazione degli iperparametri associata agli anchor. Il risultato finale consiste in vettori di coordinate per la localizzazione e un punteggio di affidabilità che rappresenta la certezza del modello riguardo all'oggetto rilevato.

Rivelatori a uno o a due stadi

Distinguere tra queste due categorie principali aiuta a selezionare lo strumento giusto per un compito specifico:

Rilevatori di oggetti a stadio singolo: modelli come l' Ultralytics YOLO danno la priorità a una bassa latenza di inferenza. Sono ottimizzati per la velocità, il che li rende ideali per i flussi video e le applicazioni mobili. Le recenti iterazioni hanno ridotto significativamente il divario di accuratezza , spesso eguagliando o superando la precisione dei modelli più lenti, pur mantenendo le prestazioni in tempo reale.
Rilevatori di oggetti a due stadi: architetture come la famiglia R-CNN generano prima proposte di regione e poi classify . Sebbene storicamente offrano una maggiore precisione per oggetti piccoli o occlusi, comportano costi computazionali più elevati e sono generalmente più lenti, limitandone l'uso in scenari sensibili al tempo.

Applicazioni nel mondo reale

L'efficienza dei rilevatori monostadio ha portato alla loro diffusione in diversi settori industriali in cui la reattività immediata è fondamentale:

Veicoli autonomi: le auto a guida autonoma richiedono l'elaborazione istantanea dei feed video per identificare pedoni, segnali stradali e altri veicoli. I leader del settore si affidano a sistemi di visione ad alta velocità per navigare in sicurezza in ambienti complessi, spesso utilizzando il tracciamento degli oggetti insieme al rilevamento.
Produzione intelligente: su linee di assemblaggio ad alta velocità, questi modelli eseguono il controllo qualità automatizzato rilevando difetti o verificando il posizionamento dei componenti in tempo reale. Ciò garantisce l'efficienza della produzione senza colli di bottiglia, spesso integrati tramite Ultralytics per una facile implementazione.
Edge AI e IoT: la loro natura leggera rende i rilevatori monostadio perfetti per dispositivi IoT come il Raspberry Pi o il NVIDIA , portando un'intelligenza avanzata alle telecamere remote e ai droni senza bisogno di una connettività cloud costante.

Implementazione tecnica con Python

L'implementazione di un rilevatore monostadio è semplice utilizzando le moderne API di alto livello. Per garantire risultati accurati, i modelli spesso prevedono più potenziali riquadri, che vengono poi filtrati utilizzando tecniche come la soppressione non massima (NMS) basata su soglie di intersezione su unione (IoU), anche se i modelli end-to-end più recenti come YOLO26 gestiscono questo aspetto in modo nativo.

Il seguente Python mostra come caricare il modello all'avanguardia YOLO26 ed eseguire l'inferenza su un'immagine:

from ultralytics import YOLO

# Load the YOLO26 model, the latest natively end-to-end one-stage detector
model = YOLO("yolo26n.pt")

# Run inference on an image URL to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the first result with bounding boxes and labels
results[0].show()

Vantaggi delle moderne architetture monostadio

L'evoluzione dei rilevatori a stadio singolo si è concentrata sul superamento del compromesso "precisione contro velocità". Tecniche come Focal Loss sono state introdotte per affrontare lo squilibrio di classe durante l'addestramento, assicurando che il modello si concentri suclassify piuttosto che sullo sfondo abbondante . Inoltre, l'integrazione delle Feature Pyramid Networks (FPN) consente a questi modelli di detect efficacemente detect su scale diverse.

Oggi, ricercatori e sviluppatori possono facilmente addestrare queste architetture avanzate su set di dati personalizzati utilizzando strumenti come la Ultralytics , che semplifica il flusso di lavoro dall' annotazione dei dati alla distribuzione dei modelli. Che si tratti di agricoltura o di sanità, l'accessibilità dei rilevatori a stadio singolo sta democratizzando le potenti capacità della visione artificiale.

Rilevatori di oggetti One-Stage

Addestrare i modelliYOLO di Ultralytics per ottimizzare i flussi di lavoro in tutti i settori industriali

Soluzione di licenza aziendale flessibile per potenziare la tua innovazione

Addestrare modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Principi operativi fondamentali

Rivelatori a uno o a due stadi

Applicazioni nel mondo reale

Implementazione tecnica con Python

Vantaggi delle moderne architetture monostadio

Leggi di più in questa categoria

12 casi d'uso delle immagini aeree basati sulla visione artificiale

Che cos'è la stima della profondità monoculare? Una panoramica

Uno sguardo all'utilizzoYOLO Ultralytics per il rilevamento delle minacce tramite IA

Unitevi alla comunità di Ultralytics