Glossario

Inferenza in tempo reale

Scopri come l'inferenza in tempo reale con Ultralytics YOLO permette di fare previsioni istantanee per applicazioni di AI come la guida autonoma e i sistemi di sicurezza.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'inferenza in tempo reale è il processo che consiste nel fare previsioni con un modello di apprendimento automatico non appena sono disponibili nuovi dati. Questo è in contrasto con l'inferenza batch, in cui le previsioni vengono fatte su un gruppo di dati raccolti nel tempo. Nell'inferenza in tempo reale, l'enfasi è posta sulla velocità e sull'immediatezza, consentendo ai sistemi di reagire e prendere decisioni istantaneamente sulla base delle informazioni più recenti.

Capire l'inferenza in tempo reale

Nel contesto dell'apprendimento automatico, in particolare con modelli come Ultralytics YOLO , l'inferenza in tempo reale significa che il modello è in grado di elaborare singoli input di dati, come immagini o fotogrammi video, e di generare previsioni quasi istantaneamente. Questa capacità è fondamentale per le applicazioni in cui sono essenziali risposte tempestive. Ad esempio, nel rilevamento degli oggetti, l'inferenza in tempo reale permette a un modello di identificare e localizzare gli oggetti in un flusso video in diretta senza ritardi evidenti.

L'efficienza dell'inferenza in tempo reale viene spesso misurata in base alla latenza dell'inferenza, ovvero il tempo necessario a un modello per produrre una previsione da un singolo input. Una bassa latenza è fondamentale affinché i sistemi in tempo reale funzionino in modo efficace. Per ottenere una bassa latenza, i modelli sono spesso ottimizzati per la velocità attraverso tecniche come la quantizzazione del modello e il model pruning, oppure vengono implementati su hardware specializzato come le GPU o le TPU. Framework come TensorRT di NVIDIA sono stati progettati per accelerare l'inferenza, rendendo le prestazioni in tempo reale più raggiungibili.

Applicazioni dell'inferenza in tempo reale

L'inferenza in tempo reale è la spina dorsale di numerose applicazioni all'avanguardia in diversi settori. Ecco un paio di esempi concreti:

  • Guida autonoma: Le auto a guida autonoma si affidano molto all'inferenza in tempo reale per le attività di computer vision. Modelli come Ultralytics YOLO vengono utilizzati per elaborare i feed delle telecamere in tempo reale per rilevare pedoni, veicoli, segnali stradali e altri ostacoli in modo istantaneo, consentendo al veicolo di navigare in sicurezza e di prendere decisioni di guida immediate. Questa elaborazione immediata è fondamentale per la sicurezza e la reattività dei veicoli autonomi. Scopri di più sull'intelligenza artificiale nelle auto a guida autonoma.
  • Sistemi di sicurezza e sorveglianza: I moderni sistemi di sicurezza utilizzano l'inferenza in tempo reale per monitorare i feed video in diretta alla ricerca di anomalie, intrusioni o attività sospette. Ad esempio, un sistema potrebbe utilizzare Ultralytics YOLO per il rilevamento di oggetti in tempo reale per identificare persone non autorizzate in aree riservate o per rilevare potenziali violazioni della sicurezza nel momento stesso in cui si verificano, attivando avvisi e risposte immediate. Esplora i progetti di sistemi di allarme di sicurezza con Ultralytics YOLOv8 .

Questi esempi evidenziano il ruolo critico dell'inferenza in tempo reale nelle applicazioni che richiedono decisioni e risposte immediate basate su dati in rapida evoluzione. Con il progredire della tecnologia AI, l'inferenza in tempo reale continuerà a consentire sistemi più dinamici e reattivi, migliorando l'automazione e l'intelligenza in tutti i settori. Per chi vuole implementare l'inferenza in tempo reale con i modelli di Ultralytics , piattaforme come Ultralytics HUB forniscono strumenti per la formazione, l'ottimizzazione e l'implementazione dei modelli per ottenere prestazioni efficienti e in tempo reale.

Leggi tutto