Scoprite come l'inferenza in tempo reale con Ultralytics YOLO consente previsioni istantanee per applicazioni AI come la guida autonoma e i sistemi di sicurezza.
L'inferenza in tempo reale è il processo di utilizzo di un modello di apprendimento automatico (ML) addestrato per fare previsioni su nuovi dati in tempo reale con un ritardo minimo. Nel contesto dell'IA e della computer vision (CV), ciò significa che il sistema è in grado di elaborare le informazioni, come un flusso video, e di generare un risultato quasi istantaneo. L'obiettivo è rendere la latenza dell'inferenza abbastanza bassa da rendere i risultati immediatamente utili per il processo decisionale. Questa capacità è fondamentale per le applicazioni in cui i tempi sono critici, trasformando il modo in cui i settori, dall'automotive alla sanità, sfruttano l'IA.
È importante distinguere l'inferenza in tempo reale dall'inferenza in batch. La differenza principale sta nel modo in cui vengono elaborati i dati.
Sebbene entrambi utilizzino un modello addestrato per fare previsioni, i loro casi d'uso sono fondamentalmente diversi in base all'urgenza dei risultati.
La capacità di prendere decisioni immediate consente un'ampia gamma di potenti applicazioni in vari settori.
L'esecuzione di modelli sufficientemente veloci per applicazioni di calcolo in tempo reale richiede spesso un'ottimizzazione significativa:
Modelli come Ultralytics YOLO sono stati progettati tenendo conto dell'efficienza e dell'accuratezza, il che li rende adatti a compiti di rilevamento di oggetti in tempo reale. Piattaforme come Ultralytics HUB forniscono strumenti per addestrare, ottimizzare (ad esempio, esportare nei formati ONNX o TensorRT) e distribuire i modelli, facilitando l'implementazione di soluzioni di inferenza in tempo reale attraverso varie opzioni di distribuzione.