Scopri tutto sul nuovo modello Ultralytics YOLO11, le sue caratteristiche e le applicazioni in tempo reale in diversi settori. Ti spiegheremo tutto quello che devi sapere.
Lunedì 30 settembre, Ultralytics ha lanciato ufficialmente Ultralytics YOLO11, l'ultima novità nel campo della computer vision, dopo il suo debutto a YOLO Vision 2024 (YV24), l'evento ibrido annuale di Ultralytics. La comunità dell'intelligenza artificiale è in fermento e si affretta a esplorare le capacità del modello. Grazie a un'elaborazione più veloce, a una maggiore precisione e a modelli ottimizzati sia per i dispositivi edge che per il cloud, YOLO11 ridefinisce le possibilità delle applicazioni di computer vision in tempo reale.
In un'intervista, il fondatore e CEO di Ultralytics Glenn Jocher ha dichiarato: "Il mondo si sta muovendo verso l'energia pulita, ma non abbastanza velocemente. Vogliamo che i nostri modelli siano addestrabili in un numero minore di epoche, con meno incrementi e meno dati, quindi stiamo lavorando sodo su questo aspetto. Il modello di rilevamento degli oggetti più piccolo, YOLO11n, ha solo 2,6 milioni di parametri, circa la dimensione di un JPEG, il che è davvero pazzesco. Il modello di rilevamento degli oggetti più grande, YOLO11x, ha circa 56 milioni di parametri e anche questo è incredibilmente piccolo rispetto ad altri modelli. Puoi addestrarli su un economico GPU, come un Nvidia GPU di cinque anni, con un po' di entusiasmo e un po' di caffè".
In questo articolo daremo un'occhiata più da vicino a YOLO11, esplorando le sue caratteristiche, i miglioramenti, i benchmark delle prestazioni e le applicazioni reali per aiutarti a capire cosa può fare questo modello. Iniziamo!
YOLO11 è l'ultima novità della serie di modelli di computer vision YOLO (You Only Look Once) e offre miglioramenti significativi rispetto alle versioni precedenti come YOLOv5 e YOLOv8. Il team di Ultralytics ha incorporato il feedback della comunità e la ricerca all'avanguardia per rendere YOLO11 più veloce, più preciso e più efficiente. YOLO11 supporta anche le stesse attività di computer vision di YOLOv8, tra cui il rilevamento di oggetti, la segmentazione di istanze e la classificazione di immagini. In effetti, gli utenti possono passare facilmente a YOLO11 senza dover modificare i flussi di lavoro esistenti.
Uno dei punti salienti di YOLO11 è la sua performance superiore sia in termini di precisione che di velocità rispetto ai suoi predecessori. Con il 22% di parametri in meno rispetto a YOLOv8m, YOLO11m raggiunge una precisione media superiore (mAP) sul set di dati COCO, il che significa che è in grado di rilevare gli oggetti in modo più preciso ed efficiente. In termini di velocità di elaborazione, YOLO11 supera i modelli precedenti, rendendolo ideale per le applicazioni in tempo reale, dove il rilevamento e la risposta rapida sono fondamentali e ogni millisecondo conta.
Il grafico di benchmarking qui sotto illustra come YOLO11 si distingua dai modelli precedenti. Sull'asse orizzontale è riportata la precisione media (AP) del COCO Box, che misura l'accuratezza del rilevamento degli oggetti. L'asse verticale mostra la latenza utilizzando TensorRT10 FP16 su un NVIDIA T4 GPU, indicando la velocità con cui il modello elabora i dati.
Con il lancio di Ultralytics YOLO11, Ultralytics amplia la serie YOLO offrendo modelli open-source e aziendali per soddisfare la crescente domanda dei settori industriali.
YOLO11 presenta cinque modelli di dimensioni diverse: Nano, Small, Medium, Large e X. Gli utenti possono scegliere il modello migliore in base alle esigenze specifiche della loro applicazione di computer vision. Le cinque dimensioni offrono flessibilità per compiti come la classificazione delle immagini, il rilevamento di oggetti, la segmentazione di istanze, il tracciamento, la stima della posa e il rilevamento di oggetti con bounding box orientati (OBB). Per ogni dimensione è disponibile un modello per ogni compito, per un totale di 25 modelli open-source che costituiscono il nucleo dell'offerta di Ultralytics'. Questi modelli sono ideali per un'ampia gamma di applicazioni, dalle attività leggere su dispositivi edge, dove il modello YOLO11n offre un'efficienza impressionante, alle applicazioni su larga scala che richiedono i modelli YOLO11l e YOLO11x.
Per la prima volta, Ultralytics introduce modelli aziendali, segnando un'importante pietra miliare nella nostra offerta di prodotti, e siamo entusiasti di condividere queste novità con i nostri utenti. YOLO11 introduce cinque modelli proprietari progettati specificamente per casi d'uso commerciali. Questi modelli aziendali, che saranno disponibili dal mese prossimo, sono addestrati su Ultralytics' nuovo set di dati proprietario, composto da oltre 1 milione di immagini, che offre modelli pre-addestrati più robusti. Sono stati progettati per applicazioni esigenti e reali, come l'analisi di immagini mediche e l'elaborazione di immagini satellitari, in cui è fondamentale il rilevamento preciso degli oggetti.
Ora che abbiamo parlato di ciò che offre YOLO11, diamo un'occhiata a ciò che rende YOLO11 così speciale.
Una delle sfide principali nello sviluppo di YOLO11 è stata quella di trovare il giusto equilibrio tra priorità concorrenti: rendere i modelli più piccoli, più veloci e più precisi. Come ha spiegato Glenn Jocher, fondatore e CEO di Ultralytics, "Lavorare alla ricerca e allo sviluppo di YOLO è davvero impegnativo perché si vuole andare in tre direzioni diverse: si vogliono rendere i modelli più piccoli, più precisi, ma anche più veloci su piattaforme diverse come CPU e GPU. Tutti questi interessi sono in competizione tra loro, quindi bisogna scendere a compromessi e scegliere dove apportare le modifiche". Nonostante queste sfide, YOLO11 raggiunge un equilibrio impressionante, offrendo miglioramenti sia in termini di velocità che di accuratezza rispetto alle versioni precedenti come YOLOv8.
YOLO11 apporta miglioramenti sostanziali come l'estrazione migliorata delle caratteristiche grazie a un'architettura di spina dorsale e collo ridisegnata, che porta a un rilevamento più preciso degli oggetti. Il modello è inoltre ottimizzato per la velocità e l'efficienza, offrendo tempi di elaborazione più rapidi pur mantenendo un'elevata precisione. Oltre a questi vantaggi, YOLO11 è altamente adattabile a diversi ambienti e funziona perfettamente su dispositivi edge, piattaforme cloud e sistemi che utilizzano GPU NVIDIA . Questa adattabilità lo rende una scelta ideale per gli utenti che hanno bisogno di opzioni di distribuzione flessibili su diverse configurazioni hardware, dai dispositivi mobili ai server su larga scala.
La versatilità di YOLO11 lo rende uno strumento affidabile in molti settori, soprattutto quando si tratta di casi d'uso complessi. Ad esempio, funziona perfettamente sui dispositivi edge e può essere utilizzato per applicazioni che richiedono analisi in tempo reale in ambienti con potenza di calcolo limitata. Un esempio eccellente è la guida autonoma, dove i veicoli devono prendere decisioni in una frazione di secondo per garantire la sicurezza di tutti. YOLO11 aiuta a rilevare e analizzare gli oggetti sulla strada, come pedoni o altre auto, anche in condizioni difficili come la scarsa illuminazione o quando gli oggetti sono parzialmente nascosti. Un rilevamento rapido e accurato aiuta a prevenire gli incidenti e garantisce ai veicoli a guida autonoma una navigazione sicura.
Un altro esempio interessante della gamma di YOLO11 è la sua capacità di gestire le bounding box orientate (OBB). È essenziale per rilevare gli oggetti non perfettamente allineati. Il rilevamento di oggetti OBB è una funzione particolarmente utile in settori come l'agricoltura, la mappatura e la sorveglianza, dove le immagini contengono spesso oggetti ruotati come coltivazioni o edifici in immagini aeree o satellitari. A differenza dei modelli tradizionali, YOLO11 è in grado di identificare gli oggetti a qualsiasi angolazione e di fornire risultati molto più accurati per le attività che richiedono precisione.
Iniziare a lavorare con YOLO11 è semplice e accessibile, sia che tu preferisca la codifica che l'opzione no-code. Per lavorare con YOLO11 tramite codice, puoi utilizzare il pacchettoUltralytics Python per addestrare e distribuire facilmente i modelli. Se preferisci un approccio senza codice, Ultralytics HUB ti permette di provare YOLO11 con pochi clic.
Per utilizzare YOLO11 con Python, devi prima installare il pacchetto Ultralytics . A seconda delle tue preferenze, puoi farlo utilizzando pip, conda o Docker. Per istruzioni dettagliate e buone pratiche relative al processo di installazione, consulta la nostra Guida all'installazione diUltralytics . Durante l'installazione dei pacchetti necessari per YOLO11, se dovessi incontrare delle difficoltà, consulta la nostra Guida ai problemi comuni per trovare soluzioni e suggerimenti.
Una volta installato il pacchetto Ultralytics , l'utilizzo di YOLO11 è semplice. Il seguente frammento di codice ti guida attraverso il processo di caricamento di un modello, la sua formazione, il test delle sue prestazioni e l'esportazione in formatoONNX . Per esempi più approfonditi e utilizzi avanzati, consulta la documentazione ufficiale di Ultralytics , dove troverai guide dettagliate e best practice per ottenere il massimo da YOLO11.
Per gli utenti che preferiscono un approccio senza codice, Ultralytics HUB offre un modo semplice per addestrare e distribuire i modelli YOLO11 con pochi clic. Per iniziare a utilizzare HUB, basta creare un account sulla piattaforma Ultralytics HUB e potrai iniziare ad addestrare e gestire i tuoi modelli attraverso un'interfaccia intuitiva.
La comunità dell'intelligenza artificiale fa costantemente progredire il campo della computer vision cercando di sviluppare modelli più veloci e accurati per le applicazioni del mondo reale. Ultralytics YOLO11 è un'importante pietra miliare in questo sforzo, con una maggiore velocità, precisione e flessibilità. È stato progettato per le applicazioni in tempo reale e per le applicazioni edge, quindi è ideale per settori come la sanità e la guida autonoma. Sia che si utilizzi il pacchetto Ultralytics Python sia che si utilizzi l'hub senza codice Ultralytics , YOLO11 semplifica le complesse attività di Vision AI. Offre potenti funzionalità di computer vision e rappresenta un'ottima scelta per sviluppatori e aziende.
Dai un'occhiata al nostro repository GitHub e unisciti alla nostra attiva comunità per saperne di più sull'IA. Scopri come Vision AI sta guidando l'innovazione in settori come la sanità e l'agricoltura.
Inizia il tuo viaggio nel futuro dell'apprendimento automatico