Controllo verde
Link copiato negli appunti

Tutto quello che devi sapere su Ultralytics YOLO11 e le sue applicazioni

Scopri tutto sul nuovo modello Ultralytics YOLO11 , le sue caratteristiche e le applicazioni in tempo reale in diversi settori. Ti spiegheremo tutto quello che devi sapere.

Lunedì 30 settembre, Ultralytics ha lanciato ufficialmente Ultralytics YOLO11, l'ultimo ritrovato nel campo della computer vision, dopo il suo debutto a YOLO Vision 2024 (YV24), l'evento ibrido annuale di Ultralytics. La comunità dell'intelligenza artificiale è in fermento e si affretta a esplorare le capacità del modello. Grazie a un'elaborazione più veloce, a una maggiore precisione e a modelli ottimizzati sia per i dispositivi edge che per l'implementazione nel cloud, YOLO11 ridefinisce le possibilità delle applicazioni di computer vision in tempo reale.

In un'intervista, il fondatore e CEO di Ultralytics Glenn Jocher ha dichiarato: "Il mondo si sta muovendo verso l'energia pulita, ma non abbastanza velocemente. Vogliamo che i nostri modelli siano addestrabili in un numero minore di epoche, con meno incrementi e meno dati, quindi stiamo lavorando sodo su questo aspetto. Il modello di rilevamento degli oggetti più piccolo, YOLO11n, ha solo 2,6 milioni di parametri, circa la dimensione di un JPEG, il che è davvero pazzesco. Il modello di rilevamento degli oggetti più grande, YOLO11x, ha circa 56 milioni di parametri e anche questo è incredibilmente piccolo rispetto ad altri modelli. Puoi addestrarli su un economico GPU, come un Nvidia GPU di cinque anni, con un po' di entusiasmo e un po' di caffè".

In questo articolo daremo uno sguardo approfondito a YOLO11, esplorando le sue caratteristiche, i miglioramenti, i benchmark delle prestazioni e le applicazioni reali per aiutarti a capire cosa può fare questo modello. Iniziamo!

Capire YOLO11: miglioramenti rispetto alle versioni precedenti

YOLO11 è l'ultima novità della serie di modelli di computer vision YOLO (You Only Look Once) e offre miglioramenti significativi rispetto alle versioni precedenti come YOLOv5 e YOLOv8. Il team di Ultralytics ha incorporato il feedback della comunità e la ricerca all'avanguardia per rendere YOLO11 più veloce, più preciso e più efficiente. YOLO11 supporta anche le stesse attività di computer vision di YOLOv8, tra cui il rilevamento di oggetti, la segmentazione di istanze e la classificazione di immagini. Infatti, gli utenti possono facilmente passare a YOLO11 senza dover modificare i flussi di lavoro esistenti.

Uno dei punti salienti di YOLO11 è la sua performance superiore sia in termini di precisione che di velocità rispetto ai suoi predecessori. Con il 22% di parametri in meno rispetto a YOLOv8m, YOLO11m raggiunge una precisione media superiore (mAP) sul set di dati COCO, il che significa che può rilevare gli oggetti in modo più preciso ed efficiente. In termini di velocità di elaborazione, YOLO11 supera i modelli precedenti, rendendolo ideale per le applicazioni in tempo reale, dove il rilevamento e la risposta rapida sono fondamentali e ogni millisecondo conta.

Il grafico di benchmarking qui sotto illustra come YOLO11 si distingua dai modelli precedenti. Sull'asse orizzontale è riportata la precisione media (AP) di COCO Box, che misura l'accuratezza del rilevamento degli oggetti. L'asse verticale mostra la latenza utilizzando TensorRT10 FP16 su un NVIDIA T4 GPU, indicando la velocità con cui il modello elabora i dati. 

Fig 1. YOLO11 offre funzionalità di rilevamento degli oggetti in tempo reale all'avanguardia.

YOLO11 Lancio del modello: Opzioni open source e aziendali

Con il lancio di Ultralytics YOLO11 , Ultralytics amplia la serie YOLO offrendo modelli open-source e aziendali per soddisfare la crescente domanda dei settori industriali.

Figura 2. Con questo lancio, Ultralytics offre 30 nuovi modelli.

YOLO11 presenta cinque modelli di dimensioni diverse: Nano, Small, Medium, Large e X. Gli utenti possono scegliere il modello migliore in base alle esigenze specifiche della loro applicazione di computer vision. Le cinque dimensioni offrono flessibilità per compiti come la classificazione delle immagini, il rilevamento di oggetti, la segmentazione di istanze, il tracciamento, la stima della posa e il rilevamento di oggetti orientati (OBB). Per ogni dimensione è disponibile un modello per ogni compito, per un totale di 25 modelli open-source che costituiscono il nucleo dell'offerta di Ultralytics'. Questi modelli sono ideali per un'ampia gamma di applicazioni, dalle attività leggere su dispositivi edge, dove il modello YOLO11n offre un'efficienza impressionante, alle applicazioni su larga scala che richiedono i modelli YOLO11l e YOLO11x.

Per la prima volta, Ultralytics introduce i modelli aziendali, segnando un'importante pietra miliare nella nostra offerta di prodotti, e siamo entusiasti di condividere queste novità con i nostri utenti. YOLO11 introduce cinque modelli proprietari progettati specificamente per casi d'uso commerciali. Questi modelli aziendali, che saranno disponibili dal mese prossimo, sono addestrati sul nuovo set di dati proprietario di Ultralytics, composto da oltre 1 milione di immagini, e offrono modelli pre-addestrati più robusti. Sono stati progettati per applicazioni impegnative e reali, come l'analisi di immagini mediche e l'elaborazione di immagini satellitari, in cui è fondamentale il rilevamento preciso degli oggetti.

Esplorare le caratteristiche della prossima generazione di YOLO11

Ora che abbiamo parlato di ciò che offre YOLO11 , diamo un'occhiata a ciò che rende YOLO11 così speciale.

Una delle sfide principali nello sviluppo di YOLO11 è stata quella di trovare il giusto equilibrio tra priorità concorrenti: rendere i modelli più piccoli, più veloci e più precisi. Come ha spiegato Glenn Jocher, fondatore e CEO di Ultralytics, "Lavorare alla ricerca e allo sviluppo di YOLO è davvero impegnativo perché si vuole andare in tre direzioni diverse: si vogliono rendere i modelli più piccoli, più precisi, ma anche più veloci su piattaforme diverse come CPU e GPU. Tutti questi interessi sono in competizione tra loro, quindi devi scendere a compromessi e scegliere dove apportare le modifiche". Nonostante queste sfide, YOLO11 raggiunge un equilibrio impressionante, offrendo miglioramenti sia in termini di velocità che di precisione rispetto a versioni precedenti come YOLOv8.

Figura 3. Un esempio di utilizzo di YOLO11 per il rilevamento degli oggetti.

YOLO11 apporta miglioramenti sostanziali come l'estrazione migliorata delle caratteristiche grazie a un'architettura a spina dorsale e collo ridisegnata, che porta a un rilevamento più preciso degli oggetti. Il modello è inoltre ottimizzato per la velocità e l'efficienza, offrendo tempi di elaborazione più rapidi pur mantenendo un'elevata precisione. Oltre a questi vantaggi, YOLO11 è altamente adattabile a diversi ambienti e funziona perfettamente su dispositivi edge, piattaforme cloud e sistemi che utilizzano le GPU NVIDIA . Questa adattabilità lo rende una scelta ideale per gli utenti che hanno bisogno di opzioni di distribuzione flessibili su diverse configurazioni hardware, dai dispositivi mobili ai server su larga scala.

Applicazioni in tempo reale YOLO11

YOLO11La sua versatilità lo rende uno strumento affidabile in molti settori, soprattutto quando si tratta di casi d'uso complessi. Ad esempio, funziona perfettamente sui dispositivi edge e può essere utilizzato per applicazioni che richiedono analisi in tempo reale in ambienti con potenza di calcolo limitata. Un esempio eccellente è la guida autonoma, dove i veicoli devono prendere decisioni in una frazione di secondo per garantire la sicurezza di tutti. YOLO11 aiuta a rilevare e analizzare gli oggetti sulla strada, come pedoni o altre auto, anche in condizioni difficili come la scarsa illuminazione o quando gli oggetti sono parzialmente nascosti. Un rilevamento rapido e accurato aiuta a prevenire gli incidenti e garantisce ai veicoli a guida autonoma una navigazione sicura.

Figura 4. Glenn Jocher sul palco di YV24, mentre parla delle applicazioni di YOLO11 .

Un altro esempio interessante della portata di YOLO11è la sua capacità di gestire le bounding box orientate (OBB). È essenziale per rilevare gli oggetti non perfettamente allineati. Il rilevamento di oggetti OBB è una funzione particolarmente utile in settori come l'agricoltura, la mappatura e la sorveglianza, dove le immagini contengono spesso oggetti ruotati come coltivazioni o edifici in immagini aeree o satellitari. A differenza dei modelli tradizionali, YOLO11 è in grado di identificare oggetti con qualsiasi angolazione e di fornire risultati molto più accurati per le attività che richiedono precisione.

YOLO11 per gli sviluppatori di AI: Provalo tu stesso

Iniziare a lavorare con YOLO11 è semplice e accessibile, sia che tu preferisca la codifica che l'opzione no-code. Per lavorare con YOLO11 attraverso il codice, puoi utilizzare il pacchettoUltralytics Python per addestrare e distribuire facilmente i modelli. Se preferisci un approccio senza codice, Ultralytics HUB ti permette di provare YOLO11 con pochi clic.

YOLO11 Passaggio del codice

Per utilizzare YOLO11 con Python, devi prima installare il pacchetto Ultralytics . A seconda delle tue preferenze, puoi farlo utilizzando pip, conda o Docker. Per istruzioni dettagliate e buone pratiche relative al processo di installazione, consulta la nostra Guida all'installazione diUltralytics . Durante l'installazione dei pacchetti necessari per YOLO11, se incontri qualche difficoltà, consulta la nostra Guida ai problemi comuni per trovare soluzioni e suggerimenti.

Una volta installato il pacchetto Ultralytics , l'utilizzo di YOLO11 è semplice. Il seguente frammento di codice ti guida attraverso il processo di caricamento di un modello, la sua formazione, il test delle sue prestazioni e l'esportazione nel formatoONNX . Per esempi più approfonditi e per un utilizzo avanzato, assicurati di consultare la documentazione ufficiale di Ultralytics , dove troverai guide dettagliate e best practice per ottenere il massimo da YOLO11.

Figura 5. Utilizzo di YOLO11 attraverso il pacchetto Ultralytics . 

Per gli utenti che preferiscono un approccio senza codice, Ultralytics HUB offre un modo semplice per addestrare e distribuire i modelli di YOLO11 con pochi clic. Per iniziare a utilizzare HUB, basta creare un account sulla piattaforma Ultralytics HUB e potrai iniziare ad addestrare e gestire i tuoi modelli attraverso un'interfaccia intuitiva.

YOLO11: Dare forma al futuro dell'intelligenza artificiale

La comunità dell'intelligenza artificiale è in costante progresso nel campo della computer vision, con l'obiettivo di sviluppare modelli più veloci e accurati per le applicazioni del mondo reale. Ultralytics YOLO11 è un'importante pietra miliare in questo sforzo, con una maggiore velocità, precisione e flessibilità. È stato progettato per le applicazioni in tempo reale e per le applicazioni edge, quindi è ideale per settori come la sanità e la guida autonoma. Sia che tu stia usando il pacchetto Ultralytics Python o l'Hub senza codice Ultralytics , YOLO11 semplifica le complesse attività di Vision AI. Offre potenti funzionalità di visione artificiale e rappresenta un'ottima scelta per sviluppatori e aziende.

Dai un'occhiata al nostro repository GitHub e unisciti alla nostra attiva comunità per saperne di più sull'IA. Scopri come Vision AI sta guidando l'innovazione in settori come la sanità e l'agricoltura.

Logo di FacebookLogo di TwitterLogo di LinkedInSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico