Scopri come il nuovo modello Ultralytics YOLO11 può essere utilizzato per il rilevamento di oggetti per ottenere una maggiore precisione in diverse applicazioni in vari settori.
La computer vision è un campo dell'intelligenza artificiale (AI) che aiuta le macchine a interpretare e comprendere le informazioni visive per svolgere compiti essenziali come il rilevamento degli oggetti. A differenza della classificazione delle immagini, il rilevamento degli oggetti non solo identifica gli oggetti presenti in un'immagine, ma ne individua anche la posizione esatta. Per questo motivo è uno strumento fondamentale per le applicazioni di AI di visione come le auto a guida autonoma, i sistemi di sicurezza in tempo reale e l'automazione dei magazzini.
Nel corso del tempo, la tecnologia di rilevamento degli oggetti è diventata più avanzata e più facile da usare. Un importante passo avanti è stato annunciato in occasione dell'evento ibrido annuale di Ultralytics, YOLO Vision 2024 (YV24), con il lancio del modelloUltralytics YOLO11 . YOLO11 migliora l'accuratezza e le prestazioni, pur supportando le stesse attività di . YOLOv8migliora l'accuratezza e le prestazioni, supportando al contempo le stesse attività del modello , facilitando così la transizione degli utenti dei modelli precedenti.
In questo articolo spiegheremo cos'è il rilevamento degli oggetti, in che modo è diverso da altri compiti di computer vision ed esploreremo le sue applicazioni nel mondo reale. Ti spiegheremo anche come utilizzare il modello YOLO11 con il pacchettoUltralytics Python e la piattaforma HUB Ultralytics . Iniziamo!
Il rilevamento degli oggetti è un'attività fondamentale della computer vision che non si limita a identificare gli oggetti in un'immagine. A differenza della classificazione delle immagini, che si limita a determinare la presenza di un oggetto specifico, il rilevamento degli oggetti riconosce più oggetti e ne individua la posizione esatta utilizzando dei riquadri di delimitazione.
Ad esempio, è in grado di identificare e localizzare i volti in una foto di gruppo, le auto in una strada trafficata o i prodotti sugli scaffali di un negozio. La combinazione di riconoscimento e localizzazione degli oggetti lo rende particolarmente utile per applicazioni come la sorveglianza, il monitoraggio della folla e la gestione automatizzata dell'inventario.
Ciò che distingue il rilevamento degli oggetti da altri compiti come la segmentazione semantica o di istanza è la sua concentrazione ed efficienza.
La segmentazione semantica etichetta ogni pixel di un'immagine, ma non distingue tra i singoli oggetti dello stesso tipo (ad esempio, tutti i volti in una foto verrebbero raggruppati come "volto"). La segmentazione per istanze va oltre, separando ogni oggetto e delineandone la forma esatta, anche se si tratta di oggetti della stessa classe.
Il rilevamento degli oggetti, invece, offre un approccio più snello, identificando e classificando gli oggetti e segnando la loro posizione. Questo lo rende ideale per attività in tempo reale come il rilevamento di volti in filmati di sicurezza o l'identificazione di ostacoli per veicoli autonomi.
YOLO11Le funzioni avanzate di rilevamento degli oggetti lo rendono utile in molti settori. Vediamo alcuni esempi.
YOLO11 e il rilevamento degli oggetti stanno ridefinendo l'analisi della vendita al dettaglio rendendo più efficiente e accurata la gestione dell'inventario e il monitoraggio degli scaffali. La capacità del modello di rilevare gli oggetti in modo rapido e affidabile aiuta i rivenditori a monitorare i livelli delle scorte, a organizzare gli scaffali e a ridurre gli errori nel conteggio dell'inventario.
Ad esempio, YOLO11 può rilevare articoli specifici come gli occhiali da sole sugli scaffali di un negozio. Ma perché un rivenditore dovrebbe voler monitorare uno scaffale? Mantenere gli scaffali riforniti e organizzati è fondamentale per garantire che i clienti possano trovare ciò di cui hanno bisogno, con un impatto diretto sulle vendite. Monitorando gli scaffali in tempo reale, i rivenditori possono individuare rapidamente quando gli articoli sono in esaurimento, fuori posto o sovraffollati, aiutandoli a mantenere un'esposizione organizzata e attraente che migliora l'esperienza di acquisto.
Per funzionare in modo efficiente, una città vivace ha bisogno di un flusso di traffico scorrevole e di strade sicure e YOLO11 può contribuire a rendere tutto ciò possibile. Infatti, molte applicazioni per le smart city possono essere integrate con YOLO11.
Un caso interessante riguarda l'utilizzo del rilevamento degli oggetti per identificare le targhe dei veicoli in movimento. In questo modo, YOLO11 può supportare una più rapida riscossione dei pedaggi, una migliore gestione del traffico e una più rapida applicazione delle norme.
I sistemi Vision AI che monitorano le strade possono avvisare le autorità di violazioni del traffico o di congestioni prima che si aggravino in problemi più gravi. YOLO11 possono anche rilevare pedoni e ciclisti, rendendo le strade più sicure ed efficienti per tutti.
Infatti, la capacità di YOLO11di elaborare dati visivi lo rende uno strumento potente per migliorare le infrastrutture cittadine. Ad esempio, può aiutare a ottimizzare i tempi dei semafori analizzando i movimenti dei veicoli e dei pedoni. Può anche migliorare la sicurezza nelle zone scolastiche rilevando i bambini e avvisando gli automobilisti di rallentare. Con YOLO11, le città possono adottare misure proattive per affrontare le sfide e creare un ambiente più efficiente per tutti.
Il rilevamento di oggetti in tempo reale si riferisce alla capacità di un sistema di identificare e classificare gli oggetti in un flusso video live nel momento in cui appaiono. YOLO11 è stato progettato per ottenere prestazioni superiori in tempo reale ed è in grado di supportare questa capacità. Le sue applicazioni vanno oltre la semplice semplificazione dei processi: può anche contribuire a creare un mondo più inclusivo e accessibile.
Ad esempio, YOLO11 può assistere le persone ipovedenti identificando gli oggetti in tempo reale. In base ai rilevamenti, è possibile fornire descrizioni audio che aiutano gli utenti a navigare nell'ambiente circostante con maggiore indipendenza.
Considera una persona ipovedente che fa la spesa. Scegliere gli articoli giusti può essere difficile, ma YOLO11 può aiutare. Mentre la persona mette gli articoli nel carrello, un sistema integrato con YOLO11 può essere utilizzato per identificare ogni articolo - come banane, avocado o un cartone di latte - e fornire descrizioni audio in tempo reale. In questo modo i clienti possono confermare le loro scelte e assicurarsi di avere tutto ciò di cui hanno bisogno. Riconoscendo gli articoli di uso quotidiano, YOLO11 può semplificare la spesa.
Ora che abbiamo trattato le basi del rilevamento degli oggetti e le sue diverse applicazioni, vediamo come iniziare a utilizzare il modello Ultralytics YOLO11 per attività come il rilevamento degli oggetti.
Ci sono due modi semplici per utilizzare YOLO11: attraverso il pacchetto Ultralytics Python o l'HUB Ultralytics . Esploriamo entrambi i metodi, iniziando dal pacchetto Python .
L'inferenza è quando un modello di intelligenza artificiale analizza nuovi dati inediti per fare previsioni, classificare informazioni o fornire approfondimenti sulla base di quanto appreso durante l'addestramento. Per quanto riguarda il rilevamento di oggetti, ciò significa identificare e localizzare oggetti specifici all'interno di un'immagine o di un video, disegnare riquadri di delimitazione intorno ad essi ed etichettarli in base alla formazione del modello.
Per utilizzare il modello di rilevamento degli oggetti di YOLO11 , devi prima installare il pacchetto Ultralytics Python tramite pip, conda o Docker. Se dovessi riscontrare dei problemi di installazione, consulta la guida alla risoluzione dei problemi per trovare suggerimenti e trucchi che ti aiuteranno a risolverli. Una volta installato, puoi utilizzare il seguente codice per caricare il modello di rilevamento degli oggetti di YOLO11 e fare previsioni su un'immagine.
YOLO11 supporta anche la formazione personalizzata per adattarsi meglio ai tuoi casi d'uso specifici. Grazie alla messa a punto del modello, puoi adattarlo al rilevamento di oggetti rilevanti per il tuo progetto. Per esempio, quando si utilizza la computer vision nel settore sanitario, un modello YOLO11 addestrato su misura potrebbe essere utilizzato per rilevare anomalie specifiche nelle immagini mediche, come i tumori nelle scansioni MRI o le fratture nelle radiografie, aiutando i medici a fare diagnosi più rapide e precise.
Il frammento di codice qui sotto mostra come caricare e addestrare un modello YOLO11 per il rilevamento degli oggetti. Puoi partire da un file di configurazione YAML o da un modello pre-addestrato, trasferire i pesi e addestrare su set di dati come COCO per ottenere capacità di rilevamento degli oggetti più raffinate.
Dopo aver addestrato un modello, puoi anche esportare il modello addestrato in vari formati per distribuirlo in ambienti diversi.
Per chi cerca un'alternativa senza codice, Ultralytics HUB fornisce una piattaforma Vision AI facile da usare per l'addestramento e la distribuzione dei modelli di YOLO , tra cui YOLO11.
Per eseguire il rilevamento di oggetti sulle immagini, basta creare un account, navigare nella sezione "Modelli" e selezionare la variante del modello di rilevamento degli oggetti YOLO11 . Carica la tua immagine e la piattaforma mostrerà gli oggetti rilevati in una sezione di anteprima.
Combinando la flessibilità del pacchetto Python con la facilità dell'HUB, YOLO11 rende semplice per sviluppatori e aziende sfruttare la potenza della tecnologia avanzata di rilevamento degli oggetti.
YOLO11 definisce un nuovo standard nel rilevamento degli oggetti, combinando un'elevata precisione con la versatilità necessaria per soddisfare le esigenze di diversi settori. Dal miglioramento dell'analisi della vendita al dettaglio alla gestione delle infrastrutture delle città intelligenti, YOLO11 è costruito per garantire prestazioni affidabili e in tempo reale in innumerevoli applicazioni.
Grazie alle opzioni di formazione personalizzata e a un'interfaccia facile da usare attraverso Ultralytics HUB, integrare YOLO11 nei tuoi flussi di lavoro non è mai stato così semplice. Che tu sia uno sviluppatore che sta esplorando la computer vision o un'azienda che vuole innovare con l'AI, YOLO11 ti offre gli strumenti necessari per avere successo.
Per saperne di più, consulta il nostro repository GitHub e partecipa alla nostra comunità. Scopri le applicazioni dell'intelligenza artificiale nelle auto a guida autonoma e la computer vision per l'agricoltura nelle nostre pagine dedicate alle soluzioni. 🚀
Inizia il tuo viaggio nel futuro dell'apprendimento automatico