Controllo verde
Link copiato negli appunti

Integrazione della visione artificiale nella robotica con Ultalytics YOLO11

Dai un'occhiata più da vicino a come i modelli di visione computerizzata come Ultralytics YOLO11 stanno rendendo i robot più intelligenti e plasmando il futuro della robotica.

I robot hanno fatto molta strada da Unimate, il primo robot industriale inventato negli anni Cinquanta. Quelle che all'inizio erano macchine pre-programmate e basate su regole, oggi sono diventate sistemi intelligenti in grado di svolgere compiti complessi e di interagire perfettamente con il mondo reale. 

Oggi i robot vengono utilizzati in tutti i settori, da quello manifatturiero e sanitario a quello agricolo, per l'automazione di diversi processi. Un fattore chiave nell'evoluzione della robotica è l'IA e la computer vision, una branca dell'IA che aiuta le macchine a comprendere e interpretare le informazioni visive.

Ad esempio, i modelli di visione computerizzata come Ultralytics YOLO11 stanno migliorando l'intelligenza dei sistemi robotici. Se integrata in questi sistemi, la Vision AI permette ai robot di riconoscere gli oggetti, navigare negli ambienti e prendere decisioni in tempo reale.

In questo articolo daremo un'occhiata a come YOLO11 può migliorare i robot con funzionalità avanzate di computer vision ed esploreremo le sue applicazioni in vari settori.

Una panoramica sull'IA e la computer vision nella robotica

La funzionalità principale di un robot dipende dalla capacità di comprendere l'ambiente circostante. Questa consapevolezza collega l'hardware fisico al processo decisionale intelligente. Senza di essa, i robot possono solo seguire istruzioni fisse e faticano ad adattarsi ad ambienti mutevoli o a gestire compiti complessi. Proprio come gli esseri umani si affidano alla vista per orientarsi, i robot utilizzano la visione computerizzata per interpretare l'ambiente, capire la situazione e intraprendere le azioni appropriate.

Figura 1. Un robot che gioca una partita a Tic-Tac-Toe utilizzando la computer vision per interpretare il tabellone e fare mosse strategiche.

In effetti, la computer vision è fondamentale per la maggior parte delle attività robotiche. Aiuta i robot a rilevare gli oggetti e a evitare gli ostacoli mentre si muovono. Tuttavia, per fare ciò, vedere il mondo non è sufficiente: i robot devono anche essere in grado di reagire rapidamente. Nelle situazioni reali, anche un leggero ritardo può portare a costosi errori. Modelli come Ultralytics YOLO11 permettono ai robot di raccogliere informazioni in tempo reale e di rispondere all'istante, anche in situazioni complesse o poco familiari.

Conoscere Ultralytics YOLO11

Prima di scoprire come YOLO11 può essere integrato nei sistemi robotici, analizziamo le sue caratteristiche principali.

I modelliUltralytics YOLO supportano diverse attività di computer vision che aiutano a fornire approfondimenti rapidi e in tempo reale. In particolare, Ultralytics YOLO11 offre prestazioni più veloci, costi di calcolo inferiori e una maggiore precisione. Ad esempio, può essere utilizzato per rilevare oggetti in immagini e video con un'elevata precisione, il che lo rende perfetto per applicazioni in campi come la robotica, la sanità e la produzione. 

Ecco alcune caratteristiche di grande impatto che rendono YOLO11 un'ottima opzione per la robotica:

  • Facilità di implementazione: È facile da distribuire e si integra perfettamente in un'ampia gamma di piattaforme software e hardware.
  • Adattabilità: YOLO11 funziona bene in diversi ambienti e configurazioni hardware, offrendo prestazioni costanti anche in condizioni dinamiche.

Facile da usare: la documentazione e l'interfaccia di facile comprensione diYOLO11aiutano a ridurre la curva di apprendimento, rendendo semplice l'integrazione nei sistemi robotici.

Figura 2. Un esempio di analisi della posa delle persone in un'immagine utilizzando YOLO11.

Esplorazione dei compiti di visione computerizzata consentiti da YOLO11

Ecco un approfondimento su alcune delle attività di computer vision supportate da YOLO11 : 

  • Rilevamento dell'oggetto: La capacità di rilevamento degli oggetti in tempo reale di YOLO11 permette ai robot di identificare e localizzare istantaneamente gli oggetti all'interno del loro campo visivo. Questo aiuta i robot a evitare gli ostacoli, a eseguire una pianificazione dinamica del percorso e a ottenere una navigazione automatizzata sia in ambienti interni che esterni.
  • Segmentazione degli oggetti: Identificando i confini e le forme esatte dei singoli oggetti, YOLO11 consente ai robot di eseguire operazioni di pick-and-place precise e attività di assemblaggio complesse.
  • Stima della posa: Il supporto di YOLO11per la stima della posa consente ai robot di riconoscere e interpretare i movimenti e i gesti del corpo umano. È fondamentale per i robot collaborativi (cobot) per lavorare in sicurezza accanto agli esseri umani.
  • Tracciamento dell'oggetto: YOLO11 consente di tracciare gli oggetti in movimento nel tempo, rendendolo ideale per le applicazioni di robotica autonoma che devono monitorare l'ambiente circostante in tempo reale.
  • Classificazione delle immagini: YOLO11 è in grado di classificare gli oggetti nelle immagini, consentendo ai robot di classificare gli oggetti, rilevare le anomalie o prendere decisioni in base ai tipi di oggetti, come ad esempio l'identificazione di forniture mediche in ambienti sanitari.
Figura 3. Attività di computer vision supportate da YOLO11.

L'intelligenza artificiale nelle applicazioni robotiche: Alimentato da YOLO11

Dall'apprendimento intelligente all'automazione industriale, modelli come YOLO11 possono contribuire a ridefinire le capacità dei robot. La sua integrazione nella robotica dimostra come i modelli di computer vision stiano guidando i progressi dell'automazione. Esploriamo alcuni settori chiave in cui YOLO11 può avere un impatto significativo.

Insegnare ai robot usando la computer vision 

La computer vision è ampiamente utilizzata nei robot umanoidi, che possono imparare osservando l'ambiente circostante. Modelli come YOLO11 possono contribuire a migliorare questo processo fornendo un rilevamento avanzato degli oggetti e una stima della posa, che aiuta i robot a interpretare con precisione le azioni e i comportamenti umani.

Analizzando i movimenti e le interazioni più sottili in tempo reale, i robot possono essere addestrati a replicare compiti umani complessi. In questo modo possono andare oltre le routine pre-programmate e imparare compiti come l'uso di un telecomando o di un cacciavite, semplicemente osservando una persona.

Figura 4. Un robot che imita un'azione umana.

Questo tipo di apprendimento può essere utile in diversi settori. Ad esempio, in agricoltura, i robot possono osservare i lavoratori umani mentre imparano compiti come la semina, il raccolto e la gestione delle colture. Copiando il modo in cui gli esseri umani svolgono questi compiti, i robot possono adattarsi alle diverse condizioni agricole senza dover essere programmati per ogni situazione.

Applicazioni relative alla robotica sanitaria

Allo stesso modo, nel settore sanitario la computer vision sta diventando sempre più importante. Ad esempio, YOLO11 può essere utilizzato nei dispositivi medici per aiutare i chirurghi a eseguire procedure complesse. Grazie a funzioni come il rilevamento degli oggetti e la segmentazione delle istanze, YOLO11 può aiutare i robot a individuare le strutture interne del corpo, a gestire gli strumenti chirurgici e a compiere movimenti precisi.

Sebbene possa sembrare qualcosa di fantascientifico, una recente ricerca dimostra l'applicazione pratica della computer vision nelle procedure chirurgiche. In un interessante studio sulla dissezione robotica autonoma per la colecistectomia (rimozione della cistifellea), i ricercatori hanno integrato YOLO11 per la segmentazione dei tessuti (classificazione e separazione dei diversi tessuti in un'immagine) e il rilevamento dei punti chiave degli strumenti chirurgici (identificazione di punti di riferimento specifici sugli strumenti). 

Il sistema è stato in grado di distinguere con precisione i diversi tipi di tessuto, anche quando questi si sono deformati (hanno cambiato forma) durante la procedura, e si è adattato dinamicamente a questi cambiamenti. Questo ha permesso agli strumenti robotici di seguire percorsi precisi di dissezione (taglio chirurgico).

Produzione intelligente e automazione industriale

I robot in grado di prelevare e posizionare gli oggetti stanno svolgendo un ruolo fondamentale nell'automazione delle operazioni di produzione e nell'ottimizzazione delle catene di fornitura. La loro velocità e precisione consente loro di svolgere attività con un minimo di input umano, come l'identificazione e lo smistamento degli articoli. 

Grazie alla precisa segmentazione dell'istanza di YOLO11, i bracci robotici possono essere addestrati a rilevare e segmentare gli oggetti che si muovono su un nastro trasportatore, a raccoglierli con precisione e a collocarli in posizioni specifiche in base al loro tipo e alle loro dimensioni.

Ad esempio, le case automobilistiche più famose utilizzano robot basati sulla visione per assemblare diverse parti di automobili, migliorando la velocità e la precisione della catena di montaggio. I modelli di visione computerizzata come YOLO11 possono consentire a questi robot di lavorare a fianco degli operatori umani, garantendo una perfetta integrazione dei sistemi automatizzati in contesti produttivi dinamici. Questo progresso può portare a tempi di produzione più rapidi, meno errori e prodotti di qualità superiore.

Figura 5. Un braccio robotico basato sulla visione che assembla un'automobile.

Vantaggi dell'integrazione di Ultralytics YOLO11 nella robotica

YOLO11 offre diversi vantaggi chiave che lo rendono ideale per una perfetta integrazione nei sistemi di robotica autonoma. Ecco alcuni dei principali vantaggi:

  • Bassa latenza di inferenza: YOLO11 è in grado di fornire previsioni altamente accurate con una bassa latenza, anche in ambienti dinamici.
  • Modelli leggeri: Progettati per ottimizzare le prestazioni, i modelli leggeri di YOLO11consentono ai robot più piccoli con una minore potenza di elaborazione di disporre di funzionalità di visione avanzate senza sacrificare l'efficienza.
  • Efficienza energetica: YOLO11 è stato progettato per essere efficiente dal punto di vista energetico, il che lo rende ideale per i robot alimentati a batteria che devono risparmiare energia pur mantenendo prestazioni elevate.

Limiti della Vision AI nella robotica

Sebbene i modelli di visione computerizzata forniscano strumenti potenti per la visione robotica, ci sono alcune limitazioni da considerare quando li si integra nei sistemi robotici del mondo reale. Alcune di queste limitazioni includono:

  • Raccolta dati costosa: L'addestramento di modelli efficaci per compiti specifici dei robot richiede spesso set di dati ampi, diversificati e ben etichettati, che sono costosi da acquisire.
  • Variazioni ambientali: I robot lavorano in ambienti imprevedibili, dove fattori come le condizioni di illuminazione o gli sfondi ingombrati possono influenzare le prestazioni dei modelli di visione.
  • Problemi di calibrazione e allineamento: Assicurarsi che i sistemi di visione siano calibrati e allineati correttamente con gli altri sensori del robot è fondamentale per ottenere prestazioni accurate, e il disallineamento può portare a errori nel processo decisionale.

Il futuro dei progressi della robotica e dell'IA

I sistemi di visione computerizzata non sono solo strumenti per i robot di oggi, ma sono elementi costitutivi di un futuro in cui i robot potranno operare autonomamente. Grazie alle loro capacità di rilevamento in tempo reale e al supporto di molteplici compiti, sono perfetti per la robotica di prossima generazione.

In effetti, le attuali tendenze del mercato mostrano che la computer vision sta diventando sempre più essenziale nella robotica. I rapporti di settore evidenziano che la computer vision è la seconda tecnologia più utilizzata nel mercato globale della robotica AI. 

Figura 6. Quota di mercato globale dei robot AI per tecnologia.

Punti di forza

Grazie alla sua capacità di elaborare dati visivi in tempo reale, YOLO11 può aiutare i robot a rilevare, identificare e interagire con l'ambiente circostante in modo più accurato. Questo fa una grande differenza in campi come quello manifatturiero, dove i robot possono collaborare con gli esseri umani, e quello sanitario, dove possono assistere in interventi chirurgici complessi. 

Con il continuo progresso della robotica, l'integrazione della computer vision in questi sistemi sarà fondamentale per consentire ai robot di gestire in modo più efficiente un'ampia gamma di compiti. Il futuro della robotica è promettente: l'intelligenza artificiale e la computer vision saranno alla base di macchine sempre più intelligenti e adattabili.

Unisciti alla nostra comunità e consulta il nostro repository GitHub per saperne di più sui recenti sviluppi dell'IA. Esplora le varie applicazioni dell'IA nella sanità e della computer vision in agricoltura nelle nostre pagine dedicate alle soluzioni. Scopri i nostri piani di licenza per creare le tue soluzioni di computer vision.

Logo di FacebookLogo di TwitterLogo di LinkedInSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico