Segmentazione delle immagini con Ultralytics YOLO11 su Google Colab

Abirami Vina

4 minuti di lettura

30 dicembre 2024

Scoprite come utilizzare efficacemente Ultralytics YOLO11 per la segmentazione delle immagini, sfruttando un set di dati di parti di automobili su Google Colab per un addestramento e un test senza soluzione di continuità.

I modelli Ultralytics YOLO, come l'ultimo Ultralytics YOLO11, supportano una serie di compiti di visione artificiale come il rilevamento di oggetti, la classificazione di immagini e la segmentazione di istanze. Ognuno di questi compiti mira a replicare un aspetto specifico della visione umana, rendendo possibile alle macchine di vedere e interpretare il mondo che le circonda. 

Per esempio, si pensi a come uno studente di una classe di arte può prendere una matita e delineare un oggetto in un disegno. Dietro le quinte, il loro cervello esegue la segmentazione, distinguendo l'oggetto dallo sfondo e da altri elementi. La segmentazione delle immagini raggiunge un obiettivo simile utilizzando l'intelligenza artificiale (AI), scomponendo i dati visivi in parti significative che le macchine possono comprendere. Questa tecnica può essere utilizzata in una varietà di applicazioni in molti settori. 

__wf_reserved_inherit
Figura 1. Ultralytics YOLO11 utilizzato per segmentare gli oggetti in un'immagine.

Un esempio pratico è la segmentazione delle parti di automobili. Identificando e categorizzando componenti specifici di un veicolo, la segmentazione delle immagini può snellire i processi in settori come la produzione e la riparazione di automobili e la catalogazione del commercio elettronico.

In questo articolo analizzeremo come sia possibile utilizzare Ultralytics YOLO11, Google Colab e il dataset Roboflow Carparts Segmentation per costruire una soluzione in grado di identificare e segmentare con precisione le parti di automobili.

Ultralytics YOLO11 è facile da usare

Ultralytics YOLO11 è disponibile come modello pre-addestrato sul dataset COCO, che copre 80 diverse classi di oggetti. Tuttavia, per applicazioni specifiche, come la segmentazione di parti di automobili, il modello può essere addestrato su misura per adattarsi meglio al dataset e al caso d'uso. Questa flessibilità consente a YOLO11 di ottenere buone prestazioni sia in compiti generici che in compiti altamente specializzati.

L'addestramento personalizzato prevede l'utilizzo del modello YOLO11 pre-addestrato e la sua messa a punto su un nuovo set di dati. Fornendo esempi etichettati specifici per l'attività svolta, il modello impara a riconoscere e a segmentare gli oggetti specifici del progetto. L'addestramento personalizzato garantisce una maggiore accuratezza e rilevanza rispetto all'utilizzo di pesi generici pre-addestrati.

L'impostazione di YOLO11 per la formazione personalizzata è semplice. Con una configurazione minima, è possibile caricare il modello e il set di dati, avviare l'addestramento e monitorare metriche come la perdita e l'accuratezza durante il processo. YOLO11 include anche strumenti integrati per la convalida e la valutazione, rendendo più semplice la valutazione delle prestazioni del modello. 

Esecuzione di Ultralytics YOLO11 su Google Colab

Quando si fa un addestramento personalizzato con YOLO11, ci sono diverse opzioni per impostare un ambiente. Una delle scelte più accessibili e convenienti è Google Colab. Ecco alcuni vantaggi dell'utilizzo di Google Colab per la formazione su YOLO11:

  • Accesso gratuito alle risorse: Google Colab mette a disposizione GPU (Graphics Processing Units) e TPU (Tensor Processing Units), consentendo di addestrare YOLO11 senza hardware costoso.
  • Ambiente collaborativo: Google Colab consente di condividere i taccuini, di archiviare il lavoro in Google Drive e di semplificare il lavoro di squadra grazie alla collaborazione e al monitoraggio delle versioni.
  • Librerie preinstallate: Con strumenti preinstallati come PyTorch e TensorFlow, Google Colab semplifica il processo di configurazione e aiuta a iniziare rapidamente.
  • Integrazione con il cloud: È possibile caricare facilmente i set di dati da Google Drive, GitHub o altre fonti cloud, semplificando la preparazione e l'archiviazione dei dati.
__wf_reserved_inherit
Figura 2. Il notebook Google Colab YOLO11.

Ultralytics offre anche un notebook Google Colab preconfigurato appositamente per la formazione YOLO11. Questo notebook include tutto il necessario, dalla formazione del modello alla valutazione delle prestazioni, rendendo il processo semplice e facile da seguire. È un ottimo punto di partenza e consente di concentrarsi sulla messa a punto del modello per le proprie esigenze specifiche senza preoccuparsi di complicate fasi di configurazione.

Panoramica del dataset Roboflow per la segmentazione delle parti di automobili

Dopo aver deciso l'ambiente di addestramento, il passo successivo è raccogliere i dati o scegliere un set di dati adatto per la segmentazione delle parti di automobili. Il dataset Roboflow Carparts Segmentation, disponibile su Roboflow Universe, è gestito da Roboflow, una piattaforma che fornisce strumenti per la costruzione, l'addestramento e la distribuzione di modelli di computer vision. Questo dataset comprende 3.156 immagini di addestramento, 401 immagini di validazione e 276 immagini di test, tutte con annotazioni di alta qualità relative a parti di automobili come paraurti, portiere, specchietti e ruote.

Normalmente, è necessario scaricare il set di dati da Roboflow Universe e impostarlo manualmente per la formazione su Google Collab. Tuttavia, il pacchetto Ultralytics Python semplifica questo processo offrendo un'integrazione perfetta e strumenti preconfigurati.

__wf_reserved_inherit
Figura 3. Esempi tratti dal set di dati sulla segmentazione di parti di automobili.

Con Ultralytics, il dataset è pronto per l'uso attraverso un file YAML preconfigurato che include i percorsi del dataset, le etichette delle classi e altri parametri di addestramento. Questo si occupa della configurazione per voi, in modo che possiate caricare rapidamente il dataset e passare direttamente all'addestramento del vostro modello. Inoltre, il dataset è strutturato con set di addestramento, convalida e test dedicati, rendendo più facile il monitoraggio dei progressi e la valutazione delle prestazioni.

Sfruttando il dataset di segmentazione Roboflow Carparts con gli strumenti forniti da Ultralytics YOLO11, si dispone di un flusso di lavoro continuo per costruire modelli di segmentazione in modo efficiente su piattaforme come Google Colab. Questo approccio riduce i tempi di configurazione e consente di concentrarsi sul perfezionamento del modello per le applicazioni reali.

Applicazioni reali della segmentazione dei componenti per auto

La segmentazione dei ricambi auto ha una serie di utilizzi pratici in diversi settori. Per esempio, nelle officine di riparazione, può aiutare a identificare e classificare rapidamente i componenti danneggiati per rendere il processo di riparazione più rapido ed efficiente. Allo stesso modo, nel settore assicurativo, i modelli di segmentazione possono automatizzare la valutazione dei sinistri analizzando le immagini dei veicoli danneggiati per identificare le parti interessate. In questo modo si accelera il processo di risarcimento, si riducono gli errori e si risparmia tempo sia per gli assicuratori che per i clienti.

__wf_reserved_inherit
Figura 4. Segmentazione di parti di automobili con YOLO.

Per quanto riguarda la produzione, la segmentazione supporta il controllo della qualità ispezionando i componenti delle auto per individuare eventuali difetti, garantire la coerenza e ridurre gli scarti. Queste applicazioni dimostrano come la segmentazione dei componenti automobilistici possa trasformare le industrie rendendo i processi più sicuri, veloci e accurati.

Guida passo-passo: utilizzo di YOLO11 su Google Colab 

Ora che abbiamo affrontato tutti i dettagli, è il momento di mettere tutto insieme. Per iniziare, potete dare un'occhiata al nostro video su YouTube, che vi guida attraverso l'intero processo di impostazione, formazione e convalida di un modello YOLO11 per la segmentazione dei ricambi auto.

Ecco una rapida panoramica dei passaggi necessari:

  • Configurare l'ambiente su Google Colab: Abilitare il supporto GPU e installare il pacchetto Ultralytics Python per preparare l'addestramento del modello.
  • Caricare il modello YOLO11: Iniziare con un modello di segmentazione YOLO11 pre-addestrato per risparmiare tempo e sfruttare le caratteristiche esistenti per la segmentazione dei componenti auto.
  • Addestrare il modello con il dataset: Utilizzare il file "carparts-seg.yaml" durante l'addestramento per scaricare, configurare e utilizzare automaticamente il dataset Roboflow Carparts Segmentation. Regolare parametri come le epoche, la dimensione dell'immagine e la dimensione del batch per mettere a punto il modello.
  • Monitorare i progressi dell'addestramento: Tenere traccia delle principali metriche delle prestazioni, come la perdita di segmentazione e la precisione media (mAP), per garantire che il modello migliori come previsto.
  • Convalidare e distribuire il modello: Testare il modello addestrato sul set di validazione per confermarne l'accuratezza ed esportarlo per applicazioni reali come il controllo qualità o l'elaborazione delle richieste di risarcimento assicurativo.

Vantaggi dell'utilizzo di YOLO11 per la segmentazione dei ricambi auto

YOLO11 è uno strumento affidabile ed efficiente per la segmentazione dei componenti auto, che offre una serie di vantaggi che lo rendono ideale per diverse applicazioni reali. Ecco i principali vantaggi:

  • Velocità ed efficienza: YOLO11 elabora rapidamente le immagini mantenendo un'elevata precisione, rendendolo adatto a compiti in tempo reale come il controllo qualità e i veicoli autonomi.
  • Elevata precisione: Il modello eccelle nel rilevare e segmentare più oggetti all'interno di una singola immagine, garantendo un'identificazione precisa delle parti dell'auto.
  • Scalabilità: YOLO11 è in grado di gestire grandi insiemi di dati e complesse attività di segmentazione, rendendolo scalabile per le applicazioni industriali.
  • Molteplici integrazioni: Ultralytics supporta integrazioni con piattaforme come Google Colab, Ultralytics Hub e altri strumenti popolari, migliorando la flessibilità e l'accessibilità per gli sviluppatori.

Suggerimenti per lavorare con YOLO11 su Google Collab

Sebbene Google Colab renda i flussi di lavoro di apprendimento automatico molto più facili da gestire, può richiedere un po' di tempo per abituarsi se si è alle prime armi. La navigazione nella configurazione basata su cloud, nelle impostazioni di runtime e nei limiti di sessione può sembrare complicata all'inizio, ma ci sono alcuni suggerimenti che possono rendere le cose molto più semplici.

Ecco alcune considerazioni da tenere a mente:

  • Iniziate attivando l'accelerazione GPU nelle impostazioni del runtime per accelerare la formazione.
  • Poiché Colab viene eseguito nel cloud, assicuratevi di avere una connessione internet stabile per accedere alle risorse come i dataset e i repository.
  • Organizzate i vostri file e set di dati in Google Drive o GitHub per facilitarne il caricamento e la gestione all'interno di Colab.
  • Se si riscontrano limiti di memoria sul livello gratuito di Colab, provare a ridurre le dimensioni dell'immagine o del batch durante l'addestramento.
  • Ricordate di salvare regolarmente il modello e i risultati, poiché le sessioni di Colab hanno dei limiti di tempo e non volete perdere i vostri progressi. 

Ottenere di più con YOLO11

Ultralytics YOLO11, in combinazione con piattaforme come Google Colab e dataset come il dataset Roboflow Carparts Segmentation, rende la segmentazione delle immagini semplice e accessibile. Grazie ai suoi strumenti intuitivi, ai modelli pre-addestrati e alla facilità di configurazione, YOLO11 consente di immergersi in attività di computer vision avanzate con facilità. 

Che si tratti di migliorare la sicurezza automobilistica, di ottimizzare la produzione o di creare applicazioni innovative di intelligenza artificiale, questa combinazione fornisce gli strumenti per il successo. Con Ultralytics YOLO11 non vi limitate a costruire modelli, ma aprite la strada a soluzioni più intelligenti ed efficienti nel mondo reale.

Per saperne di più, consultate il nostro repository GitHub e partecipate alla nostra comunità. Esplorate le applicazioni dell'intelligenza artificiale nelle auto a guida autonoma e la computer vision per l'agricoltura sulle nostre pagine dedicate alle soluzioni. 🚀

Costruiamo insieme il futuro
dell'IA!

Iniziate il vostro viaggio nel futuro dell'apprendimento automatico

Iniziare gratuitamente
Link copiato negli appunti