Controllo verde
Link copiato negli appunti

Costruisci un sistema ANPR con Ultralytics YOLO11 e GPT-4o Mini

Scopri come costruire un sistema ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo con una precisione in tempo reale.

Trovare parcheggio in un parcheggio affollato, aspettare in lunghe file ai caselli o rimanere bloccati ai controlli di sicurezza è frustrante. I controlli manuali dei veicoli spesso richiedono troppo tempo e causano ritardi. Senza un sistema automatizzato, seguire le auto in modo efficiente può essere difficile. 

La computer vision ha cambiato questa situazione consentendo il riconoscimento delle targhe in tempo reale da immagini e flussi video. Per esempio, Ultralytics YOLO11 è un modello avanzato di computer vision in grado di eseguire compiti avanzati di Vision AI come il rilevamento di oggetti, la classificazione e il tracciamento. Grazie alle capacità di rilevamento degli oggetti di YOLO11, è possibile individuare con precisione le targhe dei veicoli nelle immagini. 

Ultralytics offre notebookGoogle Colab completi che semplificano il processo di creazione di soluzioni Vision AI. Questi notebook sono preconfigurati con le dipendenze essenziali, i modelli e le guide passo-passo, per semplificare la creazione di applicazioni. In particolare, esiste un notebook Colab dedicato all 'ANPR (Automatic Number Plate Recognition).

In questo articolo, utilizzando il notebook Ultralytics Colab per l'ANPR, scopriremo come costruire una soluzione ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo. 

Capire l'ANPR 

Rintracciare le auto manualmente richiede molto tempo ed è soggetto a errori, soprattutto quando si muovono velocemente. Controllare ogni targa una per una rallenta il processo e aumenta il rischio di errori. Il riconoscimento automatico delle targhe risolve questo problema utilizzando la visione computerizzata per rilevare e leggere le targhe istantaneamente, rendendo più efficiente il monitoraggio del traffico e la sicurezza.

I sistemi ANPR possono acquisire immagini o video dei veicoli in transito e utilizzare il rilevamento degli oggetti in tempo reale per identificare le targhe. Una volta rilevate, il riconoscimento del testo viene utilizzato per estrarre automaticamente i numeri di targa, senza bisogno dell'intervento umano. Questo processo garantisce risultati accurati anche quando i veicoli si muovono rapidamente o le targhe sono parzialmente oscurate.

Figura 1. Un esempio di utilizzo di YOLO11 per rilevare una targa.

Al giorno d'oggi, i caselli autostradali, i sistemi di parcheggio e le forze dell'ordine si affidano sempre più all'ANPR per tracciare i veicoli in modo efficiente.

Sfide legate alla tecnologia ANPR

Anche se l'ANPR identifica rapidamente i veicoli, ci sono alcune sfide che possono comprometterne l'accuratezza. Ecco alcuni problemi comuni che possono influenzare il funzionamento di un sistema ANPR:

  • Scarsa illuminazione e maltempo: Le targhe diventano più difficili da leggere di notte e in caso di maltempo. La nebbia, la pioggia e il bagliore dei fari possono offuscare il testo, rendendolo illeggibile.
  • Targhe sfocate o bloccate: Un'auto in rapido movimento può lasciare un'immagine sfocata, soprattutto se la velocità dell'otturatore della fotocamera è troppo bassa. Anche sporcizia, graffi o parti della targa coperte possono causare problemi di riconoscimento. L'uso di fotocamere di alta qualità con le giuste impostazioni aiuta a ottenere risultati più chiari.
  • Design incoerente delle targhe: Non tutte le targhe hanno lo stesso aspetto. Alcune hanno caratteri di fantasia, testo aggiuntivo o loghi che confondono il sistema.
  • Rischi per la privacy e sicurezza dei dati: Conservare i dati dei veicoli in modo sicuro è importante. Le giuste misure di sicurezza possono impedire l'accesso non autorizzato e proteggere le informazioni. Con le giuste precauzioni, i sistemi ANPR possono essere sicuri e affidabili.

Come YOLO11 migliora i sistemi ANPR

Ultralytics YOLO11 può rendere i sistemi ANPR più veloci e precisi. Elabora le immagini in modo rapido e preciso e non richiede una grande potenza di calcolo, per cui funziona bene su tutti i tipi di telecamere di sicurezza, dalle più piccole ai grandi sistemi di traffico.

Grazie alla formazione personalizzata, YOLO11 può essere adattato a diversi stili di targa, lingue e ambienti. Si comporta bene anche in condizioni difficili come la scarsa illuminazione, la sfocatura da movimento e gli angoli difficili quando viene addestrato su set di dati specializzati che includono immagini in queste condizioni.

Identificando i veicoli all'istante, YOLO11 aiuta a ridurre i tempi di attesa, a prevenire gli errori e a migliorare la sicurezza. In questo modo il traffico diventa più fluido e le operazioni più efficienti nei parcheggi, nei caselli autostradali e nei sistemi di sorveglianza.

Costruire un sistema ANPR con YOLO11 e GPT-4o Mini

Vediamo quindi come costruire un sistema ANPR utilizzando YOLO11 e GPT-4o Mini. 

Per questa soluzione esploreremo il codice mostrato nel notebook Ultralytics Google Collab. Il notebook di Google Collab è facile da usare e chiunque può creare un sistema ANPR senza bisogno di una configurazione complicata.

Passo 1: Impostazione dell'ambiente

Per iniziare, dovremo installare le nostre dipendenze, ovvero i pacchetti software e le librerie essenziali per il funzionamento del nostro sistema ANPR. Queste dipendenze ci aiutano a svolgere compiti come il rilevamento degli oggetti, l'elaborazione delle immagini e il riconoscimento del testo, garantendo un funzionamento efficiente del sistema.

Installeremo il pacchettoUltralytics Python come mostrato di seguito. Questo pacchetto fornisce modelli pre-addestrati, utilità di addestramento e strumenti di inferenza che rendono più semplice il rilevamento e il riconoscimento delle targhe con YOLO11.

Figura 2. Installazione del pacchetto Ultralytics Python . 

Dovremo anche configurare GPT-4o Mini per il riconoscimento del testo. Poiché GPT-4o Mini è responsabile dell'estrazione del testo dalle targhe rilevate, abbiamo bisogno di una chiave API per accedere al modello. Questa chiave può essere ottenuta iscrivendosi all'API di GPT-4o Mini. Una volta ottenuta, la chiave può essere aggiunta al notebook Colab in modo che il sistema possa connettersi al modello ed elaborare i numeri di targa.

Dopo aver completato la configurazione ed eseguito il codice di installazione, YOLO11 sarà pronto a rilevare le targhe e GPT-4o Mini sarà impostato per riconoscere ed estrarre il testo da esse.

Passo 2: scaricare il modello addestrato su misura

Ora che è tutto pronto, il passo successivo è scaricare il modello YOLO11 che è stato addestrato per rilevare le targhe. Poiché questo modello è già stato addestrato per rilevare le targhe, non c'è bisogno di addestrarlo da zero. Basta scaricarlo ed è già pronto all'uso. In questo modo si risparmia tempo e si semplifica il processo.

Inoltre, scaricheremo un file video di esempio per testare il sistema. Se vuoi, puoi eseguire questa soluzione anche sui tuoi file video. Una volta scaricati, il modello e i file video saranno archiviati nell'ambiente del notebook.

Figura 3. Download del modello e del file video.

Passo 3: caricare il video e avviare il rilevamento

Una volta che il modello è pronto, è il momento di vederlo in azione. Per prima cosa, il file video viene caricato per l'elaborazione, assicurandosi che si apra correttamente. Viene poi impostato un video writer per salvare il filmato elaborato con le targhe rilevate, mantenendo le dimensioni e la frequenza dei fotogrammi originali. Infine, il modello viene caricato per rilevare le targhe in ogni fotogramma del video.

Figura 4. Lettura del video e caricamento del modello.

Una volta caricato il modello, il sistema inizierà ad analizzare ogni fotogramma del video per rilevare le targhe. Quando viene trovata una targa, il sistema la evidenzia con un riquadro di rilevamento, rendendola facilmente identificabile. Questa fase assicura che vengano catturati solo i dettagli rilevanti, filtrando le informazioni di sfondo non necessarie. Una volta rilevate le targhe, il video è pronto per la fase successiva.

Fase 4: Estrazione del testo dalle targhe

Dopo aver rilevato una targa, il passo successivo è il riconoscimento del testo. Il sistema ritaglia innanzitutto la targa dal fotogramma video, eliminando qualsiasi distrazione per una visione chiara. Questo aiuta a concentrarsi sui dettagli, migliorando l'accuratezza anche in condizioni difficili come la scarsa illuminazione o la sfocatura del movimento.

Una volta isolata la piastra, GPT-4o Mini analizza l'immagine, estrae i numeri e le lettere e li converte in testo leggibile. Il testo riconosciuto viene poi aggiunto al video, etichettando ogni piastra rilevata in tempo reale.

Una volta completati questi passaggi, il sistema ANPR è completamente funzionante e pronto a riconoscere le targhe con facilità. 

Fase 5: Salvataggio del video elaborato

La fase finale salva il video elaborato e pulisce i file temporanei, assicurandosi che tutto funzioni correttamente. 

Ogni fotogramma elaborato, con le lastre rilevate e il testo riconosciuto, viene scritto nel video di uscita finale. Una volta elaborati tutti i fotogrammi, il sistema chiude il file video da cui stava leggendo, liberando memoria e risorse di sistema. Inoltre finalizza e salva il video di uscita, rendendolo pronto per la riproduzione o per ulteriori analisi.

Figura 5. Utilizzo di YOLO11 e GPT-4o Mini per ANPR.

Installazione di un sistema ANPR

Dopo aver costruito e testato una soluzione ANPR, il passo successivo è la sua implementazione in un ambiente reale. La maggior parte dei modelli Vision AI dipende da un'elaborazione ad alte prestazioni, ma Ultralytics YOLO11 è ottimizzato per l'Edge AI. Può essere eseguito in modo efficiente su dispositivi di piccole dimensioni senza richiedere l'elaborazione in cloud o una connessione internet costante, il che lo rende un'ottima scelta per i luoghi con risorse limitate.

Ad esempio, una comunità recintata può implementare YOLO11 su un dispositivo edge per identificare i veicoli al loro ingresso, eliminando la necessità di grandi server. Tutto viene elaborato in loco in tempo reale, garantendo un accesso agevole, una riduzione della congestione e una maggiore sicurezza.

Figura 6. Rilevamento di targhe con YOLO11.

Nel frattempo, nelle aree con una connettività internet stabile, l'ANPR basato su cloud può gestire più telecamere contemporaneamente. Ad esempio, in un centro commerciale, può tracciare i veicoli attraverso diversi ingressi e memorizzare i numeri di targa in un sistema centrale, rendendo più facile il monitoraggio dei parcheggi, il miglioramento della sicurezza e la gestione del flusso di veicoli da remoto.

La strada da percorrere per l'ANPR

Configurare un sistema di riconoscimento automatico delle targhe (ANPR) è semplice con Ultralytics YOLO11. Rileva con precisione le targhe e può essere addestrato in modo personalizzato per adattarsi a diversi ambienti e requisiti.

I sistemi ANPR aumentano la sicurezza, semplificano la gestione dei parcheggi e migliorano il monitoraggio del traffico. Automatizzando il riconoscimento delle targhe, riducono gli errori, velocizzano l'identificazione e rendono più efficiente la localizzazione dei veicoli in diverse applicazioni.

Unisciti alla nostra comunità e visita il nostro repository GitHub per vedere l'IA in azione. Esplora le nostre opzioni di licenza e scopri di più sull'IA di Vision nel settore manifatturiero e sull'IA nelle auto a guida autonoma nelle nostre pagine dedicate alle soluzioni.

Logo di FacebookLogo di TwitterLogo di LinkedInSimbolo di copia-link

Leggi tutto in questa categoria

Costruiamo insieme il futuro
di AI!

Inizia il tuo viaggio nel futuro dell'apprendimento automatico