Scopri come costruire un sistema ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo con una precisione in tempo reale.
Trovare parcheggio in un parcheggio affollato, aspettare in lunghe file ai caselli o rimanere bloccati ai controlli di sicurezza è frustrante. I controlli manuali dei veicoli spesso richiedono troppo tempo e causano ritardi. Senza un sistema automatizzato, seguire le auto in modo efficiente può essere difficile.
La computer vision ha cambiato questa situazione consentendo il riconoscimento delle targhe in tempo reale da immagini e flussi video. Per esempio, Ultralytics YOLO11 è un modello avanzato di computer vision in grado di eseguire compiti avanzati di Vision AI come il rilevamento di oggetti, la classificazione e il tracciamento. Grazie alle capacità di rilevamento degli oggetti di YOLO11, è possibile individuare con precisione le targhe dei veicoli nelle immagini.
Ultralytics offre notebookGoogle Colab completi che semplificano il processo di creazione di soluzioni Vision AI. Questi notebook sono preconfigurati con le dipendenze essenziali, i modelli e le guide passo-passo, per semplificare la creazione di applicazioni. In particolare, esiste un notebook Colab dedicato all 'ANPR (Automatic Number Plate Recognition).
In questo articolo, utilizzando il notebook Ultralytics Colab per l'ANPR, scopriremo come costruire una soluzione ANPR utilizzando Ultralytics YOLO11 per il rilevamento delle targhe e GPT-4o Mini per il riconoscimento del testo.
Rintracciare le auto manualmente richiede molto tempo ed è soggetto a errori, soprattutto quando si muovono velocemente. Controllare ogni targa una per una rallenta il processo e aumenta il rischio di errori. Il riconoscimento automatico delle targhe risolve questo problema utilizzando la visione computerizzata per rilevare e leggere le targhe istantaneamente, rendendo più efficiente il monitoraggio del traffico e la sicurezza.
I sistemi ANPR possono acquisire immagini o video dei veicoli in transito e utilizzare il rilevamento degli oggetti in tempo reale per identificare le targhe. Una volta rilevate, il riconoscimento del testo viene utilizzato per estrarre automaticamente i numeri di targa, senza bisogno dell'intervento umano. Questo processo garantisce risultati accurati anche quando i veicoli si muovono rapidamente o le targhe sono parzialmente oscurate.
Al giorno d'oggi, i caselli autostradali, i sistemi di parcheggio e le forze dell'ordine si affidano sempre più all'ANPR per tracciare i veicoli in modo efficiente.
Anche se l'ANPR identifica rapidamente i veicoli, ci sono alcune sfide che possono comprometterne l'accuratezza. Ecco alcuni problemi comuni che possono influenzare il funzionamento di un sistema ANPR:
Ultralytics YOLO11 può rendere i sistemi ANPR più veloci e precisi. Elabora le immagini in modo rapido e preciso e non richiede una grande potenza di calcolo, per cui funziona bene su tutti i tipi di telecamere di sicurezza, dalle più piccole ai grandi sistemi di traffico.
Grazie alla formazione personalizzata, YOLO11 può essere adattato a diversi stili di targa, lingue e ambienti. Si comporta bene anche in condizioni difficili come la scarsa illuminazione, la sfocatura da movimento e gli angoli difficili quando viene addestrato su set di dati specializzati che includono immagini in queste condizioni.
Identificando i veicoli all'istante, YOLO11 aiuta a ridurre i tempi di attesa, a prevenire gli errori e a migliorare la sicurezza. In questo modo il traffico diventa più fluido e le operazioni più efficienti nei parcheggi, nei caselli autostradali e nei sistemi di sorveglianza.
Vediamo quindi come costruire un sistema ANPR utilizzando YOLO11 e GPT-4o Mini.
Per questa soluzione esploreremo il codice mostrato nel notebook Ultralytics Google Collab. Il notebook di Google Collab è facile da usare e chiunque può creare un sistema ANPR senza bisogno di una configurazione complicata.
Per iniziare, dovremo installare le nostre dipendenze, ovvero i pacchetti software e le librerie essenziali per il funzionamento del nostro sistema ANPR. Queste dipendenze ci aiutano a svolgere compiti come il rilevamento degli oggetti, l'elaborazione delle immagini e il riconoscimento del testo, garantendo un funzionamento efficiente del sistema.
Installeremo il pacchettoUltralytics Python come mostrato di seguito. Questo pacchetto fornisce modelli pre-addestrati, utilità di addestramento e strumenti di inferenza che rendono più semplice il rilevamento e il riconoscimento delle targhe con YOLO11.
Dovremo anche configurare GPT-4o Mini per il riconoscimento del testo. Poiché GPT-4o Mini è responsabile dell'estrazione del testo dalle targhe rilevate, abbiamo bisogno di una chiave API per accedere al modello. Questa chiave può essere ottenuta iscrivendosi all'API di GPT-4o Mini. Una volta ottenuta, la chiave può essere aggiunta al notebook Colab in modo che il sistema possa connettersi al modello ed elaborare i numeri di targa.
Dopo aver completato la configurazione ed eseguito il codice di installazione, YOLO11 sarà pronto a rilevare le targhe e GPT-4o Mini sarà impostato per riconoscere ed estrarre il testo da esse.
Ora che è tutto pronto, il passo successivo è scaricare il modello YOLO11 che è stato addestrato per rilevare le targhe. Poiché questo modello è già stato addestrato per rilevare le targhe, non c'è bisogno di addestrarlo da zero. Basta scaricarlo ed è già pronto all'uso. In questo modo si risparmia tempo e si semplifica il processo.
Inoltre, scaricheremo un file video di esempio per testare il sistema. Se vuoi, puoi eseguire questa soluzione anche sui tuoi file video. Una volta scaricati, il modello e i file video saranno archiviati nell'ambiente del notebook.
Una volta che il modello è pronto, è il momento di vederlo in azione. Per prima cosa, il file video viene caricato per l'elaborazione, assicurandosi che si apra correttamente. Viene poi impostato un video writer per salvare il filmato elaborato con le targhe rilevate, mantenendo le dimensioni e la frequenza dei fotogrammi originali. Infine, il modello viene caricato per rilevare le targhe in ogni fotogramma del video.
Una volta caricato il modello, il sistema inizierà ad analizzare ogni fotogramma del video per rilevare le targhe. Quando viene trovata una targa, il sistema la evidenzia con un riquadro di rilevamento, rendendola facilmente identificabile. Questa fase assicura che vengano catturati solo i dettagli rilevanti, filtrando le informazioni di sfondo non necessarie. Una volta rilevate le targhe, il video è pronto per la fase successiva.
Dopo aver rilevato una targa, il passo successivo è il riconoscimento del testo. Il sistema ritaglia innanzitutto la targa dal fotogramma video, eliminando qualsiasi distrazione per una visione chiara. Questo aiuta a concentrarsi sui dettagli, migliorando l'accuratezza anche in condizioni difficili come la scarsa illuminazione o la sfocatura del movimento.
Una volta isolata la piastra, GPT-4o Mini analizza l'immagine, estrae i numeri e le lettere e li converte in testo leggibile. Il testo riconosciuto viene poi aggiunto al video, etichettando ogni piastra rilevata in tempo reale.
Una volta completati questi passaggi, il sistema ANPR è completamente funzionante e pronto a riconoscere le targhe con facilità.
La fase finale salva il video elaborato e pulisce i file temporanei, assicurandosi che tutto funzioni correttamente.
Ogni fotogramma elaborato, con le lastre rilevate e il testo riconosciuto, viene scritto nel video di uscita finale. Una volta elaborati tutti i fotogrammi, il sistema chiude il file video da cui stava leggendo, liberando memoria e risorse di sistema. Inoltre finalizza e salva il video di uscita, rendendolo pronto per la riproduzione o per ulteriori analisi.
Dopo aver costruito e testato una soluzione ANPR, il passo successivo è la sua implementazione in un ambiente reale. La maggior parte dei modelli Vision AI dipende da un'elaborazione ad alte prestazioni, ma Ultralytics YOLO11 è ottimizzato per l'Edge AI. Può essere eseguito in modo efficiente su dispositivi di piccole dimensioni senza richiedere l'elaborazione in cloud o una connessione internet costante, il che lo rende un'ottima scelta per i luoghi con risorse limitate.
Ad esempio, una comunità recintata può implementare YOLO11 su un dispositivo edge per identificare i veicoli al loro ingresso, eliminando la necessità di grandi server. Tutto viene elaborato in loco in tempo reale, garantendo un accesso agevole, una riduzione della congestione e una maggiore sicurezza.
Nel frattempo, nelle aree con una connettività internet stabile, l'ANPR basato su cloud può gestire più telecamere contemporaneamente. Ad esempio, in un centro commerciale, può tracciare i veicoli attraverso diversi ingressi e memorizzare i numeri di targa in un sistema centrale, rendendo più facile il monitoraggio dei parcheggi, il miglioramento della sicurezza e la gestione del flusso di veicoli da remoto.
Configurare un sistema di riconoscimento automatico delle targhe (ANPR) è semplice con Ultralytics YOLO11. Rileva con precisione le targhe e può essere addestrato in modo personalizzato per adattarsi a diversi ambienti e requisiti.
I sistemi ANPR aumentano la sicurezza, semplificano la gestione dei parcheggi e migliorano il monitoraggio del traffico. Automatizzando il riconoscimento delle targhe, riducono gli errori, velocizzano l'identificazione e rendono più efficiente la localizzazione dei veicoli in diverse applicazioni.
Unisciti alla nostra comunità e visita il nostro repository GitHub per vedere l'IA in azione. Esplora le nostre opzioni di licenza e scopri di più sull'IA di Vision nel settore manifatturiero e sull'IA nelle auto a guida autonoma nelle nostre pagine dedicate alle soluzioni.
Inizia il tuo viaggio nel futuro dell'apprendimento automatico