Lerne, wie du ein ANPR-System mit Ultralytics YOLO11 für die Nummernschilderkennung und GPT-4o Mini für die Texterkennung mit Echtzeitgenauigkeit aufbaust.
Es ist frustrierend, auf einem überfüllten Parkplatz zu parken, in langen Schlangen an Mautstellen zu warten oder an Sicherheitskontrollen festzustecken. Manuelle Fahrzeugkontrollen dauern oft zu lange und führen zu Verzögerungen. Ohne ein automatisiertes System kann es eine Herausforderung sein, Autos effizient zu verfolgen.
Die Computer Vision hat dies geändert, indem sie die Erkennung von Nummernschildern aus Bildern und Videostreams in Echtzeit ermöglicht. Zum Beispiel, Ultralytics YOLO11 ist ein fortschrittliches Computer Vision Modell, das fortschrittliche Vision AI Aufgaben wie Objekterkennung, Klassifizierung und Verfolgung durchführen kann. Mit den Objekterkennungsfähigkeiten von YOLO11 kannst du Fahrzeugkennzeichen in Bildern genau erkennen.
Ultralytics bietet umfassende Google Colab-Notebooks an, die den Aufbau von Vision AI-gestützten Lösungen vereinfachen. Diese Notebooks sind mit den wichtigsten Abhängigkeiten, Modellen und Schritt-für-Schritt-Anleitungen vorkonfiguriert und erleichtern die Erstellung von Anwendungen. Insbesondere gibt es ein spezielles Colab-Notebook für ANPR (Automatic Number Plate Recognition).
In diesem Artikel werden wir anhand des Ultralytics Colab Notebooks für ANPR untersuchen, wie man eine ANPR-Lösung mit Ultralytics YOLO11 für die Kennzeichenerkennung und GPT-4o Mini für die Texterkennung aufbaut.
Die manuelle Verfolgung von Fahrzeugen ist zeitaufwändig und fehleranfällig, vor allem wenn sie sich schnell bewegen. Jedes Nummernschild einzeln zu überprüfen, verlangsamt den Prozess und erhöht das Risiko von Fehlern. Die automatische Nummernschilderkennung löst dieses Problem, indem sie mit Hilfe von Computer Vision Nummernschilder sofort erkennt und liest und so die Verkehrsüberwachung und Sicherheit effizienter macht.
ANPR-Systeme können Bilder oder Videos von vorbeifahrenden Fahrzeugen aufnehmen und mithilfe von Objekterkennung in Echtzeit Nummernschilder identifizieren. Nach der Erkennung werden die Nummernschilder mithilfe der Texterkennung automatisch extrahiert, ohne dass ein Mensch eingreifen muss. Dieses Verfahren sorgt für genaue Ergebnisse, auch wenn sich die Fahrzeuge schnell bewegen oder die Kennzeichen teilweise verdeckt sind.
Heutzutage verlassen sich Mautstellen, Parksysteme und Strafverfolgungsbehörden zunehmend auf ANPR, um Fahrzeuge effizient zu verfolgen.
ANPR identifiziert Fahrzeuge zwar schnell, aber es gibt immer noch einige Probleme, die die Genauigkeit beeinträchtigen können. Hier sind ein paar häufige Probleme, die sich auf die Funktionsfähigkeit eines ANPR-Systems auswirken können:
Ultralytics YOLO11 kann ANPR-Systeme schneller und genauer machen. Es verarbeitet Bilder schnell und präzise und benötigt keine hohe Rechenleistung, sodass es von kleinen Überwachungskameras bis hin zu großen Verkehrssystemen gut funktioniert.
Durch benutzerdefiniertes Training kann YOLO11 an verschiedene Arten von Nummernschildern, Sprachen und Umgebungen angepasst werden. Auch unter schwierigen Bedingungen wie schlechten Lichtverhältnissen, Bewegungsunschärfe und schwierigen Blickwinkeln zeigt es gute Leistungen, wenn es mit speziellen Datensätzen trainiert wird, die Bilder aus diesen Bereichen enthalten.
Durch die sofortige Identifizierung von Fahrzeugen hilft YOLO11 , Wartezeiten zu verkürzen, Fehler zu vermeiden und die Sicherheit zu verbessern. Dadurch wird der Verkehrsfluss reibungsloser und der Betrieb auf Parkplätzen, an Mautstellen und in Überwachungssystemen effizienter.
Als Nächstes zeigen wir dir, wie du ein ANPR-System mit YOLO11 und GPT-4o Mini aufbaust.
Für diese Lösung werden wir den Code aus dem Ultralytics Google Collab Notizbuch untersuchen. Das Google Colab-Notebook ist einfach zu bedienen und jeder kann ein ANPR-System erstellen, ohne dass eine komplizierte Einrichtung erforderlich ist.
Um loszulegen, müssen wir unsere Abhängigkeiten installieren, d.h. die wichtigen Softwarepakete und Bibliotheken, die für den Betrieb unseres ANPR-Systems erforderlich sind. Diese Abhängigkeiten helfen bei Aufgaben wie Objekterkennung, Bildverarbeitung und Texterkennung und stellen sicher, dass das System effizient funktioniert.
Wir installieren das Ultralytics Python wie unten gezeigt. Dieses Paket bietet vorgefertigte Modelle, Trainingshilfen und Inferenzwerkzeuge, die das Erkennen von Nummernschildern mit YOLO11 erleichtern.
Außerdem müssen wir GPT-4o Mini für die Texterkennung einrichten. Da GPT-4o Mini für die Extraktion von Text aus erkannten Schildern zuständig ist, brauchen wir einen API-Schlüssel, um auf das Modell zuzugreifen. Diesen Schlüssel erhältst du, wenn du dich bei der GPT-4o Mini API anmeldest. Sobald du den Schlüssel hast, kannst du ihn zum Colab-Notebook hinzufügen, damit sich das System mit dem Modell verbinden und die Kennzeichen verarbeiten kann.
Nachdem du die Einrichtung abgeschlossen und den Installationscode ausgeführt hast, ist YOLO11 bereit, Nummernschilder zu erkennen, und GPT-4o Mini ist so eingestellt, dass es den Text erkennen und auslesen kann.
Nachdem nun alles eingerichtet ist, musst du im nächsten Schritt das YOLO11 herunterladen, das speziell für die Erkennung von Nummernschildern trainiert wurde. Da dieses Modell bereits für die Erkennung von Nummernschildern trainiert wurde, musst du es nicht von Grund auf neu trainieren. Du kannst es einfach herunterladen und es ist sofort einsatzbereit. Das spart Zeit und macht den Prozess viel einfacher.
Außerdem laden wir eine Beispiel-Videodatei herunter, um das System zu testen. Wenn du möchtest, kannst du diese Lösung auch mit deinen eigenen Videodateien ausprobieren. Nach dem Download werden die Modell- und Videodateien in der Notebook-Umgebung gespeichert.
Wenn das Modell fertig ist, ist es an der Zeit, es in Aktion zu sehen. Zuerst wird die Videodatei zur Verarbeitung geladen und sichergestellt, dass sie korrekt geöffnet wird. Dann wird ein Video Writer eingerichtet, der das verarbeitete Material mit den erkannten Nummernschildern speichert und dabei die ursprüngliche Größe und Bildrate beibehält. Schließlich wird das Modell geladen, um Nummernschilder in jedem Bild des Videos zu erkennen.
Sobald das Modell geladen ist, beginnt das System, jedes Einzelbild des Videos zu analysieren, um Nummernschilder zu erkennen. Wenn ein Nummernschild gefunden wird, hebt das System es mit einem Erkennungsfeld hervor, damit es leicht zu identifizieren ist. Dieser Schritt stellt sicher, dass nur die relevanten Details erfasst und unnötige Hintergrundinformationen herausgefiltert werden. Nachdem die Kennzeichen erfolgreich erkannt wurden, ist das Video bereit für den nächsten Schritt.
Nach der Erkennung eines Nummernschilds folgt der nächste Schritt: die Texterkennung. Das System schneidet das Nummernschild zunächst aus dem Videobild heraus und entfernt alle Ablenkungen, um eine klare Sicht zu gewährleisten. Das hilft, sich auf die Details zu konzentrieren und verbessert die Erkennungsgenauigkeit auch bei schwierigen Bedingungen wie schlechten Lichtverhältnissen oder Bewegungsunschärfe.
Sobald die Platte isoliert ist, analysiert der GPT-4o Mini das Bild, extrahiert die Zahlen und Buchstaben und wandelt sie in lesbaren Text um. Der erkannte Text wird dann wieder zum Video hinzugefügt und beschriftet jede erkannte Platte in Echtzeit.
Wenn diese Schritte abgeschlossen sind, ist das ANPR-System voll funktionsfähig und bereit, Nummernschilder mühelos zu erkennen.
Der letzte Schritt speichert das bearbeitete Video und bereinigt temporäre Dateien, damit alles reibungslos funktioniert.
Jedes verarbeitete Bild mit den erkannten Schildern und dem erkannten Text wird in das endgültige Ausgabevideo geschrieben. Sobald alle Bilder verarbeitet sind, schließt das System die Videodatei, aus der es gelesen hat, und gibt so Speicher und Systemressourcen frei. Außerdem wird das Ausgabevideo finalisiert und gespeichert, sodass es für die Wiedergabe oder weitere Analysen bereit ist.
Nachdem du eine ANPR-Lösung gebaut und getestet hast, ist der nächste Schritt, sie in einer realen Umgebung einzusetzen. Die meisten Vision-KI-Modelle sind auf Hochleistungscomputer angewiesen, aber Ultralytics YOLO11 ist für Edge-KI optimiert. Es kann effizient auf kleinen Geräten laufen, ohne dass eine Cloud-Verarbeitung oder eine ständige Internetverbindung erforderlich ist, was es zu einer guten Wahl für Standorte mit begrenzten Ressourcen macht.
Eine Gated Community kann zum Beispiel YOLO11 auf einem Edge-Gerät einsetzen, um Fahrzeuge bei der Einfahrt zu identifizieren, wodurch große Server überflüssig werden. Alles wird vor Ort in Echtzeit verarbeitet und sorgt für einen reibungslosen Zugang, weniger Staus und mehr Sicherheit.
In Gebieten mit einer stabilen Internetverbindung kann die cloudbasierte ANPR mehrere Kameras gleichzeitig bedienen. In einem Einkaufszentrum zum Beispiel können Fahrzeuge an verschiedenen Eingängen erfasst und die Nummernschilder in einem zentralen System gespeichert werden, was die Überwachung der Parkplätze, die Verbesserung der Sicherheit und die Verwaltung des Fahrzeugflusses aus der Ferne erleichtert.
Die Einrichtung eines automatischen Kennzeichenerkennungssystems (ANPR) ist mit Ultralytics YOLO11 ganz einfach. Es erkennt Nummernschilder präzise und kann individuell an verschiedene Umgebungen und Anforderungen angepasst werden.
ANPR-Systeme erhöhen die Sicherheit, optimieren die Parkraumbewirtschaftung und verbessern die Verkehrsüberwachung. Indem sie die Kennzeichenerkennung automatisieren, reduzieren sie Fehler, beschleunigen die Identifizierung und machen die Fahrzeugverfolgung in verschiedenen Anwendungen effizienter.
Tritt unserer Community bei und besuche unser GitHub-Repository, um KI in Aktion zu sehen. Erkunde unsere Lizenzierungsoptionen und erfahre mehr über Vision AI in der Fertigung und AI in selbstfahrenden Autos auf unseren Lösungsseiten.
Beginne deine Reise in die Zukunft des maschinellen Lernens