Узнай, как построить ANPR-систему, используя Ultralytics YOLO11 для распознавания номерных знаков и GPT-4o Mini для распознавания текста с точностью до реального времени.
Поиск парковки на переполненной стоянке, долгие очереди в кассы для оплаты проезда или застревание на пунктах досмотра - все это расстраивает. Ручная проверка автомобилей часто занимает слишком много времени и приводит к задержкам. Без автоматизированной системы эффективное отслеживание автомобилей может оказаться сложной задачей.
Компьютерное зрение изменило ситуацию, позволив в реальном времени распознавать номерные знаки по изображениям и видеопотокам. Например, Ultralytics YOLO11 это продвинутая модель компьютерного зрения, которая может выполнять такие продвинутые задачи Vision AI, как обнаружение объектов, классификация и отслеживание. Используя возможности YOLO11 по обнаружению объектов, ты сможешь точно определять номерные знаки автомобилей на изображениях.
Ultralytics предлагает комплексные блокнотыGoogle Colab, которые упрощают процесс создания решений на базе искусственного интеллекта Vision. Эти блокноты поставляются с готовыми конфигурациями, необходимыми зависимостями, моделями и пошаговыми руководствами, что упрощает создание приложений. В частности, есть специальный блокнот Colab для ANPR (Automatic Number Plate Recognition).
В этой статье, используя ноутбук Ultralytics Colab для ANPR, мы рассмотрим, как построить ANPR-решение, используя Ultralytics YOLO11 для распознавания номерных знаков и GPT-4o Mini для распознавания текста.
Отслеживать автомобили вручную - трудоемко и чревато ошибками, особенно когда они быстро движутся. Проверка каждого номерного знака по очереди замедляет процесс и повышает риск ошибок. Автоматическое распознавание номерных знаков решает эту проблему, используя компьютерное зрение для мгновенного обнаружения и считывания номерных знаков, что делает контроль и безопасность движения более эффективными.
Системы ANPR могут захватывать изображения или видео проезжающих мимо автомобилей и использовать обнаружение объектов в реальном времени для идентификации номерных знаков. После обнаружения распознавание текста используется для извлечения номеров автоматически, без вмешательства человека. Этот процесс обеспечивает точные результаты, даже если автомобили быстро движутся или номерные знаки частично скрыты.
Сегодня пункты взимания платы, парковочные системы и правоохранительные органы все чаще полагаются на ANPR для эффективного отслеживания транспортных средств.
Хотя система ANPR быстро идентифицирует автомобили, все же есть некоторые проблемы, которые могут повлиять на ее точность. Вот несколько распространенных проблем, которые могут повлиять на то, насколько хорошо работает система ANPR:
Ultralytics YOLO11 может сделать системы ANPR более быстрыми и точными. Он быстро обрабатывает изображения, сохраняя при этом точность, и не требует больших вычислительных мощностей, поэтому хорошо работает на всех системах - от небольших камер слежения до крупных дорожных систем.
С помощью индивидуального обучения YOLO11 можно адаптировать к различным стилям номерных знаков, языкам и окружению. Он также отлично справляется с такими сложными условиями, как низкая освещенность, размытость движения и сложные ракурсы, если его обучить на специализированных наборах данных, включающих изображения в таких условиях.
Мгновенно идентифицируя автомобили, YOLO11 помогает сократить время ожидания, предотвратить ошибки и повысить безопасность. Это делает движение транспорта более плавным, а операции на парковках, пунктах оплаты и в системах видеонаблюдения - более эффективными.
Далее рассмотрим, как построить систему ANPR, используя YOLO11 и GPT-4o Mini.
Для этого решения мы будем изучать код, показанный в блокноте Ultralytics Google Collab. Блокнот Google Colab прост в использовании, и каждый может создать систему ANPR, не прибегая к сложной настройке.
Чтобы начать работу, нам нужно установить зависимости, или основные программные пакеты и библиотеки, необходимые для работы нашей системы ANPR. Эти зависимости помогают решать такие задачи, как обнаружение объектов, обработка изображений и распознавание текста, обеспечивая эффективную работу системы.
Мы установим пакетUltralytics Python , как показано ниже. Этот пакет предоставляет предварительно обученные модели, утилиты для обучения и инструменты для вывода, облегчающие обнаружение и распознавание номерных знаков с помощью YOLO11.
Также нам понадобится настроить GPT-4o Mini на распознавание текста. Поскольку GPT-4o Mini отвечает за извлечение текста из обнаруженных табличек, нам нужен API-ключ для доступа к модели. Этот ключ можно получить, подписавшись на API GPT-4o Mini. Как только ты получишь ключ, его можно добавить в блокнот Colab, чтобы система могла подключаться к модели и обрабатывать номера номерных знаков.
После завершения настройки и запуска установочного кода YOLO11 будет готов к обнаружению номерных знаков, а GPT-4o Mini будет настроен на их распознавание и извлечение из них текста.
Теперь, когда все готово, следующим шагом будет загрузка модели YOLO11 , которая была специально обучена для обнаружения номерных знаков. Так как эта модель уже была натренирована на обнаружение номерных знаков, нет необходимости обучать ее с нуля. Ты можешь просто скачать ее, и она уже готова к использованию. Это экономит время и значительно упрощает процесс.
Кроме того, мы загрузим пример видеофайла, чтобы протестировать систему. Если хочешь, ты можешь запустить это решение и на своих собственных видеофайлах. После загрузки модель и видеофайлы будут сохранены в среде ноутбука.
Когда модель готова, самое время посмотреть на нее в действии. Сначала видеофайл загружается для обработки и убеждается, что он правильно открывается. Затем настраивается видеописатель, чтобы сохранить обработанный материал с обнаруженными номерными знаками, сохранив при этом оригинальный размер и частоту кадров. Наконец, загружается модель для обнаружения номерных знаков в каждом кадре видео.
Как только модель будет загружена, система начнет анализировать каждый кадр видео, чтобы обнаружить номерные знаки. Когда номерной знак будет найден, система выделит его рамкой обнаружения, что облегчит его идентификацию. Этот шаг гарантирует, что будут захвачены только важные детали, отфильтровывая ненужную фоновую информацию. После того как номера успешно обнаружены, видео готово к следующему этапу.
После обнаружения номерного знака следующим шагом будет распознавание текста. Сначала система вырезает номерной знак из видеокадра, убирая все отвлекающие элементы, чтобы получить четкое изображение. Это помогает сфокусироваться на деталях, повышая точность даже в таких сложных условиях, как слабое освещение или размытость движения.
Как только пластина выделена, GPT-4o Mini анализирует изображение, извлекает цифры и буквы и преобразует их в читаемый текст. Затем распознанный текст добавляется обратно в видео, маркируя каждую обнаруженную пластину в режиме реального времени.
После выполнения этих шагов система ANPR полностью функциональна и готова с легкостью распознавать номерные знаки.
На последнем этапе ты сохраняешь обработанное видео и очищаешь временные файлы, чтобы все прошло гладко.
Каждый обработанный кадр с обнаруженными пластинами и распознанным текстом записывается в конечное выходное видео. Когда все кадры обработаны, система закрывает видеофайл, из которого производилось чтение, освобождая память и системные ресурсы. Она также завершает обработку и сохраняет выходное видео, делая его готовым к воспроизведению или дальнейшему анализу.
После создания и тестирования решения ANPR следующим шагом будет его развертывание в реальной среде. Большинство моделей Vision AI зависят от высокопроизводительных вычислений, но Ultralytics YOLO11 оптимизирован для Edge AI. Он может эффективно работать на небольших устройствах, не требуя облачной обработки или постоянного подключения к интернету, что делает его отличным выбором для мест с ограниченными ресурсами.
Например, закрытое сообщество может развернуть YOLO11 на пограничном устройстве для идентификации автомобилей при въезде, что избавит тебя от необходимости использовать большие серверы. Все данные обрабатываются на месте в режиме реального времени, обеспечивая беспрепятственный доступ, уменьшение заторов и повышение безопасности.
В то же время в местах со стабильным интернет-соединением облачные системы ANPR могут работать с несколькими камерами одновременно. Например, в торговом центре она может отслеживать автомобили на разных въездах и сохранять номера в центральной системе, облегчая контроль за парковкой, повышая безопасность и удаленно управляя потоком машин.
Создать систему автоматического распознавания номерных знаков (ANPR) проще простого с помощью Ultralytics YOLO11. Она точно распознает номерные знаки, и ее можно настраивать, чтобы она адаптировалась к различным условиям и требованиям.
Системы ANPR повышают безопасность, упрощают управление парковкой и улучшают контроль за дорожным движением. Автоматизируя распознавание номерных знаков, они уменьшают количество ошибок, ускоряют идентификацию и делают отслеживание автомобилей более эффективным в различных приложениях.
Присоединяйся к нашему сообществу и посети наш репозиторий GitHub, чтобы увидеть ИИ в действии. Изучи наши варианты лицензирования и узнай больше о Vision AI в производстве и AI в самодвижущихся автомобилях на страницах наших решений.
Начни свое путешествие с будущим машинного обучения