Tìm hiểu cách xây dựng hệ thống ANPR bằng cách sử dụng Ultralytics YOLO11 để phát hiện biển số xe và GPT-4o Mini để nhận dạng văn bản với độ chính xác theo thời gian thực.
Việc tìm chỗ đậu xe trong bãi đậu xe đông đúc, xếp hàng dài chờ tại trạm thu phí hoặc bị kẹt tại các trạm kiểm soát an ninh là điều gây khó chịu. Kiểm tra xe thủ công thường mất quá nhiều thời gian và gây ra sự chậm trễ. Nếu không có hệ thống tự động, việc theo dõi xe hiệu quả có thể trở nên khó khăn.
Tầm nhìn máy tính đã thay đổi điều này bằng cách cho phép nhận dạng biển số xe theo thời gian thực từ hình ảnh và luồng video. Ví dụ, Ultralytics YOLO11 là một mô hình tầm nhìn máy tính tiên tiến có thể thực hiện các tác vụ Vision AI tiên tiến như phát hiện, phân loại và theo dõi đối tượng. Sử dụng YOLO11 Với khả năng phát hiện vật thể, bạn có thể phát hiện chính xác biển số xe trong hình ảnh.
Ultralytics cung cấp sổ tay Google Colab toàn diện giúp đơn giản hóa quy trình xây dựng các giải pháp hỗ trợ Vision AI . Những sổ tay này được cấu hình sẵn với các phụ thuộc, mô hình và hướng dẫn từng bước cần thiết, giúp việc tạo ứng dụng dễ dàng hơn. Đặc biệt, có một sổ tay Colab chuyên dụng cho ANPR (Nhận dạng biển số xe tự động).
Trong bài viết này, sử dụng Ultralytics Sổ tay Colab dành cho ANPR, chúng ta sẽ khám phá cách xây dựng giải pháp ANPR bằng cách sử dụng Ultralytics YOLO11 để phát hiện biển số xe và GPT-4o Mini để nhận dạng văn bản.
Theo dõi xe thủ công tốn nhiều thời gian và dễ xảy ra lỗi, đặc biệt là khi xe di chuyển nhanh. Kiểm tra từng biển số xe một sẽ làm chậm quá trình và tăng nguy cơ sai sót. Nhận dạng biển số xe tự động giải quyết vấn đề này bằng cách sử dụng thị giác máy tính để phát hiện và đọc biển số xe ngay lập tức, giúp giám sát giao thông và an ninh hiệu quả hơn.
Hệ thống ANPR có thể chụp ảnh hoặc quay video các phương tiện đi qua và sử dụng tính năng phát hiện vật thể theo thời gian thực để nhận dạng biển số xe. Sau khi phát hiện, tính năng nhận dạng văn bản được sử dụng để trích xuất số biển số xe tự động mà không cần sự can thiệp của con người. Quá trình này đảm bảo kết quả chính xác, ngay cả khi phương tiện di chuyển nhanh hoặc biển số xe bị che khuất một phần.
Ngày nay, các trạm thu phí, hệ thống đỗ xe và cơ quan thực thi pháp luật ngày càng dựa vào ANPR để theo dõi phương tiện một cách hiệu quả.
Mặc dù ANPR nhanh chóng xác định xe cộ, vẫn có một số thách thức có thể ảnh hưởng đến độ chính xác của nó. Sau đây là một số vấn đề phổ biến có thể ảnh hưởng đến hiệu quả hoạt động của hệ thống ANPR:
Ultralytics YOLO11 có thể làm cho hệ thống ANPR nhanh hơn và chính xác hơn. Nó xử lý hình ảnh nhanh chóng trong khi vẫn duy trì độ chính xác và không yêu cầu sức mạnh tính toán lớn, do đó nó hoạt động tốt trên mọi thứ, từ camera an ninh nhỏ đến hệ thống giao thông lớn.
Với đào tạo tùy chỉnh , YOLO11 có thể thích ứng với nhiều kiểu biển số xe, ngôn ngữ và môi trường khác nhau. Nó cũng hoạt động tốt trong các điều kiện khó khăn như ánh sáng yếu, chuyển động mờ và góc khó khi được đào tạo tùy chỉnh trên các tập dữ liệu chuyên biệt bao gồm hình ảnh về các điều kiện này.
Bằng cách xác định xe ngay lập tức, YOLO11 giúp giảm thời gian chờ đợi, ngăn ngừa lỗi và cải thiện an ninh. Điều này giúp giao thông lưu thông thông suốt hơn và hoạt động hiệu quả hơn tại các bãi đỗ xe, trạm thu phí và hệ thống giám sát.
Tiếp theo, chúng ta hãy cùng tìm hiểu cách xây dựng hệ thống ANPR bằng cách sử dụng YOLO11 và GPT-4o Mini.
Chúng tôi sẽ khám phá mã được giới thiệu trong Ultralytics Google Sổ tay cộng tác cho giải pháp này. Sổ tay Google Colab dễ sử dụng và bất kỳ ai cũng có thể tạo hệ thống ANPR mà không cần thiết lập phức tạp.
Để bắt đầu, chúng ta cần cài đặt các dependency hoặc các gói phần mềm và thư viện cần thiết để chạy hệ thống ANPR của chúng ta. Các dependency này hỗ trợ các tác vụ như phát hiện đối tượng, xử lý hình ảnh và nhận dạng văn bản, đảm bảo hệ thống hoạt động hiệu quả.
Chúng tôi sẽ cài đặt gói Ultralytics Python như được hiển thị bên dưới. Gói này cung cấp các mô hình được đào tạo trước, tiện ích đào tạo và công cụ suy luận, giúp phát hiện và nhận dạng biển số xe dễ dàng hơn YOLO11 .
Chúng ta cũng cần thiết lập GPT-4o Mini để nhận dạng văn bản. Vì GPT-4o Mini chịu trách nhiệm trích xuất văn bản từ các biển số được phát hiện, chúng ta cần một khóa API để truy cập mô hình. Có thể lấy khóa này bằng cách đăng ký API GPT-4o Mini. Khi bạn có khóa, bạn có thể thêm khóa vào sổ ghi chép Colab để hệ thống có thể kết nối với mô hình và xử lý số biển số.
Sau khi hoàn tất thiết lập và chạy mã cài đặt, YOLO11 sẽ sẵn sàng phát hiện biển số xe và GPT-4o Mini sẽ được thiết lập để nhận dạng và trích xuất văn bản từ biển số xe.
Bây giờ mọi thứ đã được thiết lập, bước tiếp theo là tải xuống YOLO11 mô hình đã được đào tạo tùy chỉnh để phát hiện biển số xe. Vì mô hình này đã được đào tạo để phát hiện biển số xe nên không cần phải đào tạo lại từ đầu. Bạn chỉ cần tải xuống và nó đã sẵn sàng để sử dụng. Điều này giúp tiết kiệm thời gian và giúp quá trình dễ dàng hơn nhiều.
Ngoài ra, chúng tôi sẽ tải xuống tệp video mẫu để kiểm tra hệ thống. Nếu muốn, bạn cũng có thể chạy giải pháp này trên tệp video của riêng mình. Sau khi tải xuống, mô hình và tệp video sẽ được lưu trữ trong môi trường máy tính xách tay.
Khi mô hình đã sẵn sàng, đã đến lúc xem nó hoạt động. Đầu tiên, tệp video được tải để xử lý, đảm bảo tệp mở đúng cách. Sau đó, trình ghi video được thiết lập để lưu cảnh quay đã xử lý với biển số xe được phát hiện trong khi vẫn duy trì kích thước và tốc độ khung hình gốc. Cuối cùng, mô hình được tải để phát hiện biển số xe trong từng khung hình của video.
Sau khi mô hình được tải, hệ thống sẽ bắt đầu phân tích từng khung hình của video để phát hiện biển số xe. Khi tìm thấy biển số, hệ thống sẽ làm nổi bật biển số đó bằng hộp phát hiện, giúp dễ dàng nhận dạng. Bước này đảm bảo rằng chỉ các chi tiết có liên quan mới được ghi lại, lọc bỏ thông tin nền không cần thiết. Khi biển số được phát hiện thành công, video hiện đã sẵn sàng cho giai đoạn tiếp theo.
Sau khi phát hiện biển số, bước tiếp theo là nhận dạng văn bản. Đầu tiên, hệ thống cắt biển số khỏi khung video, loại bỏ mọi yếu tố gây mất tập trung để có chế độ xem rõ ràng. Điều này giúp tập trung vào các chi tiết, cải thiện độ chính xác ngay cả trong điều kiện khó khăn như ánh sáng yếu hoặc chuyển động mờ.
Sau khi tách được tấm, GPT-4o Mini sẽ phân tích hình ảnh, trích xuất các số và chữ cái, và chuyển đổi chúng thành văn bản có thể đọc được. Văn bản được nhận dạng sau đó được thêm trở lại video, dán nhãn cho từng tấm được phát hiện theo thời gian thực.
Sau khi hoàn tất các bước này, hệ thống ANPR sẽ hoạt động đầy đủ và sẵn sàng nhận dạng biển số xe một cách dễ dàng.
Bước cuối cùng lưu video đã xử lý và dọn dẹp các tệp tạm thời, đảm bảo mọi thứ chạy trơn tru.
Mỗi khung hình được xử lý, với các tấm được phát hiện và văn bản được nhận dạng, được ghi vào video đầu ra cuối cùng. Khi tất cả các khung hình được xử lý, hệ thống sẽ đóng tệp video mà nó đang đọc, giải phóng bộ nhớ và tài nguyên hệ thống. Nó cũng hoàn thiện và lưu video đầu ra, giúp video sẵn sàng để phát lại hoặc phân tích thêm.
Sau khi xây dựng và thử nghiệm giải pháp ANPR, bước tiếp theo là triển khai nó trong môi trường thực tế. Hầu hết các mô hình Vision AI đều phụ thuộc vào điện toán hiệu suất cao, nhưng Ultralytics YOLO11 được tối ưu hóa cho Edge AI . Nó có thể chạy hiệu quả trên các thiết bị nhỏ mà không cần xử lý đám mây hoặc kết nối internet liên tục, khiến nó trở thành lựa chọn tuyệt vời cho những địa điểm có nguồn lực hạn chế.
Ví dụ, một cộng đồng có cổng bảo vệ có thể triển khai YOLO11 trên thiết bị biên để nhận dạng xe khi chúng vào, loại bỏ nhu cầu về máy chủ lớn. Mọi thứ được xử lý tại chỗ theo thời gian thực, đảm bảo truy cập thông suốt, giảm tắc nghẽn và tăng cường bảo mật.
Trong khi đó, ở những khu vực có kết nối internet ổn định, ANPR dựa trên đám mây có thể xử lý nhiều camera cùng lúc. Ví dụ, tại một trung tâm mua sắm, nó có thể theo dõi các phương tiện qua các lối vào khác nhau và lưu trữ biển số xe trong một hệ thống trung tâm, giúp giám sát bãi đậu xe, cải thiện an ninh và quản lý luồng xe từ xa dễ dàng hơn.
Việc thiết lập hệ thống nhận dạng biển số xe tự động (ANPR) rất đơn giản với Ultralytics YOLO11 . Thiết bị này có khả năng phát hiện chính xác biển số xe và có thể được đào tạo tùy chỉnh để thích ứng với nhiều môi trường và yêu cầu khác nhau.
Hệ thống ANPR tăng cường bảo mật, hợp lý hóa quản lý bãi đậu xe và cải thiện giám sát giao thông. Bằng cách tự động nhận dạng biển số, chúng giảm lỗi, tăng tốc độ nhận dạng và giúp theo dõi phương tiện hiệu quả hơn trên nhiều ứng dụng khác nhau.
Tham gia cộng đồng của chúng tôi và truy cập kho lưu trữ GitHub của chúng tôi để xem AI hoạt động. Khám phá các tùy chọn cấp phép của chúng tôi và tìm hiểu thêm về Vision AI trong sản xuất và AI trong xe tự lái trên các trang giải pháp của chúng tôi.
Bắt đầu hành trình của bạn với tương lai của machine learning