Thuật ngữ

Máy dò vật thể một giai đoạn

Khám phá tốc độ và hiệu quả của máy phát hiện vật thể một giai đoạn cho các ứng dụng AI thời gian thực như lái xe tự động và phân tích bán lẻ.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong lĩnh vực phát hiện đối tượng, các bộ dò đối tượng một giai đoạn là một lớp thuật toán được thiết kế để xác định và định vị các đối tượng trong một hình ảnh trong một lần chuyển tiếp duy nhất qua mạng nơ-ron. Không giống như các bộ dò đối tượng hai giai đoạn , trước tiên đề xuất các vùng quan tâm và sau đó phân loại chúng, các bộ dò một giai đoạn hợp lý hóa quy trình bằng cách đồng thời dự đoán các hộp giới hạn và xác suất lớp. Phương pháp thống nhất này cải thiện đáng kể tốc độ và hiệu quả, khiến các bộ dò một giai đoạn đặc biệt phù hợp với các ứng dụng thời gian thực, nơi xử lý nhanh là rất quan trọng.

Các tính năng và lợi thế chính

Các máy dò đối tượng một giai đoạn được đặc trưng bởi kiến trúc hợp lý của chúng, thường bao gồm một mạng nơ-ron duy nhất xử lý toàn bộ hình ảnh cùng một lúc. Thiết kế này loại bỏ nhu cầu về bước đề xuất vùng riêng biệt, dẫn đến thời gian suy luận nhanh hơn. Mạng đưa ra một tập hợp các hộp giới hạn cùng với xác suất lớp tương ứng của chúng, trực tiếp dự đoán vị trí và loại đối tượng trong hình ảnh.

Ưu điểm chính của máy dò một giai đoạn là tốc độ của chúng. Bằng cách xử lý hình ảnh trong một lần chạy, chúng có thể đạt được hiệu suất thời gian thực hoặc gần thời gian thực, khiến chúng trở nên lý tưởng cho các ứng dụng như phân tích video, lái xe tự động và hệ thống giám sát trực tiếp. Ngoài ra, kiến trúc đơn giản hơn của chúng thường chuyển thành các yêu cầu tính toán thấp hơn, cho phép triển khai trên các thiết bị hạn chế về tài nguyên như điện thoại di động hoặc hệ thống nhúng.

Kiến trúc đáng chú ý

Một số kiến trúc phát hiện đối tượng một giai đoạn đã trở nên nổi bật trong lĩnh vực này. Trong số những kiến trúc có ảnh hưởng nhất là Ultralytics YOLO (Bạn chỉ nhìn một lần). Ultralytics YOLO nổi tiếng với tốc độ và độ chính xác đặc biệt, khiến nó trở thành lựa chọn phổ biến cho nhiều ứng dụng thực tế. Các kiến trúc một giai đoạn đáng chú ý khác bao gồm SSD (Single Shot MultiBox Detector) và RetinaNet, mỗi kiến trúc đều có điểm mạnh và sự đánh đổi riêng về tốc độ, độ chính xác và độ phức tạp.

Họ làm việc như thế nào

Các máy dò đối tượng một giai đoạn thường sử dụng mạng nơ-ron tích chập hoàn toàn (CNN) để xử lý hình ảnh đầu vào. CNN trích xuất các đặc điểm từ hình ảnh và đưa chúng vào đầu phát hiện, chịu trách nhiệm dự đoán các hộp giới hạn và xác suất lớp. Đầu phát hiện thường bao gồm một số lớp tích chập hoạt động trên các bản đồ đặc điểm do CNN tạo ra.

Đầu ra của đầu phát hiện là một tập hợp các bản đồ đặc điểm, trong đó mỗi ô tương ứng với một vùng cụ thể trong hình ảnh đầu vào. Mỗi ô dự đoán nhiều hộp giới hạn, cùng với xác suất lớp và điểm tin cậy liên quan của chúng. Sau đó, các dự đoán này được tinh chỉnh bằng các kỹ thuật như loại bỏ không tối đa (NMS) để loại bỏ các hộp trùng lặp hoặc chồng chéo và chọn ra các dự đoán đáng tin cậy nhất.

Ứng dụng trong thế giới thực

Tốc độ và hiệu quả của máy dò vật thể một giai đoạn làm cho chúng phù hợp với nhiều ứng dụng thực tế. Sau đây là hai ví dụ cụ thể:

  1. Lái xe tự động : Trong xe tự lái, các máy dò một giai đoạn có thể xử lý hình ảnh từ camera theo thời gian thực để phát hiện người đi bộ, phương tiện khác, đèn giao thông và biển báo đường bộ. Thông tin này rất quan trọng để điều hướng an toàn và ra quyết định. Khám phá thêm về AI trong Tự lái để hiểu vai trò của phát hiện vật thể trong xe tự lái.
  2. Phân tích bán lẻ : Các nhà bán lẻ có thể sử dụng máy dò một giai đoạn để phân tích nguồn cấp dữ liệu video từ camera trong cửa hàng. Điều này có thể giúp theo dõi chuyển động của khách hàng, xác định các sản phẩm phổ biến và phát hiện các sự cố trộm cắp vặt. Khả năng xử lý thời gian thực của máy dò một giai đoạn cho phép hành động và phản hồi ngay lập tức. Tìm hiểu về AI trong bán lẻ để xem cách phát hiện đối tượng đang chuyển đổi ngành bán lẻ.

So sánh với máy dò hai giai đoạn

Trong khi các máy dò một giai đoạn vượt trội về tốc độ và hiệu quả, các máy dò vật thể hai giai đoạn thường cung cấp độ chính xác cao hơn, đặc biệt là đối với các vật thể nhỏ hơn hoặc các cảnh phức tạp. Các máy dò hai giai đoạn, chẳng hạn như Faster R-CNN, trước tiên tạo ra các đề xuất vùng và sau đó phân loại các vùng này trong một bước riêng biệt. Quy trình hai bước này cho phép định vị và phân loại vật thể tinh vi hơn nhưng phải trả giá bằng độ phức tạp tính toán tăng lên và thời gian suy luận chậm hơn.

Lựa chọn giữa máy dò một giai đoạn và hai giai đoạn phụ thuộc vào các yêu cầu ứng dụng cụ thể. Đối với các ứng dụng thời gian thực, nơi tốc độ là tối quan trọng, máy dò một giai đoạn thường được ưu tiên. Đối với các tác vụ đòi hỏi độ chính xác cao nhất và thời gian xử lý ít quan trọng hơn, máy dò hai giai đoạn có thể phù hợp hơn.

Kết thúc

Máy dò vật thể một giai đoạn đại diện cho một bước tiến đáng kể trong lĩnh vực thị giác máy tính , cung cấp sự kết hợp hấp dẫn giữa tốc độ và hiệu quả. Khả năng xử lý hình ảnh chỉ trong một lần chạy qua mạng nơ-ron khiến chúng trở nên lý tưởng cho các ứng dụng thời gian thực trong nhiều ngành công nghiệp khác nhau. Khi nghiên cứu tiếp tục tiến triển, chúng ta có thể mong đợi những cải tiến hơn nữa về độ chính xác và hiệu suất của máy dò một giai đoạn, củng cố vai trò của chúng trong bối cảnh AI và máy học không ngừng phát triển. Khám phá những thông tin mới nhất về phát hiện vật thể bằng cách truy cập trang YOLO Ultralytics . Bạn cũng có thể tìm hiểu thêm về kiến trúc phát hiện vật thể để hiểu sâu hơn về lĩnh vực này. Để hiểu toàn diện về thuật ngữ AI và thị giác máy tính, hãy tham khảo thuật ngữ Ultralytics .

Đọc tất cả