Thuật ngữ

Máy dò vật thể một giai đoạn

Khám phá tốc độ và hiệu quả của các máy dò vật thể một giai đoạn như YOLO , lý tưởng cho các ứng dụng thời gian thực như robot và giám sát.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong lĩnh vực thị giác máy tính (CV) , đặc biệt là đối với phát hiện vật thể , tốc độ và hiệu quả thường quan trọng như độ chính xác. Các máy dò vật thể một giai đoạn được thiết kế với những ưu tiên này trong tâm trí, cung cấp một phương pháp hợp lý để xác định và định vị các vật thể trong hình ảnh hoặc video. Không giống như các đối tác hai giai đoạn của chúng, các máy dò một giai đoạn thực hiện định vị và phân loại vật thể trong một lần truyền tiếp của mạng nơ-ron, khiến chúng nhanh hơn đáng kể và phù hợp hơn cho các ứng dụng thời gian thực.

Nguyên tắc cốt lõi của máy dò một giai đoạn

Các máy dò đối tượng một giai đoạn được đặc trưng bởi thiết kế đầu cuối của chúng, giúp tránh một bước riêng biệt để đề xuất các vùng quan tâm. Cách tiếp cận trực tiếp này cho phép chúng dự đoán các hộp giới hạn và xác suất lớp trực tiếp từ các đặc điểm hình ảnh đầu vào được xử lý bởi mạng xương sống . Mạng xử lý toàn bộ hình ảnh một lần và đưa ra các phát hiện trong một giai đoạn duy nhất. Kiến trúc này nhấn mạnh vào tốc độ, khiến nó trở nên lý tưởng cho các ứng dụng mà xử lý nhanh là điều cần thiết. Các ví dụ phổ biến bao gồm họ mô hình YOLO của Ultralytics , được biết đến với sự cân bằng giữa tốc độ và hiệu quả (như YOLO11 ) và SSD ( Máy dò MultiBox Single Shot ).

Sự khác biệt so với máy dò hai giai đoạn

Sự khác biệt cơ bản giữa máy dò vật thể một giai đoạn và hai giai đoạn nằm ở quy trình hoạt động của chúng. Máy dò hai giai đoạn, chẳng hạn như họ R-CNN , trước tiên tạo ra nhiều đề xuất vùng (các khu vực tiềm năng có thể có vật thể) và sau đó phân loại và tinh chỉnh các đề xuất này trong giai đoạn riêng biệt thứ hai. Quy trình hai bước này thường đạt được độ chính xác cao hơn, đặc biệt là đối với các vật thể nhỏ hơn, nhưng phải trả giá bằng thời gian tính toán tăng đáng kể và tốc độ suy luận thấp hơn. Ngược lại, máy dò một giai đoạn hợp nhất các bước này, thực hiện định vị và phân loại đồng thời trên toàn bộ hình ảnh. Phương pháp thống nhất này mang lại tốc độ tăng đáng kể, mặc dù về mặt lịch sử, nó liên quan đến sự đánh đổi, đôi khi dẫn đến độ chính xác thấp hơn một chút so với các phương pháp hai giai đoạn hiện đại, một khoảng cách mà máy dò một giai đoạn hiện đại liên tục hoạt động để thu hẹp. Hiệu suất thường được đo bằng các số liệu như Độ chính xác trung bình trung bình (mAP) .

Ứng dụng trong thế giới thực

Tốc độ và hiệu quả của các máy dò vật thể một giai đoạn khiến chúng trở nên vô cùng hữu ích trong nhiều tình huống thực tế đòi hỏi phải ra quyết định nhanh chóng:

  • Lái xe tự động: Cần thiết cho AI trên xe tự lái để phát hiện xe cộ, người đi bộ, người đi xe đạp và biển báo giao thông theo thời gian thực để điều hướng an toàn.
  • An ninh và giám sát: Được sử dụng trong các hệ thống an ninh để ngăn ngừa trộm cắp và giám sát, cho phép phát hiện ngay lập tức các hành vi xâm nhập hoặc hoạt động bất thường trong nguồn cấp dữ liệu video.
  • Robot: Cho phép robot trong môi trường năng động, như nhà kho hoặc nhà ở, nhanh chóng nhận biết các vật thể để điều hướng và thực hiện nhiệm vụ tương tác, như đã khám phá trong các ứng dụng robot .
  • Quản lý giao thông: Cho phép hệ thống tối ưu hóa lưu lượng giao thông bằng cách phát hiện và theo dõi phương tiện để quản lý tình trạng tắc nghẽn và tín hiệu hiệu quả.

Công cụ và Khung

Việc phát triển và triển khai các máy dò vật thể một giai đoạn được hỗ trợ bởi nhiều công cụ và khuôn khổ khác nhau, bao gồm:

Bằng cách hiểu các nguyên lý, lợi thế và ứng dụng của máy dò vật thể một giai đoạn, các nhà phát triển và nhà nghiên cứu có thể tận dụng hiệu quả tốc độ của chúng để giải quyết nhiều thách thức về thị giác máy tính thời gian thực.

Đọc tất cả