Khám phá tốc độ và hiệu quả của các máy dò vật thể một giai đoạn như YOLO , lý tưởng cho các ứng dụng thời gian thực như robot và giám sát.
Trong lĩnh vực thị giác máy tính (CV) , đặc biệt là đối với phát hiện vật thể , tốc độ và hiệu quả thường quan trọng như độ chính xác. Các máy dò vật thể một giai đoạn được thiết kế với những ưu tiên này trong tâm trí, cung cấp một phương pháp hợp lý để xác định và định vị các vật thể trong hình ảnh hoặc video. Không giống như các đối tác hai giai đoạn của chúng, các máy dò một giai đoạn thực hiện định vị và phân loại vật thể trong một lần truyền tiếp của mạng nơ-ron, khiến chúng nhanh hơn đáng kể và phù hợp hơn cho các ứng dụng thời gian thực.
Các máy dò đối tượng một giai đoạn được đặc trưng bởi thiết kế đầu cuối của chúng, giúp tránh một bước riêng biệt để đề xuất các vùng quan tâm. Cách tiếp cận trực tiếp này cho phép chúng dự đoán các hộp giới hạn và xác suất lớp trực tiếp từ các đặc điểm hình ảnh đầu vào được xử lý bởi mạng xương sống . Mạng xử lý toàn bộ hình ảnh một lần và đưa ra các phát hiện trong một giai đoạn duy nhất. Kiến trúc này nhấn mạnh vào tốc độ, khiến nó trở nên lý tưởng cho các ứng dụng mà xử lý nhanh là điều cần thiết. Các ví dụ phổ biến bao gồm họ mô hình YOLO của Ultralytics , được biết đến với sự cân bằng giữa tốc độ và hiệu quả (như YOLO11 ) và SSD ( Máy dò MultiBox Single Shot ).
Sự khác biệt cơ bản giữa máy dò vật thể một giai đoạn và hai giai đoạn nằm ở quy trình hoạt động của chúng. Máy dò hai giai đoạn, chẳng hạn như họ R-CNN , trước tiên tạo ra nhiều đề xuất vùng (các khu vực tiềm năng có thể có vật thể) và sau đó phân loại và tinh chỉnh các đề xuất này trong giai đoạn riêng biệt thứ hai. Quy trình hai bước này thường đạt được độ chính xác cao hơn, đặc biệt là đối với các vật thể nhỏ hơn, nhưng phải trả giá bằng thời gian tính toán tăng đáng kể và tốc độ suy luận thấp hơn. Ngược lại, máy dò một giai đoạn hợp nhất các bước này, thực hiện định vị và phân loại đồng thời trên toàn bộ hình ảnh. Phương pháp thống nhất này mang lại tốc độ tăng đáng kể, mặc dù về mặt lịch sử, nó liên quan đến sự đánh đổi, đôi khi dẫn đến độ chính xác thấp hơn một chút so với các phương pháp hai giai đoạn hiện đại, một khoảng cách mà máy dò một giai đoạn hiện đại liên tục hoạt động để thu hẹp. Hiệu suất thường được đo bằng các số liệu như Độ chính xác trung bình trung bình (mAP) .
Tốc độ và hiệu quả của các máy dò vật thể một giai đoạn khiến chúng trở nên vô cùng hữu ích trong nhiều tình huống thực tế đòi hỏi phải ra quyết định nhanh chóng:
Việc phát triển và triển khai các máy dò vật thể một giai đoạn được hỗ trợ bởi nhiều công cụ và khuôn khổ khác nhau, bao gồm:
Bằng cách hiểu các nguyên lý, lợi thế và ứng dụng của máy dò vật thể một giai đoạn, các nhà phát triển và nhà nghiên cứu có thể tận dụng hiệu quả tốc độ của chúng để giải quyết nhiều thách thức về thị giác máy tính thời gian thực.