Khám phá cách các máy dò dựa trên mỏ neo cách mạng hóa việc phát hiện vật thể với khả năng định vị chính xác, khả năng thích ứng với quy mô và các ứng dụng thực tế.
Các bộ dò dựa trên neo là một loại mô hình phát hiện đối tượng thường được sử dụng trong thị giác máy tính . Chúng sử dụng các hộp được xác định trước, được gọi là "mỏ neo", để dự đoán vị trí và lớp đối tượng trong một hình ảnh. Các mỏ neo này hoạt động như các điểm tham chiếu, giúp mô hình tạo ra các đề xuất cho các đối tượng tiềm năng. Chúng đặc biệt hiệu quả trong việc xác định các đối tượng có nhiều kích thước và hình dạng khác nhau, khiến chúng trở thành lựa chọn phổ biến trong nhiều kiến trúc phát hiện đối tượng.
Các máy dò dựa trên neo hoạt động bằng cách sử dụng một lưới các hộp neo có các tỷ lệ và tỷ lệ khung hình khác nhau trượt trên hình ảnh. Các hộp neo này được đặt ở vị trí chiến lược để bao phủ nhiều kích thước và hình dạng vật thể tiềm năng. Trong quá trình đào tạo , mô hình học cách phân loại từng hộp neo thành hộp chứa vật thể hoặc chỉ chứa nền. Nó cũng tinh chỉnh vị trí của các hộp neo này để phát hiện chính xác các vật thể. Quá trình tinh chỉnh này bao gồm việc điều chỉnh kích thước và vị trí của hộp neo để phù hợp hơn với hộp giới hạn thực tế của vật thể. Đầu ra cuối cùng là một tập hợp các hộp giới hạn, mỗi hộp có nhãn lớp tương ứng và điểm tin cậy, cho biết khả năng có mặt của vật thể.
Đối với người dùng quen thuộc với các khái niệm học máy cơ bản, hãy tưởng tượng bạn đang tìm kiếm các loại xe khác nhau trong một bãi đậu xe lớn. Thay vì quét ngẫu nhiên toàn bộ khu vực, bạn sử dụng các khu vực tìm kiếm được xác định trước (mỏ neo) có nhiều kích thước và hình dạng khác nhau—nhỏ cho xe máy, vừa cho ô tô và lớn cho xe buýt. Bạn di chuyển các khu vực tìm kiếm này trên khắp bãi đậu xe, kiểm tra từng khu vực để xem có xe không. Nếu khu vực tìm kiếm khớp chặt với xe, bạn sẽ điều chỉnh kích thước và vị trí của khu vực đó để phù hợp hoàn hảo với xe. Phương pháp này giúp bạn định vị nhanh chóng và chính xác tất cả các xe trong bãi.
Máy dò dạng mỏ neo có một số ưu điểm khiến chúng phù hợp với nhiều ứng dụng khác nhau:
Mặc dù các máy dò dựa trên neo có hiệu quả, nhưng chúng có một số hạn chế so với các máy dò không có neo . Các máy dò không có neo dự đoán vị trí vật thể trực tiếp mà không cần sử dụng các hộp neo được xác định trước. Sau đây là một số điểm khác biệt chính:
Để biết thêm thông tin chi tiết về lợi ích của việc phát hiện không có điểm neo, bạn có thể khám phá bài viết về lợi ích của Ultralytics YOLO11 khi là máy dò không có điểm neo .
Các máy dò dựa trên neo được sử dụng rộng rãi trong nhiều ngành công nghiệp khác nhau do tính mạnh mẽ và khả năng thích ứng của chúng. Chúng đặc biệt hiệu quả trong các tình huống mà các vật thể có thể xuất hiện ở các tỷ lệ và tỷ lệ khung hình khác nhau. Sau đây là hai ví dụ cụ thể về các ứng dụng trong thế giới thực:
Một số mô hình phát hiện đối tượng phổ biến sử dụng các phương pháp tiếp cận dựa trên neo. Các phiên bản trước đó của họ YOLO Ultralytics , chẳng hạn như YOLOv4 , là các bộ phát hiện dựa trên neo nổi tiếng. Các mô hình đáng chú ý khác bao gồm Faster R-CNN, giới thiệu khái niệm Mạng đề xuất vùng (RPN) để tạo các đề xuất vùng bằng cách sử dụng neo, và Single Shot MultiBox Detector (SSD) ( nguồn ), sử dụng nhiều bản đồ đặc điểm ở các tỷ lệ khác nhau để phát hiện đối tượng. Các mô hình này đã đặt ra các chuẩn mực trong lĩnh vực phát hiện đối tượng và tiếp tục có ảnh hưởng trong việc phát triển các kiến trúc mới.