Thuật ngữ

Máy dò không neo

Khám phá sức mạnh của máy dò không cần neo—phát hiện vật thể hợp lý với độ chính xác, hiệu quả và khả năng thích ứng được cải thiện cho các ứng dụng thực tế.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Các bộ dò không có neo đại diện cho một phương pháp tiếp cận hiện đại trong phát hiện đối tượng , giúp đơn giản hóa quy trình bằng cách dự đoán trực tiếp vị trí đối tượng mà không cần dựa vào các hộp neo được xác định trước. Không giống như các bộ dò dựa trên neo , sử dụng một tập hợp các hộp được xác định trước có nhiều kích thước và tỷ lệ khung hình khác nhau để định vị đối tượng, các phương pháp không có neo dự đoán các thuộc tính của đối tượng như điểm trung tâm hoặc điểm chính góc trực tiếp từ các đặc điểm hình ảnh. Điều này thường dẫn đến thiết kế mô hình đơn giản hơn, giảm chi phí tính toán trong quá trình đào tạo và cải thiện hiệu suất, đặc biệt là đối với các đối tượng có hình dạng hoặc tỷ lệ không theo quy ước thường thấy trong các tập dữ liệu như COCO .

Các khái niệm chính và phương pháp luận

Các bộ dò không có neo thường hoạt động bằng cách xử lý phát hiện đối tượng như một ước tính điểm chính hoặc vấn đề dự đoán trung tâm trong bản đồ đặc điểm được tạo bởi Mạng nơ-ron tích chập (CNN) . Thay vì khớp các dự đoán với một tập hợp dày đặc các hộp neo, các mô hình này trực tiếp hồi quy các thuộc tính đối tượng tại các vị trí cụ thể. Các phương pháp tiếp cận phổ biến bao gồm:

  • Phương pháp dựa trên điểm chính : Các mô hình như CornerNet dự đoán các cặp điểm chính góc cho mỗi đối tượng và nhóm chúng lại để tạo thành các hộp giới hạn.
  • Phương pháp dựa trên tâm : Các mô hình như CenterNet dự đoán điểm tâm của mỗi đối tượng cùng với các kích thước của nó (chiều rộng và chiều cao).
  • Phương pháp dự đoán dày đặc : Các mô hình như FCOS (Phát hiện đối tượng một giai đoạn hoàn toàn tích chập) dự đoán sự hiện diện của đối tượng và tọa độ hộp giới hạn trực tiếp cho từng vị trí trong bản đồ đặc điểm đầu ra, tương tự như phân đoạn ngữ nghĩa sử dụng Mạng tích chập hoàn toàn (FCN) .

Các phương pháp này loại bỏ thiết kế mỏ neo phức tạp và logic khớp lệnh cần thiết theo phương pháp dựa trên mỏ neo.

Ưu điểm của phát hiện không neo

Lợi ích chính của máy dò không neo là tính đơn giản và linh hoạt của chúng. Những lợi thế chính bao gồm:

  • Giảm siêu tham số : Việc loại bỏ các hộp neo sẽ loại bỏ nhu cầu thiết kế và điều chỉnh tỷ lệ, mật độ và thang đo neo, giúp đơn giản hóa quá trình đào tạo .
  • Khả năng khái quát hóa được cải thiện : Chúng thường hoạt động tốt hơn trên các đối tượng có hình dạng và kích thước đa dạng, không phù hợp với các điểm neo được xác định trước.
  • Hiệu quả tiềm năng : Bằng cách loại bỏ các tính toán liên quan đến mỏ neo như tính toán Giao điểm trên Hợp (IoU) trong quá trình đào tạo, các mô hình không có mỏ neo đôi khi có thể nhanh hơn và tiết kiệm bộ nhớ hơn.
  • Tính đơn giản về mặt khái niệm : Phương pháp dự đoán trực tiếp có thể trực quan hơn và dễ triển khai hơn so với các đường ống dựa trên mỏ neo.

So sánh với các máy dò dựa trên neo

Sự khác biệt chính nằm ở cách xử lý các đề xuất định vị đối tượng. Các bộ dò dựa trên neo , chẳng hạn như các mô hình cũ hơn như YOLOv4 , phụ thuộc rất nhiều vào một tập hợp các hộp neo được xác định trước được phân bổ trên toàn bộ hình ảnh. Mạng dự đoán các độ lệch từ các neo này và phân loại xem neo có chứa đối tượng hay không. Điều này đòi hỏi phải cấu hình neo cẩn thận dựa trên số liệu thống kê của tập dữ liệu.

Các máy dò không có neo, bao gồm các mô hình Ultralytics YOLO gần đây như YOLO11 , bỏ qua bước này. Chúng trực tiếp dự đoán vị trí đối tượng hoặc điểm chính liên quan đến các ô lưới hoặc vị trí bản đồ đặc điểm. Điều này thường dẫn đến các bước xử lý hậu kỳ đơn giản hơn, như Non-Maximum Suppression (NMS) và có thể cải thiện độ chính xác phát hiện đối với các đối tượng có hình dạng bất thường. Bạn có thể đọc thêm về lợi ích của Ultralytics YOLO11 là máy dò không có neo .

Ứng dụng trong thế giới thực

Các máy dò không có mỏ neo có hiệu quả trong nhiều tác vụ thị giác máy tính khác nhau:

  • Lái xe tự động : Phát hiện người đi bộ, người đi xe đạp và các phương tiện có kích thước và tỷ lệ khung hình khác nhau một cách chính xác là rất quan trọng đối với sự an toàn của xe tự động . Các phương pháp không neo thích ứng tốt với các đối tượng đa dạng này, cải thiện độ tin cậy của nhận thức. Khám phá các nguồn tài nguyên như Computer Vision Foundation để biết những tiến bộ trong nghiên cứu.
  • Phân tích hình ảnh y tế : Trong phân tích hình ảnh y tế , việc xác định các bất thường nhỏ hoặc có hình dạng bất thường như khối u hoặc tổn thương được hưởng lợi từ phương pháp dự đoán trực tiếp, vì các điểm neo được xác định trước có thể không thẳng hàng. Xem các ví dụ như sử dụng YOLO11 để phát hiện khối u .

Công cụ và công nghệ

Việc phát triển các máy dò không có mỏ neo được hỗ trợ bởi các khuôn khổ học sâu chính như PyTorchTensorFlow . Ultralytics hệ sinh thái cung cấp các công cụ và mô hình được đào tạo trước tận dụng các thiết kế không có neo. Bạn có thể khám phá Ultralytics tài liệu hướng dẫn chi tiết về triển khai và sử dụng Ultralytics HUB để đào tạo và triển khai mô hình hợp lý. Các nguồn như Papers With Code liệt kê các mô hình tiên tiến, nhiều mô hình trong số đó không có neo. Để có kiến thức nền tảng, hãy xem xét các khóa học từ các nền tảng như DeepLearning.AI .

Đọc tất cả