Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Các bộ dò tìm không dựa trên Anchor

Khám phá cách các bộ dò không cần neo đơn giản hóa việc phát hiện đối tượng và nâng cao hiệu quả. Tìm hiểu thêm Ultralytics YOLO26 sử dụng công nghệ này để cho kết quả nhanh hơn và chính xác hơn.

Các bộ dò không cần neo đại diện cho một lớp kiến ​​trúc phát hiện đối tượng hiện đại, giúp xác định và định vị các mục tiêu trong hình ảnh mà không cần dựa vào các hộp tham chiếu được xác định trước. Không giống như các phương pháp truyền thống phụ thuộc vào một lưới các neo được thiết lập sẵn để ước tính kích thước, các mô hình này dự đoán các hộp giới hạn trực tiếp từ các đặc điểm của hình ảnh. Sự thay đổi mô hình này đơn giản hóa việc thiết kế mô hình, giảm nhu cầu điều chỉnh siêu tham số thủ công và thường dẫn đến các kiến ​​trúc nhanh hơn, hiệu quả hơn, phù hợp cho suy luận thời gian thực . Các khung công tác tiên tiến, bao gồm Ultralytics YOLO26 , đã áp dụng phương pháp này để đạt được khả năng khái quát hóa vượt trội trên các tập dữ liệu đa dạng.

Cơ chế phát hiện không có neo

Sự đổi mới chính của các bộ dò không cần neo nằm ở cách chúng định hình bài toán định vị. Thay vì phân loại và tinh chỉnh hàng nghìn ứng viên hộp neo, các mô hình này thường coi việc phát hiện như một nhiệm vụ dự đoán điểm hoặc hồi quy. Bằng cách phân tích các bản đồ đặc trưng được tạo ra bởi mạng xương sống, mô hình xác định xác suất một pixel cụ thể tương ứng với một đối tượng.

Có hai chiến lược chủ đạo trong lĩnh vực này:

  • Các phương pháp dựa trên tâm: Các mô hình như FCOS (Fully Convolutional One-Stage Object Detection) tiên phong xác định điểm trung tâm của một đối tượng. Sau đó, mạng nơ-ron sẽ hồi quy khoảng cách từ điểm ảnh trung tâm này đến bốn ranh giới (trái, trên, phải, dưới) của khung bao quanh .
  • Các phương pháp dựa trên điểm mấu chốt: Lấy cảm hứng từ các kỹ thuật ước lượng tư thế , các bộ dò này xác định các điểm mấu chốt cụ thể, chẳng hạn như góc trên bên trái và góc dưới bên phải của một đối tượng. Sau đó, mô hình nhóm các điểm này lại để tạo thành một phát hiện hoàn chỉnh, một phương pháp được sử dụng bởi các kiến ​​trúc như CornerNet .

So sánh với các phương pháp dựa trên điểm neo

Để hiểu được tầm quan trọng của công nghệ không sử dụng anchor, điều cần thiết là phải phân biệt nó với các bộ dò dựa trên anchor . Trong các mô hình dựa trên anchor như YOLOv5 cũ hoặc Faster R-CNN ban đầu, hiệu suất phụ thuộc rất nhiều vào thiết kế của các anchor box — các mẫu hộp cụ thể với kích thước và tỷ lệ khung hình cố định.

Những điểm khác biệt bao gồm:

  • Điều chỉnh siêu tham số: Các phương pháp dựa trên anchor yêu cầu điều chỉnh cẩn thận kích thước anchor để phù hợp với tập dữ liệu, thường sử dụng các thuật toán như phân cụm k-means . Các phương pháp không dựa trên anchor loại bỏ hoàn toàn bước này.
  • Khái quát: Các mô hình không sử dụng neo (anchor-free) vượt trội trong việc phát hiện các đối tượng có tỷ lệ chiều dài/chiều rộng cực đoan—chẳng hạn như các tòa nhà cao tầng hoặc đồ dùng mỏng—mà có thể không phù hợp với các mẫu neo tiêu chuẩn được tìm thấy trong các tập dữ liệu như Microsoft COCO .
  • Tính toán: Bằng cách loại bỏ các phép tính liên quan đến Intersection over Union ( IoU ) giữa hàng ngàn điểm neo và hộp dữ liệu thực tế trong quá trình huấn luyện, các phương pháp không sử dụng điểm neo giúp đơn giản hóa hàm mất mát và giảm chi phí tính toán.

Các Ứng dụng Thực tế

Tính linh hoạt của các thiết bị dò không cần neo giữ khiến chúng trở nên lý tưởng cho các môi trường phức tạp, nơi hình dạng vật thể thay đổi khó lường.

  • Lái xe tự động: Trong ngành công nghiệp ô tô , các phương tiện phải detect Người đi bộ, người đi xe đạp và các chướng ngại vật ở các khoảng cách khác nhau. Mô hình không cần neo cho phép xe tự hành tính toán chính xác các hộp giới hạn cho các đối tượng xuất hiện rất nhỏ (xa) hoặc rất lớn (gần) mà không bị ràng buộc bởi tỷ lệ neo cố định.
  • Phân tích ảnh chụp từ trên không: Các đối tượng trong phân tích ảnh vệ tinh thường xuất hiện ở các hướng và tỷ lệ bất kỳ. Các bộ dò không cần neo thường được sử dụng trong máy bay không người lái (drone và UAV) để xác định cơ sở hạ tầng hoặc giám sát các thay đổi môi trường, vì chúng có thể thích ứng với các góc nhìn đa dạng tốt hơn so với lưới neo cứng nhắc.

Thực hiện với Ultralytics

Việc chuyển đổi sang kiến ​​trúc không cần neo là một đặc điểm quan trọng của các công nghệ gần đây. YOLO các thế hệ, cụ thể là Ultralytics YOLO26 . Lựa chọn thiết kế này góp phần đáng kể vào khả năng hoạt động hiệu quả trên các thiết bị AI biên . Người dùng có thể huấn luyện các mô hình này trên dữ liệu tùy chỉnh bằng cách sử dụng Nền tảng Ultralytics , giúp đơn giản hóa việc quản lý tập dữ liệu và huấn luyện trên đám mây.

Ví dụ sau đây minh họa cách tải và chạy suy luận với mô hình YOLO26 không có anchor bằng cách sử dụng... ultralytics Python bưu kiện.

from ultralytics import YOLO

# Load the anchor-free YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
# The model directly predicts boxes without anchor matching
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

Định hướng tương lai

Sự thành công của phương pháp phát hiện không cần anchor đã mở đường cho các quy trình phát hiện hoàn chỉnh từ đầu đến cuối. Các phát triển trong tương lai hướng đến việc tinh chỉnh hơn nữa phương pháp này bằng cách tích hợp các cơ chế chú ý tiên tiến hơn và tối ưu hóa độ trễ thấp hơn nữa bằng cách sử dụng các trình biên dịch như TensorRT .

Bằng cách tách rời quá trình dự đoán khỏi các thông tin hình học cố định, các bộ dò không cần neo đã giúp thị giác máy tính trở nên dễ tiếp cận và mạnh mẽ hơn. Cho dù là để phân tích hình ảnh y tế hay tự động hóa công nghiệp, các mô hình này đều cung cấp khả năng thích ứng cần thiết cho các giải pháp AI hiện đại.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay