Kiểm tra màu xanh lá cây
Liên kết được sao chép vào khay nhớ tạm

Lợi ích của Ultralytics YOLO11 Là một máy dò không có mỏ neo

Hiểu cách Ultralytics YOLO11 hỗ trợ phát hiện đối tượng không có điểm neo và những lợi ích mà kiến trúc mô hình này mang lại cho nhiều ứng dụng khác nhau.

Nếu chúng ta nhìn lại lịch sử của các mô hình Vision AI , khái niệm phát hiện đối tượng - một nhiệm vụ cốt lõi của thị giác máy tính liên quan đến việc xác định và định vị các đối tượng trong hình ảnh hoặc video - đã xuất hiện từ những năm 1960. Tuy nhiên, lý do chính cho tầm quan trọng của nó trong các cải tiến tiên tiến ngày nay là các kỹ thuật phát hiện đối tượng và kiến trúc mô hình đã tiến bộ và cải thiện nhanh chóng kể từ đó. 

Trong bài viết trước, chúng tôi đã thảo luận về sự phát triển của phát hiện đối tượng và con đường dẫn đến Ultralytics YOLO mô hình. Hôm nay, chúng ta sẽ tập trung khám phá một cột mốc cụ thể hơn trong hành trình này: bước chuyển từ máy dò có neo sang máy dò không có neo. 

Các máy dò dựa trên neo dựa vào các hộp được xác định trước, được gọi là "mỏ neo", để dự đoán vị trí của các vật thể trong hình ảnh. Ngược lại, các máy dò không neo bỏ qua các hộp được xác định trước này và thay vào đó dự đoán trực tiếp vị trí của vật thể.

Mặc dù sự thay đổi này có vẻ như là một thay đổi đơn giản, hợp lý, nhưng thực tế nó đã dẫn đến những cải tiến lớn về độ chính xác và hiệu quả phát hiện đối tượng. Trong bài viết này, chúng ta sẽ tìm hiểu cách các máy dò không có neo đã định hình lại thị giác máy tính thông qua những tiến bộ như Ultralytics YOLO11 .

Máy dò dựa trên neo là gì?

Các máy dò dựa trên neo sử dụng các hộp được xác định trước, được gọi là neo, để giúp định vị các đối tượng trong một hình ảnh. Hãy nghĩ về các neo này như một lưới các hộp có kích thước và hình dạng khác nhau được đặt trên hình ảnh. Sau đó, mô hình điều chỉnh các hộp này để phù hợp với các đối tượng mà nó phát hiện. Ví dụ, nếu mô hình xác định được một chiếc ô tô, nó sẽ sửa đổi hộp neo để khớp với vị trí và kích thước của chiếc ô tô chính xác hơn.

Mỗi điểm neo được liên kết với một đối tượng có thể có trong hình ảnh và trong quá trình đào tạo , mô hình học cách điều chỉnh các hộp neo để phù hợp hơn với vị trí, kích thước và tỷ lệ khung hình của đối tượng. Điều này cho phép mô hình phát hiện các đối tượng ở các tỷ lệ và hướng khác nhau. Tuy nhiên, việc chọn đúng bộ hộp neo có thể tốn thời gian và quá trình tinh chỉnh chúng có thể dễ xảy ra lỗi.

Hình 1. Hộp neo là gì?

Mặc dù các bộ dò dựa trên neo, như YOLOv4 , đã hoạt động tốt trong nhiều ứng dụng, nhưng chúng vẫn có một số nhược điểm. Ví dụ, các hộp neo không phải lúc nào cũng căn chỉnh tốt với các vật thể có hình dạng hoặc kích thước khác nhau, khiến mô hình khó phát hiện các vật thể nhỏ hoặc có hình dạng không đều. Quá trình lựa chọn và tinh chỉnh kích thước hộp neo cũng có thể tốn thời gian và đòi hỏi nhiều nỗ lực thủ công. Bên cạnh đó, các mô hình dựa trên neo thường gặp khó khăn trong việc phát hiện các vật thể bị che khuất hoặc chồng chéo, vì các hộp được xác định trước có thể không thích ứng tốt với các tình huống phức tạp hơn này.

Sự chuyển đổi sang phát hiện đối tượng không neo

Các máy dò không neo bắt đầu thu hút sự chú ý vào năm 2018 với các mô hình như CornerNet và CenterNet, áp dụng cách tiếp cận mới để phát hiện vật thể bằng cách loại bỏ nhu cầu về các hộp neo được xác định trước. Không giống như các mô hình truyền thống dựa vào các hộp neo có nhiều kích thước và hình dạng khác nhau để dự đoán vị trí của vật thể, các mô hình không neo dự đoán trực tiếp vị trí của vật thể. Chúng tập trung vào các điểm chính hoặc các đặc điểm của vật thể, như tâm, giúp đơn giản hóa quá trình phát hiện và giúp quá trình này nhanh hơn và chính xác hơn.

Sau đây là cách hoạt động chung của các mô hình không có mỏ neo:

  • Phát hiện điểm chính : Thay vì sử dụng các hộp được xác định trước, một số mô hình xác định các điểm quan trọng trên một đối tượng, như tâm hoặc các góc cụ thể. Các điểm chính này giúp các mô hình xác định vị trí của đối tượng và kích thước của nó.
  • Dự đoán tâm : Một số mô hình tập trung vào việc dự đoán tâm của một vật thể. Khi đã xác định được tâm, mô hình có thể dự đoán kích thước và vị trí của toàn bộ vật thể từ đó.
  • Hồi quy bản đồ nhiệt : Nhiều mô hình không có neo sử dụng bản đồ nhiệt , trong đó mỗi pixel biểu diễn một vị trí có thể có của một vật thể. Các giá trị bản đồ nhiệt mạnh hơn cho biết độ tin cậy cao hơn rằng một vật thể hiện diện tại điểm đó.
Hình 2. Phát hiện dựa trên mỏ neo so với phát hiện không có mỏ neo.

Vì các mô hình không neo không dựa vào hộp neo nên chúng có thiết kế đơn giản hơn. Điều này có nghĩa là chúng hiệu quả hơn về mặt tính toán. Vì chúng không phải xử lý nhiều hộp neo nên chúng có thể phát hiện vật thể nhanh hơn - một lợi thế quan trọng trong các ứng dụng thời gian thực như lái xe tự động và giám sát video. 

Các mô hình không có neo cũng xử lý tốt hơn nhiều các vật thể nhỏ, không đều hoặc bị che khuất. Vì chúng tập trung vào việc phát hiện các điểm chính thay vì cố gắng lắp các hộp neo, nên chúng linh hoạt hơn nhiều. Điều này cho phép chúng phát hiện chính xác các vật thể trong môi trường lộn xộn hoặc phức tạp, nơi các mô hình dựa trên neo có thể không thành công.

Ultralytics YOLO11 : Một máy dò không có neo

Được thiết kế ban đầu để đạt được tốc độ và hiệu quả, YOLO các mô hình đã dần dần chuyển từ các phương pháp dựa trên neo sang phát hiện không có neo, tạo ra các mô hình như YOLO11 nhanh hơn, linh hoạt hơn và phù hợp hơn với nhiều ứng dụng thời gian thực.

Sau đây là cái nhìn nhanh về cách thiết kế không có mỏ neo đã phát triển trên nhiều phương diện khác nhau YOLO phiên bản:

  • Ultralytics YOLOv5u : Giới thiệu Anchor-Free Split Ultralytics Đầu, loại bỏ nhu cầu về các hộp neo được xác định trước. Thay vào đó, mô hình trực tiếp dự đoán vị trí của các đối tượng trong hình ảnh, đơn giản hóa quy trình và cải thiện tính linh hoạt và tốc độ.
  • YOLOv6 : Một phương pháp mới gọi là Anchor-Aided Training (AAT) đã được sử dụng, trong đó các neo chỉ được sử dụng trong quá trình đào tạo. Điều này cho phép mô hình được hưởng lợi từ cấu trúc của các phương pháp dựa trên neo trong quá trình đào tạo, trong khi vẫn sử dụng phát hiện không có neo khi chạy để có tốc độ và khả năng thích ứng tốt hơn.
  • Ultralytics YOLOv8 : Chuyển hoàn toàn sang phát hiện không có neo bằng cách sử dụng Anchor-Free Split Ultralytics Đầu. Điều này làm cho mô hình nhanh hơn và chính xác hơn, đặc biệt là đối với các vật thể nhỏ hoặc có hình dạng kỳ lạ không vừa với hộp neo.
  • Ultralytics YOLO11 : Xây dựng trên YOLOv8 Phương pháp không neo, tối ưu hóa phát hiện hơn nữa bằng cách loại bỏ hoàn toàn hộp neo. Điều này dẫn đến phát hiện nhanh hơn, chính xác hơn cho các ứng dụng thời gian thực như theo dõi hành vi động vật và phân tích bán lẻ.
Hình 3. So sánh Ultralytics YOLOv8 Và Ultralytics YOLO11 .

Ứng dụng thực tế của YOLO11

Một ví dụ tuyệt vời về lợi ích của việc phát hiện không có neo bằng cách sử dụng YOLO11 là trong xe tự lái . Trong xe tự lái, việc phát hiện người đi bộ, xe khác và chướng ngại vật một cách nhanh chóng và chính xác là rất quan trọng đối với sự an toàn. YOLO11 Phương pháp không có điểm neo giúp đơn giản hóa quá trình phát hiện bằng cách trực tiếp dự đoán các điểm chính của vật thể, như tâm của người đi bộ hoặc ranh giới của phương tiện khác, thay vì dựa vào các hộp neo được xác định trước. 

Hình 4. Lợi ích của phát hiện không có neo trong YOLO11 (Hình ảnh của tác giả).

YOLO11 không cần phải điều chỉnh hoặc lắp lưới neo vào từng đối tượng, điều này có thể tốn kém về mặt tính toán và chậm. Thay vào đó, nó tập trung vào các tính năng chính, giúp nó nhanh hơn và hiệu quả hơn. Ví dụ, khi người đi bộ bước vào đường đi của xe, YOLO11 có thể nhanh chóng xác định vị trí của nó bằng cách xác định các điểm chính, ngay cả khi người đó ẩn một phần hoặc di chuyển. Khả năng thích ứng với các hình dạng và kích thước khác nhau mà không cần hộp neo cho phép YOLO11 để phát hiện các vật thể một cách đáng tin cậy hơn và ở tốc độ cao hơn, điều này rất quan trọng để đưa ra quyết định theo thời gian thực trong các hệ thống lái xe tự động.

Các ứng dụng khác nơi YOLO11 Khả năng không cần neo của 's thực sự nổi bật bao gồm:

  • Quản lý bán lẻ và hàng tồn kho : YOLO11 giúp theo dõi sản phẩm trên kệ dễ dàng hơn, ngay cả khi chúng được xếp chồng hoặc bị chặn một phần. Điều này giúp theo dõi hàng tồn kho nhanh hơn, chính xác hơn và giảm lỗi.
  • Hình ảnh y tế : YOLO11 cũng có hiệu quả trong chăm sóc sức khỏe, nơi nó có thể phát hiện khối u hoặc các bất thường khác trong quá trình quét y tế. Khả năng làm việc với các vật thể có hình dạng bất thường giúp cải thiện độ chính xác trong việc chẩn đoán các tình trạng phức tạp.
  • Giám sát động vật hoang dã : Trong nghiên cứu động vật hoang dã, YOLO11 có thể theo dõi động vật trong rừng rậm hoặc địa hình hiểm trở, giúp các nhà nghiên cứu theo dõi hành vi hoặc bảo vệ các loài có nguy cơ tuyệt chủng.
  • Phân tích thể thao : YOLO11 có thể được sử dụng để theo dõi người chơi, chuyển động của bóng hoặc các yếu tố khác theo thời gian thực trong các sự kiện thể thao nhằm cung cấp thông tin chi tiết có giá trị cho các đội, huấn luyện viên và đài truyền hình.

Những cân nhắc cần thực hiện khi làm việc với các mô hình không có neo

Trong khi các mô hình không có neo như YOLO11 cung cấp nhiều lợi thế, chúng đi kèm với một số hạn chế nhất định. Một trong những cân nhắc thực tế chính cần thực hiện là ngay cả các mô hình không có neo cũng có thể gặp khó khăn với các vật thể che khuất hoặc chồng chéo cao. Lý do đằng sau điều này là thị giác máy tính nhằm mục đích sao chép thị giác của con người và cũng giống như chúng ta đôi khi gặp khó khăn trong việc xác định các vật thể bị che khuất, các mô hình AI có thể phải đối mặt với những thách thức tương tự.

Một yếu tố thú vị khác liên quan đến quá trình xử lý dự đoán mô hình. Mặc dù kiến trúc của các mô hình không neo đơn giản hơn so với mô hình dựa trên neo, nhưng trong một số trường hợp nhất định, cần phải tinh chỉnh thêm. Ví dụ, các kỹ thuật hậu xử lý như triệt tiêu không tối đa (NMS) có thể cần thiết để dọn dẹp các dự đoán chồng chéo hoặc cải thiện độ chính xác trong các cảnh đông đúc.

Neo vào tương lai của AI với YOLO11

Sự thay đổi từ phát hiện dựa trên neo sang phát hiện không có neo là một tiến bộ đáng kể trong phát hiện đối tượng. Với các mô hình không có neo như YOLO11 , quá trình này được đơn giản hóa, dẫn đến cải thiện cả về độ chính xác và tốc độ.

Bởi vì YOLO11 , chúng ta đã thấy cách phát hiện vật thể không có neo nổi trội như thế nào trong các ứng dụng thời gian thực như xe tự lái, giám sát video và hình ảnh y tế, nơi phát hiện nhanh chóng và chính xác là rất quan trọng. Phương pháp tiếp cận này cho phép YOLO11 để thích ứng dễ dàng hơn với các kích thước vật thể khác nhau và các cảnh phức tạp, mang lại hiệu suất tốt hơn trong nhiều môi trường khác nhau.

Khi công nghệ thị giác máy tính tiếp tục phát triển, việc phát hiện vật thể sẽ trở nên nhanh hơn, linh hoạt hơn và hiệu quả hơn.

Khám phá kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng hấp dẫn của chúng tôi để cập nhật mọi thông tin về AI. Xem Vision AI đang tác động đến các lĩnh vực như sản xuấtnông nghiệp như thế nào.

Logo FacebookBiểu trưng TwitterBiểu trưng LinkedInBiểu tượng sao chép liên kết

Đọc thêm trong danh mục này

Hãy xây dựng tương lai
của AI cùng nhau!

Bắt đầu hành trình của bạn với tương lai của machine learning