Thuật ngữ

Hộp giới hạn

Tìm hiểu cách các hộp giới hạn cho phép phát hiện đối tượng, AI và hệ thống học máy. Khám phá vai trò của chúng trong các ứng dụng thị giác máy tính!

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Hộp giới hạn là một khung hình chữ nhật được sử dụng trong thị giác máy tính (CV) để chỉ ra vị trí và phạm vi của một đối tượng trong một khung hình ảnh hoặc video. Các hộp này thường được xác định theo tọa độ của góc trên bên trái và góc dưới bên phải của chúng, cung cấp một cách đơn giản nhưng hiệu quả để chỉ định vị trí của một đối tượng và nó chiếm bao nhiêu không gian. Hộp giới hạn là các thành phần cơ bản trong nhiều tác vụ CV khác nhau, bao gồm phát hiện đối tượng , theo dõi đối tượng và chú thích hình ảnh, tạo thành nền tảng của nhiều hệ thống Trí tuệ nhân tạo (AI) và máy học (ML) hiện đại.

Tầm quan trọng trong phát hiện đối tượng

Các hộp giới hạn rất cần thiết cho việc đào tạo và đánh giá các mô hình phát hiện đối tượng. Trong các nhiệm vụ được giải quyết bởi các mô hình như Ultralytics YOLO , các hộp giới hạn đóng vai trò là sự thật cơ bản trong quá trình đào tạo, dạy mô hình cách định vị chính xác các đối tượng. Trong quá trình suy luận, mô hình dự đoán các hộp giới hạn xung quanh các đối tượng được phát hiện. Khả năng định vị này rất quan trọng đối với các ứng dụng không chỉ yêu cầu nhận dạng đối tượng mà còn cả vị trí chính xác của chúng, chẳng hạn như trong các phương tiện tự hành hoặc hệ thống rô bốt. Quá trình này thường bắt đầu bằng chú thích dữ liệu cẩn thận, trong đó con người hoặc các công cụ tự động vẽ các hộp giới hạn xung quanh các đối tượng trong hình ảnh đào tạo, thường sử dụng các công cụ như CVAT .

Các khái niệm chính liên quan đến hộp giới hạn

Một số số liệu và kỹ thuật có liên quan chặt chẽ đến việc sử dụng và đánh giá hộp giới hạn trong mô hình ML:

  • Giao điểm trên hợp (IoU) : Một số liệu được sử dụng để đo sự chồng lấn giữa hộp giới hạn dự đoán và hộp giới hạn thực tế.
  • Loại bỏ không tối đa (NMS) : Một kỹ thuật được sử dụng để loại bỏ các hộp giới hạn trùng lặp phát hiện cùng một đối tượng, chỉ giữ lại hộp có điểm tin cậy cao nhất.
  • Độ chính xác trung bình (mAP) : Một số liệu phổ biến để đánh giá hiệu suất của các mô hình phát hiện đối tượng, chủ yếu dựa vào tính toán IoU.
  • Hộp neo : Các hộp được xác định trước với nhiều kích thước và tỷ lệ khung hình khác nhau được một số máy dò sử dụng để giúp dự đoán các hộp giới hạn hiệu quả hơn. Các tập dữ liệu chuẩn như COCO thường được sử dụng để đánh giá các mô hình dựa trên các khái niệm này.

Hộp giới hạn so với các thuật ngữ liên quan

Trong khi các hộp giới hạn xác định vị trí các đối tượng bằng hình chữ nhật, các kỹ thuật thị giác máy tính khác cung cấp các mức độ chi tiết khác nhau:

  • Phân đoạn hình ảnh: Không giống như các hộp giới hạn cung cấp vị trí hình chữ nhật, phân đoạn hình ảnh nhằm mục đích phân loại từng điểm ảnh trong hình ảnh.
    • Phân đoạn ngữ nghĩa gán nhãn lớp (ví dụ: ô tô, người, đường) cho từng pixel nhưng không phân biệt giữa các trường hợp khác nhau của cùng một lớp.
    • Phân đoạn thể hiện tiến xa hơn bằng cách xác định và phác thảo từng thể hiện đối tượng riêng lẻ với mặt nạ cấp pixel, cung cấp nhiều chi tiết hơn hộp giới hạn. Bạn có thể tìm hiểu thêm về các tác vụ phân đoạn thể hiện .
  • Oriented Bounding Box (OBB) : Các hộp giới hạn chuẩn được căn chỉnh theo trục. Đối với các đối tượng được xoay, Oriented Bounding Box (OBB) cung cấp sự vừa vặn chặt chẽ hơn bằng cách xoay hộp cùng với đối tượng. Điều này đặc biệt hữu ích trong các ứng dụng như phân tích hình ảnh trên không hoặc phát hiện các đối tượng trong các cảnh lộn xộn, thường được đánh giá trên các tập dữ liệu như DOTA .

Ứng dụng trong các tình huống thực tế

Hộp giới hạn là một phần không thể thiếu trong nhiều ứng dụng AI thực tế:

Xe tự hành

Trong quá trình phát triển AI trong xe tự lái , hộp giới hạn đóng vai trò quan trọng trong việc phát hiện và theo dõi người đi bộ, người đi xe đạp, các phương tiện khác và chướng ngại vật trên đường. Phát hiện vật thể chính xác và theo thời gian thực bằng hộp giới hạn cho phép hệ thống của xe đưa ra quyết định sáng suốt để điều hướng an toàn và tránh va chạm, tuân thủ các hướng dẫn an toàn do các tổ chức như Cục Quản lý An toàn Giao thông Đường bộ Quốc gia (NHTSA) vạch ra. Khám phá thêm về vai trò của AI trong xe tự lái .

Quản lý hàng tồn kho bán lẻ

Các nhà bán lẻ sử dụng tính năng phát hiện đối tượng với hộp giới hạn để tự động theo dõi kệ hàng và quản lý hàng tồn kho . Camera được trang bị mô hình AI có thể phát hiện sản phẩm, đếm mức tồn kho, xác định các mặt hàng bị thất lạc và theo dõi tương tác của khách hàng với hàng hóa. Điều này cải thiện hiệu quả, giảm công sức thủ công và cung cấp dữ liệu có giá trị để tối ưu hóa bố cục cửa hàng và bổ sung hàng tồn kho. Những hiểu biết sâu sắc về các xu hướng công nghệ bán lẻ như vậy làm nổi bật tầm quan trọng ngày càng tăng của AI trong lĩnh vực này. Bạn có thể tìm thấy nhiều giải pháp Ultralytics khác nhau cho các ngành khác nhau .

Đọc tất cả