Thuật ngữ

Hộp giới hạn

Tìm hiểu cách các hộp giới hạn cho phép phát hiện đối tượng, AI và hệ thống học máy. Khám phá vai trò của chúng trong các ứng dụng thị giác máy tính!

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Hộp giới hạn là một khung hình chữ nhật được sử dụng trong thị giác máy tính (CV) để chỉ ra vị trí và phạm vi gần đúng của một đối tượng trong một khung hình ảnh hoặc video. Thường được xác định bằng tọa độ của góc trên cùng bên trái và góc dưới cùng bên phải (hoặc điểm trung tâm, chiều rộng và chiều cao), các hộp này cung cấp một phương pháp đơn giản nhưng hiệu quả để chỉ định vị trí của một đối tượng và chiếm bao nhiêu không gian. Hộp giới hạn là các thành phần cơ bản trong nhiều tác vụ CV khác nhau, bao gồm phát hiện đối tượng , theo dõi đối tượng và chú thích hình ảnh, tạo thành nền tảng của nhiều hệ thống Trí tuệ nhân tạo (AI)học máy (ML) hiện đại. Chúng rất cần thiết để cho phép máy móc hiểu không chỉ những đối tượng nào hiện diện mà còn hiểu vị trí của chúng trong một cảnh trực quan.

Tầm quan trọng trong phát hiện đối tượng

Các hộp giới hạn rất quan trọng đối với cả việc đào tạo và đánh giá các mô hình phát hiện đối tượng . Trong các nhiệm vụ được giải quyết bởi các mô hình như Ultralytics YOLO , các hộp giới hạn đóng vai trò là "sự thật cơ bản" trong quá trình đào tạo . Điều này có nghĩa là chúng biểu thị vị trí và kích thước chính xác của các đối tượng trong dữ liệu đào tạo , dạy mô hình cách định vị chính xác các đối tượng. Quá trình này thường bắt đầu bằng chú thích dữ liệu cẩn thận, trong đó con người hoặc các công cụ tự động vẽ các hộp này xung quanh các đối tượng trong hình ảnh, thường sử dụng các nền tảng như CVAT hoặc tích hợp với các nền tảng như Ultralytics HUB để quản lý tập dữ liệu. Trong quá trình suy luận , mô hình được đào tạo dự đoán các hộp giới hạn xung quanh các đối tượng được phát hiện, cùng với nhãn lớp và điểm tin cậy . Khả năng định vị này rất quan trọng đối với các ứng dụng không chỉ yêu cầu nhận dạng đối tượng mà còn cả vị trí chính xác của chúng.

Các khái niệm chính liên quan đến hộp giới hạn

Một số số liệu và kỹ thuật có liên quan chặt chẽ đến việc sử dụng và đánh giá hộp giới hạn trong mô hình ML:

  • Giao điểm trên Union (IoU) : Một số liệu được sử dụng để đo sự chồng chéo giữa hộp giới hạn dự đoán và hộp giới hạn thực tế. Nó định lượng độ chính xác của bản địa hóa.
  • Loại bỏ không tối đa (NMS) : Một kỹ thuật xử lý hậu kỳ được sử dụng để loại bỏ các hộp giới hạn trùng lặp, dư thừa cho cùng một đối tượng, chỉ giữ lại dự đoán đáng tin cậy nhất.
  • Độ chính xác trung bình (mAP) : Một số liệu chuẩn để đánh giá hiệu suất của các mô hình phát hiện đối tượng, xem xét cả độ chính xác phân loại và độ chính xác định vị (thường dựa trên ngưỡng IoU). Xem số liệu hiệu suất YOLO chi tiết.
  • Hộp neo : Các hộp được xác định trước với nhiều kích thước và tỷ lệ khung hình khác nhau được sử dụng trong một số máy dò (như máy dò cũ hơn) YOLO phiên bản) để giúp dự đoán hộp giới hạn hiệu quả hơn. Các mô hình mới hơn, bao gồm YOLO11 , thường không có mỏ neo , giúp đơn giản hóa đầu phát hiện.
  • Bộ dữ liệu COCO : Bộ dữ liệu phát hiện, phân đoạn và chú thích đối tượng quy mô lớn được sử dụng rộng rãi để đánh giá chuẩn các mô hình phát hiện đối tượng. Ultralytics cung cấp khả năng truy cập dễ dàng vào COCOcác tập dữ liệu phát hiện khác.

Hộp giới hạn so với các thuật ngữ liên quan

Trong khi các hộp giới hạn chuẩn (căn chỉnh theo trục) định vị các đối tượng bằng các hình chữ nhật đơn giản, các kỹ thuật thị giác máy tính khác cung cấp các mức độ chi tiết khác nhau hoặc xử lý các tình huống khác nhau:

Ứng dụng trong các tình huống thực tế

Hộp giới hạn là một phần không thể thiếu trong nhiều ứng dụng AI thực tế:

  1. Xe tự hành : Xe tự lái phụ thuộc rất nhiều vào khả năng phát hiện vật thể để xác định và định vị người đi bộ, các phương tiện khác, đèn giao thông và chướng ngại vật bằng cách sử dụng hộp giới hạn. Nhận thức không gian này, thường đạt được thông qua các mô hình học sâu , rất quan trọng để điều hướng an toàn và ra quyết định. Các công ty như Waymo giới thiệu công nghệ này rộng rãi. Ultralytics cung cấp thông tin chi tiết về AI trong xe tự lái .
  2. Phân tích bán lẻ : Trong bán lẻ, hộp giới hạn hỗ trợ quản lý hàng tồn kho bằng AI bằng cách phát hiện sản phẩm trên kệ, theo dõi mức tồn kho và phân tích hành vi của khách hàng thông qua tương tác trên kệ hoặc thói quen đi lại ( đếm đồ vật ).
  3. Bảo mật và giám sát : Các hộp giới hạn cho phép các hệ thống giám sát tự động phát hiện và theo dõi các cá nhân hoặc đối tượng quan tâm theo thời gian thực, kích hoạt cảnh báo khi có truy cập trái phép hoặc hoạt động đáng ngờ. Đây là nền tảng để xây dựng các ứng dụng như hệ thống báo động an ninh .
  4. Phân tích hình ảnh y tế : Trong chăm sóc sức khỏe, các hộp giới hạn hỗ trợ các bác sĩ X quang và bác sĩ lâm sàng bằng cách làm nổi bật các bất thường tiềm ẩn như khối u hoặc tổn thương trong quá trình quét (X-quang, CT, MRI), hỗ trợ chẩn đoán nhanh hơn và chính xác hơn. Xem các ví dụ trong X quang: Trí tuệ nhân tạo và Ultralytics ' Tổng quan về phân tích hình ảnh y tế .
  5. Nông nghiệp : Các hộp giới hạn được sử dụng trong nông nghiệp chính xác cho các nhiệm vụ như xác định loại trái cây để thu hoạch ( phát hiện trái cây ), theo dõi sức khỏe cây trồng hoặc phát hiện sâu bệnh.
Đọc tất cả