Thuật ngữ

Hộp giới hạn

Tìm hiểu cách các hộp giới hạn cung cấp năng lượng cho phát hiện đối tượng, AI và máy học với Ultralytics YOLO . Khám phá các công cụ, khái niệm và ứng dụng thực tế.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Hộp giới hạn là một đường viền hình chữ nhật làm nổi bật vị trí và kích thước của một đối tượng trong một khung hình ảnh hoặc video. Các hộp này là công cụ cơ bản trong thị giác máy tính, đặc biệt là trong các tác vụ như phát hiện đối tượng , phân đoạn hình ảnh và theo dõi đối tượng. Được xác định bằng tọa độ của góc trên bên trái và góc dưới bên phải, hộp giới hạn giúp các thuật toán xác định và phân loại chính xác các đối tượng, cho phép nhiều ứng dụng trong nhiều ngành công nghiệp khác nhau.

Tầm quan trọng trong AI và Học máy

Các hộp giới hạn rất cần thiết để đào tạo các mô hình học máy (ML) để hiểu và diễn giải dữ liệu trực quan. Chúng rất quan trọng trong các mô hình phát hiện đối tượng, chẳng hạn như Ultralytics YOLO , được thiết kế để phát hiện nhiều đối tượng trong một hình ảnh duy nhất. Bằng cách cung cấp một điểm đánh dấu trực quan rõ ràng, các hộp giới hạn giúp thu hẹp tiêu điểm của các mô hình phát hiện, cải thiện độ chính xác và hiệu quả của việc phát hiện đối tượng.

Các khái niệm chính liên quan đến hộp giới hạn

Một số khái niệm quan trọng có liên quan chặt chẽ đến hộp giới hạn trong lĩnh vực học máy:

  • Giao điểm trên hợp nhất (IoU): IoU là một số liệu đo lường sự chồng chéo giữa hộp giới hạn dự đoán và hộp giới hạn thực tế (thực tế). Nó được sử dụng để đánh giá độ chính xác của các mô hình phát hiện đối tượng. IoU cao hơn cho thấy sự căn chỉnh tốt hơn giữa các hộp dự đoán và thực tế.
  • Non-Maximum Suppression (NMS): NMS là một kỹ thuật được sử dụng để loại bỏ các hộp giới hạn dư thừa. Nó chọn hộp giới hạn chính xác nhất trong số nhiều hộp chồng chéo, cải thiện kết quả phát hiện tổng thể.
  • Độ chính xác trung bình trung bình (mAP): mAP là một số liệu phổ biến để đánh giá hiệu suất của các mô hình phát hiện đối tượng. Nó xem xét cả độ chính xác và khả năng thu hồi trên nhiều ngưỡng IoU khác nhau, cung cấp thước đo toàn diện về độ chính xác của mô hình.

Hộp giới hạn so với các thuật ngữ liên quan

Trong khi các hộp giới hạn được sử dụng để định vị các đối tượng, chúng khác biệt với các kỹ thuật thị giác máy tính khác như phân đoạn ngữ nghĩaphân đoạn thể hiện . Phân đoạn ngữ nghĩa liên quan đến việc phân loại từng pixel trong một hình ảnh thành một danh mục cụ thể, cung cấp các đường viền chi tiết nhưng không phân biệt giữa các đối tượng riêng lẻ của cùng một lớp. Mặt khác, phân đoạn thể hiện xác định và phác thảo từng thể hiện đối tượng riêng biệt, cung cấp thông tin chi tiết hơn các hộp giới hạn.

Ứng dụng trong các tình huống thực tế

Hộp giới hạn được sử dụng trong nhiều ứng dụng thực tế do tính đơn giản và hiệu quả của chúng. Sau đây là hai ví dụ nổi bật:

Xe tự hành

Trong xe tự lái , hộp giới hạn giúp xác định và theo dõi người đi bộ, các phương tiện khác và chướng ngại vật trên đường. Khả năng này rất quan trọng để điều hướng an toàn và tránh va chạm. Phát hiện chính xác bằng hộp giới hạn đảm bảo rằng các hệ thống tự động có thể đưa ra quyết định kịp thời. Tìm hiểu thêm về tác động của AI lên công nghệ tự lái .

Quản lý bán lẻ và hàng tồn kho

Trong bán lẻ, hộp giới hạn được sử dụng để theo dõi mức tồn kho và quản lý hàng tồn kho hiệu quả. Bằng cách phát hiện và đếm sản phẩm trên kệ, hệ thống phát hiện đối tượng có thể tự động theo dõi hàng tồn kho và tối ưu hóa hoạt động. Công nghệ này hợp lý hóa quy trình và cải thiện sự hài lòng của khách hàng. Khám phá cách Vision AI đang cách mạng hóa quản lý hàng tồn kho trong bán lẻ .

Công cụ và công nghệ

Một số công cụ và công nghệ được sử dụng để triển khai hộp giới hạn trong máy học:

  • Ultralytics YOLO : Các Ultralytics YOLO framework nổi tiếng với khả năng phát hiện đối tượng theo thời gian thực. Nó sử dụng các hộp giới hạn để xác định và định vị đối tượng một cách nhanh chóng và chính xác. Khám phá framework Ultralytics YOLO để biết thêm chi tiết.
  • OpenCV: OpenCV là một thư viện thị giác máy tính nguồn mở cung cấp các công cụ để xử lý hình ảnh và video. Nó thường được sử dụng để vẽ và thao tác các hộp giới hạn. Tìm hiểu thêm về OpenCV .
  • Công cụ ghi nhãn: Các công cụ như LabelImg và Roboflow được sử dụng để chú thích hình ảnh bằng cách vẽ các hộp giới hạn xung quanh các đối tượng. Các chú thích này rất quan trọng để đào tạo các mô hình phát hiện đối tượng. Khám phá nhãn dữ liệu cho các dự án thị giác máy tính để tìm hiểu thêm.

Bằng cách hiểu và sử dụng các khái niệm và công cụ này, các nhà phát triển và nhà nghiên cứu có thể tận dụng các hộp giới hạn để tạo ra các hệ thống phát hiện đối tượng mạnh mẽ và chính xác, thúc đẩy sự đổi mới trên nhiều ứng dụng khác nhau. Truy cập Ultralytics HUB để biết các tài nguyên và công cụ để nâng cao các dự án thị giác máy tính của bạn.

Đọc tất cả