Tìm hiểu cách các hộp giới hạn xác định vị trí đối tượng trong thị giác máy tính. Khám phá các định dạng tọa độ, ứng dụng thực tế và cách sử dụng chúng. Ultralytics YOLO26.
Hộp giới hạn là một vùng hình chữ nhật được xác định bởi một tập hợp các tọa độ, bao quanh một đối tượng cụ thể trong khung hình ảnh hoặc video. Trong lĩnh vực thị giác máy tính (CV) , các hộp này đóng vai trò là các chú thích cơ bản để dạy các hệ thống trí tuệ nhân tạo (AI) cách định vị và nhận dạng các đối tượng khác nhau. Thay vì chỉ đơn giản phân loại toàn bộ hình ảnh là "có chứa một chiếc ô tô", hộp giới hạn cho phép mô hình xác định chính xác vị trí và phạm vi không gian của chiếc ô tô, tách nó khỏi nền và các thực thể khác. Khả năng định vị này rất cần thiết cho các nhiệm vụ phát hiện đối tượng , trong đó mục tiêu là xác định nhiều đối tượng cùng một lúc với độ chính xác cao.
Để xử lý dữ liệu hình ảnh hiệu quả, các mô hình học máy (ML) dựa vào các hệ tọa độ cụ thể để biểu diễn các hộp giới hạn một cách toán học. Định dạng được chọn thường quyết định cách dữ liệu được chuẩn bị cho việc huấn luyện mô hình và cách mô hình đưa ra dự đoán của nó.
Các hộp giới hạn là nền tảng của vô số giải pháp trí tuệ nhân tạo trong nhiều ngành công nghiệp khác nhau. Bằng cách cho phép định vị chính xác, chúng giúp các hệ thống tương tác thông minh với thế giới vật lý.
Khi sử dụng các kiến trúc hiện đại như YOLO26Mô hình dự đoán các hộp giới hạn cùng với nhãn lớp và một
điểm tự tinVí dụ sau đây minh họa cách chạy suy luận trên một hình ảnh và truy cập tọa độ hộp giới hạn bằng cách sử dụng... ultralytics bưu kiện.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0]) # Output: tensor([x1, y1, x2, y2, ...])
Mặc dù hộp giới hạn là tiêu chuẩn cho việc phát hiện nói chung, chúng khác biệt với các loại chú thích khác được sử dụng trong các tác vụ chi tiết hơn.
Việc tạo ra các chú thích hộp giới hạn chất lượng cao là một bước quan trọng trong quy trình học máy. Nền tảng Ultralytics đơn giản hóa quá trình này bằng cách cung cấp các công cụ để chú thích dữ liệu và quản lý tập dữ liệu. Chú thích đúng cách đảm bảo rằng các mô hình học cách phân biệt các đối tượng một cách chính xác, giảm thiểu các lỗi như quá khớp hoặc nhầm lẫn nền. Các kỹ thuật tiên tiến như loại bỏ cực đại không đồng nhất ( NMS ) được sử dụng trong quá trình suy luận để tinh chỉnh các dự đoán này bằng cách loại bỏ các hộp chồng chéo, đảm bảo rằng chỉ còn lại phát hiện chính xác nhất cho mỗi đối tượng.