Khám phá sức mạnh của phát hiện đối tượng—xác định và định vị các đối tượng trong hình ảnh hoặc video bằng các mô hình tiên tiến như YOLO . Khám phá các ứng dụng thực tế!
Phát hiện đối tượng là một nhiệm vụ cơ bản trong thị giác máy tính (CV) liên quan đến việc xác định sự hiện diện, vị trí và loại của một hoặc nhiều đối tượng trong một hình ảnh hoặc video. Không giống như phân loại hình ảnh, chỉ định một nhãn duy nhất cho toàn bộ hình ảnh, phát hiện đối tượng phác thảo chính xác từng trường hợp đối tượng bằng cách sử dụng hộp giới hạn và chỉ định nhãn lớp cho trường hợp đó. Khả năng này cho phép máy hiểu các cảnh trực quan với độ chi tiết cao hơn, phản ánh gần hơn nhận thức thị giác của con người.
Phát hiện đối tượng thường kết hợp hai nhiệm vụ cốt lõi: phân loại đối tượng (xác định 'đối tượng' nào đang có mặt) và định vị đối tượng (xác định 'vị trí' của đối tượng). Các hệ thống phát hiện đối tượng hiện đại phụ thuộc rất nhiều vào học sâu (DL) , đặc biệt là Mạng nơ-ron tích chập (CNN) . Các mạng này được đào tạo trên các tập dữ liệu lớn, chẳng hạn như tập dữ liệu COCO phổ biến, để tìm hiểu các tính năng và mẫu liên quan đến các lớp đối tượng khác nhau. Mô hình xử lý một hình ảnh đầu vào và đưa ra danh sách các hộp giới hạn, mỗi hộp có một nhãn lớp liên quan (ví dụ: 'ô tô', 'người') và điểm tin cậy. Hiệu suất của các mô hình này thường được đo bằng các số liệu như Giao điểm trên hợp (IoU) và Độ chính xác trung bình trung bình (mAP) .
Điều quan trọng là phải phân biệt phát hiện đối tượng với các tác vụ thị giác máy tính liên quan khác:
Các mô hình phát hiện đối tượng thường được chia thành hai loại:
Phát hiện đối tượng rất quan trọng đối với nhiều ứng dụng trong nhiều ngành công nghiệp khác nhau:
Phát triển các mô hình phát hiện đối tượng liên quan đến việc sử dụng các công cụ và nền tảng chuyên dụng. Các khuôn khổ như PyTorch và TensorFlow cung cấp các khối xây dựng. Các thư viện như OpenCV cung cấp các chức năng thị giác máy tính thiết yếu. Ultralytics cung cấp các mô hình Ultralytics YOLO hiện đại và nền tảng Ultralytics HUB , đơn giản hóa quy trình đào tạo các mô hình tùy chỉnh , quản lý tập dữ liệu và triển khai các giải pháp hiệu quả. Đào tạo mô hình hiệu quả thường đòi hỏi phải điều chỉnh siêu tham số cẩn thận và các chiến lược tăng cường dữ liệu.