Tìm hiểu cách đầu dò giúp phát hiện vật thể trong thời gian thực. Khám phá vai trò của nó trong... Ultralytics YOLO26 được sử dụng để dự đoán các hộp giới hạn và nhãn với độ chính xác cao.
Bộ xử lý phát hiện đóng vai trò là lớp ra quyết định cuối cùng trong kiến trúc mạng nơ-ron phát hiện đối tượng. Trong khi các lớp trước đó của mô hình chịu trách nhiệm hiểu hình dạng, kết cấu và đặc điểm trong ảnh, thì bộ xử lý phát hiện là thành phần cụ thể diễn giải thông tin này để dự đoán chính xác những đối tượng nào có mặt và vị trí của chúng. Nó chuyển đổi dữ liệu trừu tượng, cấp cao do bộ trích xuất đặc trưng tạo ra thành kết quả có thể hành động, thường xuất ra một tập hợp các hộp giới hạn bao quanh các đối tượng được xác định cùng với nhãn lớp và điểm tin cậy tương ứng của chúng.
Để hiểu đầy đủ chức năng của đầu dò, ta có thể hình dung các đầu dò hiện đại được cấu tạo từ ba giai đoạn chính, mỗi giai đoạn phục vụ một mục đích riêng biệt trong quy trình xử lý hình ảnh máy tính (CV) :
Thiết kế của các đầu dò đã phát triển đáng kể để cải thiện tốc độ và độ chính xác, đặc biệt là trong quá trình chuyển đổi từ các phương pháp truyền thống sang các mô hình suy luận thời gian thực hiện đại.
Độ chính xác của đầu dò là yếu tố then chốt để triển khai trí tuệ nhân tạo (AI) trong môi trường công nghiệp và an toàn cao. Người dùng có thể dễ dàng chú thích dữ liệu và huấn luyện các đầu dò chuyên dụng này bằng Nền tảng Ultralytics .
Ví dụ sau đây minh họa cách tải một
YOLO26 Mô hình và kiểm tra đầu ra của bộ phận phát hiện. Khi quá trình suy luận diễn ra, bộ phận này xử lý hình ảnh và trả về kết quả cuối cùng. boxes Bao gồm tọa độ và mã số lớp.
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to utilize the detection head
results = model("https://ultralytics.com/images/bus.jpg")
# The detection head outputs are stored in results[0].boxes
for box in results[0].boxes:
# Print the bounding box coordinates and the predicted class
print(f"Class: {int(box.cls)}, Coordinates: {box.xywh.numpy()}")
Sự tương tác này làm nổi bật cách đầu dò chuyển đổi các kích hoạt mạng thần kinh phức tạp thành dữ liệu dễ đọc mà các nhà phát triển có thể sử dụng cho các tác vụ tiếp theo như theo dõi hoặc đếm đối tượng .