Khám phá cách học tập kết hợp (ensemble learning) cải thiện độ chính xác và giảm hiện tượng quá khớp (overfitting). Tìm hiểu cách kết hợp nhiều mô hình như... Ultralytics YOLO26 cho kết quả xử lý hình ảnh máy tính vượt trội.
Học tập kết hợp là một chiến lược mạnh mẽ trong học máy (ML) trong đó nhiều mô hình độc lập, thường được gọi là "mô hình học yếu", được kết hợp để tạo ra một kết quả dự đoán duy nhất. Nguyên tắc cơ bản là một nhóm các mô hình thường có thể đạt được độ chính xác cao hơn và khả năng khái quát hóa tốt hơn so với bất kỳ mô hình đơn lẻ nào. Bằng cách tổng hợp các dự đoán từ các thuật toán đa dạng, các phương pháp học tập kết hợp giúp giảm thiểu rủi ro quá khớp với dữ liệu huấn luyện , làm mịn các lỗi ngẫu nhiên và cải thiện tính ổn định tổng thể của hệ thống. Cách tiếp cận này tương tự như việc tham khảo ý kiến của một nhóm chuyên gia thay vì chỉ dựa vào ý kiến của một cá nhân để đưa ra quyết định quan trọng.
Hiệu quả của các phương pháp kết hợp nằm ở khả năng điều chỉnh sự cân bằng giữa độ lệch và phương sai . Các mô hình riêng lẻ có thể bị ảnh hưởng bởi phương sai cao (nhạy cảm với nhiễu) hoặc độ lệch cao (đơn giản hóa quá mức). Việc kết hợp các mô hình giúp giảm thiểu những vấn đề này thông qua các kỹ thuật cụ thể:
Trong lĩnh vực thị giác máy tính (CV) , các mô hình kết hợp thường được sử dụng để tối đa hóa hiệu suất trong các cuộc thi và các ứng dụng an toàn quan trọng. Đối với phát hiện đối tượng , điều này thường liên quan đến việc chạy nhiều mô hình — chẳng hạn như các phiên bản khác nhau của YOLO26 — trên cùng một hình ảnh. Sau đó, các hộp giới hạn thu được sẽ được hợp nhất bằng các kỹ thuật như loại bỏ cực đại không cục bộ ( NMS ) hoặc hợp nhất hộp có trọng số (WBF) để tìm ra vị trí đối tượng có khả năng nhất.
Các phương pháp kết hợp được sử dụng rộng rãi trong các ngành công nghiệp mà độ tin cậy dự đoán là tối quan trọng.
Bạn có thể mô phỏng một tập hợp suy luận cơ bản bằng cách tải nhiều mô hình đã được huấn luyện và tạo ra các dự đoán cho cùng một đầu vào. Nền tảng Ultralytics cho phép bạn huấn luyện các biến thể này một cách dễ dàng. Ví dụ sau đây minh họa việc tải hai mô hình YOLO khác nhau Ultralytics (YOLO26n và YOLO26s) để xác minh các phát hiện trên một hình ảnh.
from ultralytics import YOLO
# Load two distinct YOLO26 model variants
# 'n' (nano) is faster, 's' (small) is more accurate
model_nano = YOLO("yolo26n.pt")
model_small = YOLO("yolo26s.pt")
# Define the image source
source = "https://ultralytics.com/images/bus.jpg"
# Run inference with both models
results_n = model_nano(source)
results_s = model_small(source)
# Compare the number of objects detected by each model
print(f"Nano Model Found: {len(results_n[0].boxes)} objects")
print(f"Small Model Found: {len(results_s[0].boxes)} objects")
Điều quan trọng là phải phân biệt giữa học tập kết hợp (Ensemble learning) và tăng cường dữ liệu (Data Augmentation ).
Trong khi tăng cường dữ liệu giúp một mô hình học tốt hơn, học tập kết hợp giúp nhiều mô hình xác thực kết quả đầu ra của nhau. Cả hai chiến lược này thường được sử dụng cùng nhau để đạt được kết quả tiên tiến nhất trong các tác vụ như phân đoạn đối tượng và ước lượng tư thế .