Thuật ngữ

Tổng hợp

Tăng độ chính xác dự đoán bằng phương pháp tổng hợp! Tìm hiểu cách kết hợp nhiều mô hình để tăng hiệu suất trong phát hiện đối tượng, NLP, v.v.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong học máy, phương pháp Ensemble là một kỹ thuật kết hợp các dự đoán từ nhiều mô hình riêng lẻ để tạo ra dự đoán chính xác và mạnh mẽ hơn so với bất kỳ mô hình đơn lẻ nào có thể đạt được một mình. Nó hoạt động theo nguyên tắc thường được mô tả là ' trí tuệ của đám đông ', trong đó quyết định tập thể của một số mô hình đa dạng thường vượt trội hơn quyết định của một mô hình chuyên biệt. Cách tiếp cận này đặc biệt mạnh mẽ trong các nhiệm vụ phức tạp trong trí tuệ nhân tạo (AI) , chẳng hạn như phát hiện đối tượng , phân loại hình ảnh và xử lý ngôn ngữ tự nhiên, trong đó việc dựa vào một góc nhìn duy nhất có thể dẫn đến lỗi hoặc hạn chế.

Các khái niệm cốt lõi của phương pháp tổng hợp

Các phương pháp tổng hợp tận dụng tính đa dạng giữa nhiều mô hình (thường được gọi là người học cơ sở hoặc người học yếu) để giảm lỗi dự đoán và cải thiện hiệu suất tổng thể. Ý tưởng cốt lõi là các mô hình khác nhau có thể tạo ra các loại lỗi khác nhau trên các tập hợp con khác nhau của dữ liệu. Bằng cách kết hợp các dự đoán của chúng, các lỗi này thường có thể được trung bình hóa hoặc hủy lẫn nhau, dẫn đến một mô hình cuối cùng ổn định và tổng quát hơn, hoạt động tốt trên dữ liệu chưa biết. Chìa khóa thành công của các phương pháp tổng hợp là đảm bảo đủ tính đa dạng giữa các mô hình cơ sở. Tính đa dạng này có thể đạt được thông qua nhiều chiến lược khác nhau, chẳng hạn như sử dụng các thuật toán học khác nhau (ví dụ: kết hợp cây quyết định và SVM), đào tạo các mô hình trên các tập hợp con khác nhau của dữ liệu đào tạo (như trong Bagging) hoặc sử dụng các siêu tham số khác nhau cho cùng một thuật toán.

Lợi ích của việc sử dụng phương pháp Ensemble

Việc sử dụng các phương pháp tổng hợp mang lại một số lợi thế đáng kể trong học máy (ML) :

  • Độ chính xác dự đoán được cải thiện: Các tổ hợp thường đạt được độ chính xác cao hơn bất kỳ mô hình đóng góp đơn lẻ nào.
  • Tăng cường độ tin cậy và ổn định: Dự đoán cuối cùng ít bị ảnh hưởng bởi đặc thù của một mô hình đơn lẻ hoặc các biến thể trong dữ liệu đào tạo.
  • Giảm nguy cơ quá khớp: Bằng cách tính trung bình các dự đoán, các tập hợp có thể giảm thiểu xu hướng của các mô hình phức tạp làm khớp quá mức dữ liệu đào tạo.

Các loại phương pháp tổng hợp

Có một số kỹ thuật tổng hợp phổ biến, mỗi kỹ thuật có cách tiếp cận riêng biệt để kết hợp các mô hình:

  • Bagging (Bootstrap Aggregating) : Đào tạo nhiều trường hợp của cùng một thuật toán cơ sở trên các tập hợp con ngẫu nhiên khác nhau của dữ liệu đào tạo (được rút ra với sự thay thế) và tính trung bình các dự đoán của chúng. Random Forest là một ví dụ nổi tiếng.
  • Boosting : Xây dựng các mô hình theo trình tự, với mỗi mô hình mới tập trung vào việc sửa lỗi do các mô hình trước đó gây ra. Ví dụ bao gồm AdaBoost, Gradient Boosting Machines (GBM), XGBoostLightGBM .
  • Xếp chồng (Tổng quát hóa xếp chồng) : Kết hợp các dự đoán từ nhiều mô hình cơ sở khác nhau (người học không đồng nhất) bằng cách đào tạo một siêu mô hình (ví dụ: hồi quy logistic ) để tìm hiểu cách kết hợp tốt nhất các đầu ra của chúng.

Thuật ngữ 'Model Ensemble' thường được sử dụng thay thế cho 'Ensemble' và đề cập đến cùng một khái niệm về việc kết hợp nhiều mô hình. Bạn có thể khám phá các chiến lược cho Model Ensemble với YOLOv5 .

Ứng dụng thực tế của phương pháp tổng hợp

Các phương pháp tổng hợp được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau để nâng cao hiệu suất của hệ thống AI:

  1. Tầm nhìn máy tính: Trong các tác vụ như phát hiện đối tượng bằng các mô hình như Ultralytics YOLO , việc tổng hợp có thể liên quan đến việc kết hợp các dự đoán từ các mô hình được đào tạo với các phép tăng cường khác nhau hoặc ở các giai đoạn khác nhau ( điểm kiểm tra ). Điều này cải thiện độ mạnh mẽ của phát hiện trong các tình huống đầy thách thức như điều kiện thời tiết thay đổi hoặc vật thể bị che khuất, rất quan trọng đối với các ứng dụng như xe tự hànhhệ thống an ninh .
  2. Chẩn đoán y khoa: Các tập hợp được sử dụng trong phân tích hình ảnh y khoa để kết hợp các chẩn đoán từ các thuật toán hoặc mô hình khác nhau được đào tạo trên dữ liệu bệnh nhân đa dạng. Ví dụ, kết hợp đầu ra từ CNNVision Transformer (ViT) có thể cung cấp dự đoán đáng tin cậy hơn để phát hiện các bất thường trong quá trình quét, giảm nguy cơ chẩn đoán sai.

Mặc dù mạnh mẽ, các nhóm làm tăng tính phức tạp và yêu cầu tính toán cho việc đào tạo và triển khai mô hình . Tuy nhiên, những lợi ích đáng kể về hiệu suất thường biện minh cho những chi phí này trong các ứng dụng quan trọng. Các nền tảng như Ultralytics HUB có thể đơn giản hóa việc quản lý và đào tạo nhiều mô hình, tạo điều kiện thuận lợi cho việc tạo ra các nhóm hiệu quả.

Đọc tất cả