Thuật ngữ

Quá phù hợp

Tìm hiểu cách xác định, ngăn ngừa và giải quyết tình trạng quá khớp trong học máy. Khám phá các kỹ thuật để cải thiện khả năng khái quát hóa mô hình và hiệu suất thực tế.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Quá khớp trong học máy xảy ra khi một mô hình học dữ liệu đào tạo quá tốt, nắm bắt nhiễu và biến động ngẫu nhiên thay vì mô hình cơ bản. Điều này dẫn đến hiệu suất tuyệt vời trên tập dữ liệu đào tạo nhưng lại tổng quát hóa kém đối với dữ liệu mới, chưa biết. Về cơ bản, mô hình trở nên quá phức tạp và được điều chỉnh theo dữ liệu đào tạo, giống như ghi nhớ câu trả lời thay vì hiểu các khái niệm. Đây là một thách thức phổ biến trong đào tạo các mô hình AI, đặc biệt là với các thuật toán phức tạp như mạng nơ-ron được sử dụng trong Ultralytics YOLO cho các nhiệm vụ như phát hiện đối tượng và phân đoạn hình ảnh.

Hiểu về Overfitting

Quá khớp phát sinh vì các mô hình học máy hướng đến mục tiêu giảm thiểu lỗi trên dữ liệu đào tạo. Tuy nhiên, nếu một mô hình quá phức tạp, nó có thể phù hợp với cả nhiễu có trong tập đào tạo. Nhiễu này không biểu thị các mẫu thực và thay đổi trong các tập dữ liệu mới. Hãy nghĩ về nó như việc may một bộ đồ hoàn hảo theo số đo chính xác của một người vào một ngày cụ thể - nó có thể không vừa vặn nếu cân nặng của người đó dao động hoặc nếu người khác cố mặc nó. Trong học máy, "sự phù hợp hoàn hảo" này trên dữ liệu đào tạo dẫn đến sự thiếu linh hoạt và hiệu suất kém trên dữ liệu thực tế.

Ngược lại với overfitting là underfitting , khi mô hình quá đơn giản để nắm bắt được cấu trúc cơ bản của dữ liệu. Mô hình underfit hoạt động kém trên cả dữ liệu đào tạo và dữ liệu mới vì nó chưa học đủ. Mục tiêu là tìm ra sự cân bằng, thường được gọi là sự đánh đổi giữa độ lệch và phương sai , để tạo ra một mô hình có khả năng khái quát hóa tốt.

Ví dụ thực tế về Overfitting

  1. Phân tích hình ảnh y tế : Trong phân tích hình ảnh y tế để phát hiện bệnh, một mô hình quá phù hợp có thể trở nên cực kỳ tốt trong việc xác định bệnh trong tập hợp hình ảnh cụ thể mà nó được đào tạo, thậm chí có khả năng nhận ra các hiện tượng lạ hoặc nhiễu chỉ có trong tập dữ liệu đó. Tuy nhiên, khi được trình bày với các hình ảnh y tế mới từ các máy móc hoặc quần thể bệnh nhân khác nhau, mô hình có thể không khái quát hóa được, dẫn đến chẩn đoán không chính xác trong các bối cảnh lâm sàng thực tế. Ví dụ, một mô hình được đào tạo để phát hiện khối u bằng cách sử dụng quét MRI có thể quá phù hợp với các đặc điểm của một máy quét MRI cụ thể và hoạt động kém với các lần quét từ một máy quét khác, ngay cả khi bệnh lý cơ bản là giống nhau.

  2. Phân tích tình cảm : Hãy xem xét một mô hình phân tích tình cảm được đào tạo để phân loại đánh giá của khách hàng là tích cực hay tiêu cực. Nếu được điều chỉnh quá mức, mô hình có thể trở nên quá nhạy cảm với các từ hoặc cụm từ cụ thể phổ biến trong tập dữ liệu đánh giá đào tạo. Ví dụ, nếu dữ liệu đào tạo có nhiều đánh giá đề cập đến một tính năng sản phẩm cụ thể, mô hình có thể liên kết không chính xác sự hiện diện của tính năng đó với tình cảm tích cực, ngay cả khi ngữ cảnh trong các đánh giá mới khác nhau. Điều này có thể dẫn đến việc phân loại sai phản hồi của khách hàng mới sử dụng ngôn ngữ tương tự nhưng thể hiện ý kiến khác nhau.

Ngăn ngừa quá khớp

Một số kỹ thuật có thể giúp giảm thiểu tình trạng quá khớp:

  • Tăng dữ liệu đào tạo : Cung cấp dữ liệu đào tạo đa dạng và đại diện hơn có thể giúp mô hình học các mẫu mạnh mẽ hơn và giảm sự phụ thuộc vào nhiễu. Các kỹ thuật tăng cường dữ liệu, như các kỹ thuật được sử dụng trong tăng cường dữ liệu YOLO Ultralytics , có thể tăng kích thước và tính biến thiên của tập đào tạo một cách giả tạo.
  • Đơn giản hóa mô hình : Giảm độ phức tạp của mô hình, chẳng hạn như giảm số lớp hoặc tham số trong mạng nơ-ron, có thể ngăn mô hình ghi nhớ nhiễu. Các kỹ thuật như cắt tỉa mô hình có thể loại bỏ một cách có hệ thống các kết nối ít quan trọng hơn trong mạng đã được đào tạo để đơn giản hóa nó.
  • Chuẩn hóa : Các kỹ thuật chuẩn hóa thêm các ràng buộc vào quá trình học để phạt các mô hình quá phức tạp. Các phương pháp phổ biến bao gồm chuẩn hóa L1 và L2, bỏ qua và chuẩn hóa theo lô.
  • Kiểm chứng chéo : Sử dụng các kỹ thuật như kiểm chứng chéo K-Fold giúp đánh giá mức độ tổng quát hóa của mô hình đối với dữ liệu chưa biết bằng cách đào tạo và đánh giá mô hình đó trên nhiều tập dữ liệu con.
  • Dừng sớm : Theo dõi hiệu suất của mô hình trên một tập hợp xác thực trong quá trình đào tạo và dừng đào tạo sớm khi hiệu suất xác thực bắt đầu giảm có thể ngăn chặn tình trạng quá khớp. Điều này ngăn mô hình tiếp tục học nhiễu từ dữ liệu đào tạo.

Bằng cách hiểu và giải quyết tình trạng overfitting, các nhà phát triển có thể xây dựng các mô hình AI đáng tin cậy và hiệu quả hơn cho nhiều ứng dụng khác nhau, đảm bảo chúng hoạt động tốt trong các tình huống thực tế ngoài môi trường đào tạo. Các công cụ như Ultralytics HUB có thể hỗ trợ theo dõi thử nghiệm và đánh giá mô hình, hỗ trợ phát hiện và giảm thiểu tình trạng overfitting trong quá trình phát triển mô hình.

Đọc tất cả