Khám phá underfitting là gì, nguyên nhân, dấu hiệu và giải pháp. Tìm hiểu cách cải thiện hiệu suất mô hình và tránh các vấn đề underfitting.
Underfitting xảy ra khi một mô hình học máy quá đơn giản để nắm bắt cấu trúc cơ bản của dữ liệu. Điều này thường xảy ra khi mô hình có quá ít tham số hoặc tính năng so với độ phức tạp của dữ liệu mà nó đang cố gắng học. Kết quả là, mô hình không học được đầy đủ từ dữ liệu đào tạo và hoạt động kém không chỉ trên tập đào tạo mà còn trên dữ liệu chưa biết, chẳng hạn như tập xác thực hoặc tập kiểm tra .
Các mô hình Underfit thường được đặc trưng bởi độ lệch cao và phương sai thấp. Độ lệch đề cập đến lỗi được đưa vào khi xấp xỉ một vấn đề thực tế, có thể phức tạp, bằng một mô hình đơn giản hóa. Một mô hình Underfit đưa ra các giả định quá đơn giản về dữ liệu, dẫn đến các lỗi hệ thống. Mặt khác, phương sai đề cập đến độ nhạy của mô hình đối với các biến động trong dữ liệu đào tạo. Các mô hình Underfit thể hiện phương sai thấp vì chúng quá đơn giản để bị ảnh hưởng nhiều bởi các thay đổi trong dữ liệu đào tạo. Tuy nhiên, sự đơn giản này cũng có nghĩa là chúng không thể nắm bắt được các mẫu và sắc thái quan trọng trong dữ liệu.
Một số yếu tố có thể góp phần gây ra tình trạng không vừa vặn:
Việc xác định sự thiếu phù hợp là điều cần thiết để cải thiện hiệu suất của mô hình. Các dấu hiệu thiếu phù hợp bao gồm:
Để chống lại tình trạng thiếu hụt, hãy cân nhắc các chiến lược sau:
Điều quan trọng là phải phân biệt underfitting với overfitting . Trong khi underfitting xảy ra khi một mô hình quá đơn giản, thì overfitting xảy ra khi một mô hình quá phức tạp và bắt đầu ghi nhớ dữ liệu đào tạo, bao gồm nhiễu và giá trị ngoại lai. Các mô hình overfit hoạt động cực kỳ tốt trên dữ liệu đào tạo nhưng kém trên dữ liệu không nhìn thấy. Việc cân bằng độ phức tạp của mô hình và đào tạo là rất quan trọng để tránh cả underfitting và overfitting.
Hãy tưởng tượng bạn đang xây dựng một mô hình để dự đoán giá nhà dựa trên kích thước của chúng. Nếu bạn sử dụng một mô hình hồi quy tuyến tính đơn giản và giả định rằng giá nhà tăng tuyến tính theo kích thước, bạn có thể không phù hợp với dữ liệu. Trên thực tế, mối quan hệ giữa kích thước nhà và giá có thể phức tạp hơn, liên quan đến các yếu tố như lợi nhuận giảm dần đối với kích thước lớn hơn hoặc giá cao cấp cho một số phạm vi kích thước nhất định. Một mô hình tuyến tính sẽ không nắm bắt được những sắc thái này, dẫn đến hiệu suất dự đoán kém trên cả dữ liệu đào tạo và dữ liệu mới.
Hãy xem xét một nhiệm vụ phân loại hình ảnh trong đó bạn đang cố gắng phân loại hình ảnh động vật thành các loại khác nhau. Nếu bạn sử dụng một mô hình rất đơn giản, chẳng hạn như hồi quy logistic, bạn có thể không phù hợp với dữ liệu. Phân loại hình ảnh thường đòi hỏi phải nắm bắt các mẫu và đặc điểm phức tạp trong hình ảnh, điều mà một mô hình đơn giản không thể làm được. Do đó, mô hình sẽ hoạt động kém trên cả tập huấn luyện và hình ảnh mới, chưa từng thấy. Sử dụng một mô hình phức tạp hơn, như mạng nơ-ron tích chập (CNN) , có thể cải thiện đáng kể hiệu suất.
Bằng cách hiểu được nguyên nhân và dấu hiệu của việc không phù hợp, các học viên có thể thực hiện các bước thích hợp để cải thiện mô hình của họ. Các công cụ như Ultralytics YOLOv8 cung cấp các khả năng nâng cao để xây dựng và điều chỉnh các mô hình phức tạp , giúp tránh tình trạng thiếu phù hợp và cải thiện hiệu suất trên nhiều tác vụ thị giác máy tính khác nhau. Để biết thêm thông tin chi tiết về đào tạo và tối ưu hóa mô hình, hãy truy cập Blog Ultralytics .