Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Quá khớp (Overfitting)

Khám phá các nguyên nhân và triệu chứng của hiện tượng quá khớp trong học máy. Tìm hiểu cách ngăn ngừa sự biến thiên cao và cải thiện khả năng khái quát hóa bằng cách sử dụng Ultralytics YOLO26.

Hiện tượng quá khớp (overfitting) xảy ra trong học máy khi mô hình học dữ liệu huấn luyện quá tốt, nắm bắt nhiễu và các biến động ngẫu nhiên thay vì phân bố dữ liệu cơ bản. Thay vì học các mẫu tổng quát áp dụng cho dữ liệu mới, chưa từng thấy, một mô hình quá khớp sẽ ghi nhớ hiệu quả các ví dụ cụ thể trong tập dữ liệu huấn luyện. Điều này dẫn đến hiệu suất tuyệt vời trên dữ liệu huấn luyện nhưng khả năng khái quát hóa kém đối với các tình huống thực tế. Nó thường được mô tả là "độ biến thiên cao", có nghĩa là các dự đoán của mô hình thay đổi đáng kể tùy thuộc vào tập dữ liệu cụ thể được sử dụng để huấn luyện.

Tại sao hiện tượng quá khớp (overfitting) xảy ra?

Nguyên nhân chính của hiện tượng quá khớp (overfitting) là do mô hình quá phức tạp so với lượng dữ liệu có sẵn. Nếu mạng nơ-ron quá lớn—nghĩa là có quá nhiều lớp hoặc tham số—nó có thể dễ dàng ghi nhớ các ví dụ huấn luyện. Các yếu tố góp phần khác bao gồm:

  • Thiếu dữ liệu huấn luyện : Các tập dữ liệu nhỏ có thể chứa các mối tương quan giả tạo không tồn tại trong quần thể lớn hơn. Các mô hình được huấn luyện trên dữ liệu hạn chế dễ học được những mẫu ngẫu nhiên này.
  • Nhiễu dữ liệu và các giá trị ngoại lai : Mức độ nhiễu cao hoặc các giá trị ngoại lai không đại diện trong dữ liệu huấn luyện có thể đánh lừa mô hình, khiến nó điều chỉnh các tham số nội bộ để phù hợp với các bất thường thay vì tín hiệu thực sự.
  • Thời gian huấn luyện kéo dài : Huấn luyện quá nhiều epoch cho phép mô hình tiếp tục tinh chỉnh trọng số cho đến khi phù hợp với nhiễu trong tập dữ liệu huấn luyện. Điều này thường được theo dõi bằng cách sử dụng dữ liệu kiểm định .

Quá khớp so với Khớp thiếu

Điều quan trọng là phải phân biệt giữa hiện tượng quá khớp (overfitting) và thiếu khớp (underfitting). Trong khi quá khớp xảy ra khi mô hình học quá nhiều chi tiết (bao gồm cả nhiễu), thì thiếu khớp xảy ra khi mô hình quá đơn giản để nắm bắt được cấu trúc cơ bản của dữ liệu. Một mô hình thiếu khớp hoạt động kém hiệu quả trên cả dữ liệu huấn luyện và dữ liệu mới, thường dẫn đến độ lệch cao. Việc cân bằng hai thái cực này được gọi là sự đánh đổi giữa độ lệch và phương sai (bias-variance tradeoff ).

Ngăn ngừa hiện tượng quá khớp

Các kỹ sư sử dụng một số kỹ thuật để giảm thiểu hiện tượng quá khớp và cải thiện độ bền vững của mô hình:

  • Chuẩn hóa (Regularization) : Các kỹ thuật như chuẩn hóa L1/L2 hoặc thêm các lớp dropout sẽ đưa ra các hình phạt hoặc tính ngẫu nhiên trong quá trình huấn luyện, ngăn mô hình trở nên quá phụ thuộc vào các đặc trưng cụ thể.
  • Dừng sớm : Việc theo dõi hàm mất mát trên tập dữ liệu xác thực cho phép dừng quá trình huấn luyện khi hiệu suất trên dữ liệu chưa được thấy ngừng cải thiện, ngay cả khi độ chính xác huấn luyện tiếp tục tăng.
  • Tăng cường dữ liệu : Việc tăng kích thước và độ đa dạng của tập dữ liệu huấn luyện một cách nhân tạo bằng cách sử dụng tăng cường dữ liệu khiến mô hình khó ghi nhớ chính xác các hình ảnh.
  • Kiểm định chéo : Sử dụng các kỹ thuật như kiểm định chéo k-fold đảm bảo mô hình được kiểm thử trên các tập dữ liệu con khác nhau, cung cấp ước tính đáng tin cậy hơn về hiệu suất của nó.

Các ví dụ thực tế

Hiện tượng quá khớp (overfitting) có thể dẫn đến những hậu quả nghiêm trọng khi triển khai AI trong môi trường sản xuất:

  • Chẩn đoán y tế : Trong lĩnh vực trí tuệ nhân tạo ứng dụng trong chăm sóc sức khỏe , một mô hình được huấn luyện để... detect Mô hình ung thư da có thể bị ảnh hưởng quá mức bởi điều kiện ánh sáng hoặc các vạch kẻ trên ảnh huấn luyện. Khi được triển khai trong phòng khám với điều kiện ánh sáng hoặc thiết bị khác nhau, mô hình có thể không xác định chính xác các tổn thương ác tính vì nó dựa vào các tín hiệu nền không liên quan.
  • Dự báo tài chính : Một mô hình dự đoán giá cổ phiếu có thể bị "quá khớp" với các xu hướng thị trường trong quá khứ được thúc đẩy bởi một sự kiện cụ thể, không thể lặp lại (như một cuộc khủng hoảng kinh tế đơn lẻ). Một mô hình như vậy có khả năng sẽ không dự đoán chính xác các biến động giá cổ phiếu trong tương lai vì nó ghi nhớ các bất thường trong quá khứ thay vì học hỏi các động lực cơ bản của thị trường.

Ví dụ mã: Dừng sớm với YOLO26

Sử dụng nền tảng Ultralytics hoặc các tập lệnh huấn luyện cục bộ, bạn có thể ngăn ngừa hiện tượng quá khớp bằng cách thiết lập ngưỡng dừng sớm. Ngưỡng dừng này sẽ dừng quá trình huấn luyện nếu độ phù hợp trên tập dữ liệu kiểm chứng không được cải thiện trong một số lượng epoch nhất định.

from ultralytics import YOLO

# Load the YOLO26 model (latest generation)
model = YOLO("yolo26n.pt")

# Train with early stopping enabled (patience=50 epochs)
# If validation metrics don't improve for 50 epochs, training stops.
results = model.train(data="coco8.yaml", epochs=100, patience=50)

Các Khái Niệm Liên Quan

  • Khả năng khái quát hóa : Khả năng của mô hình thích ứng và hoạt động tốt trên dữ liệu mới, chưa từng thấy trước đây, trái ngược với hiện tượng quá khớp (overfitting).
  • Kiểm định chéo : Một kỹ thuật để đánh giá xem kết quả của một phân tích thống kê có thể khái quát hóa như thế nào đối với một tập dữ liệu độc lập.
  • Chuẩn hóa (Regularization) : Phương pháp được sử dụng để giảm thiểu sai số bằng cách điều chỉnh hàm sao cho phù hợp với tập dữ liệu huấn luyện đã cho và tránh hiện tượng quá khớp (overfitting).

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay