Tìm hiểu cách làm mịn nhãn giúp ngăn ngừa hiện tượng quá khớp và cải thiện khả năng khái quát hóa của mô hình. Khám phá cách triển khai kỹ thuật này với... Ultralytics Sử dụng YOLO26 để có kết quả tốt hơn.
Làm mịn nhãn là một kỹ thuật điều chỉnh được sử dụng rộng rãi trong học máy để cải thiện khả năng khái quát hóa của mô hình và ngăn ngừa hiện tượng quá khớp. Khi huấn luyện mạng nơ-ron , mục tiêu thường là giảm thiểu sai số giữa dự đoán và dữ liệu thực tế. Tuy nhiên, nếu một mô hình trở nên quá tự tin vào dự đoán của mình—gán xác suất gần 100% cho một lớp duy nhất—nó thường bắt đầu ghi nhớ nhiễu cụ thể trong dữ liệu huấn luyện thay vì học các mẫu mạnh mẽ. Hiện tượng này, được gọi là quá khớp , làm giảm hiệu suất trên các ví dụ mới, chưa được nhìn thấy. Làm mịn nhãn giải quyết vấn đề này bằng cách không khuyến khích mô hình dự đoán với độ chắc chắn tuyệt đối, về cơ bản là nói với mạng rằng luôn có một biên độ sai số nhỏ.
Để hiểu cách thức hoạt động của việc làm mịn nhãn, ta nên so sánh nó với các mục tiêu "cứng" tiêu chuẩn. Trong phương pháp truyền thống, học tập có giám sátCác nhãn phân loại thường được biểu diễn thông qua mã hóa one-hotVí dụ, trong một nhiệm vụ phân biệt giữa mèo và chó, hình ảnh "chó" sẽ có vectơ mục tiêu là...
[0, 1]Để khớp hoàn hảo với điều này, mô hình sẽ đẩy mạnh các điểm số nội bộ của nó, được gọi là...
nhật kýhướng tới vô cực, điều này có thể dẫn đến độ dốc không ổn định và không có khả năng thích ứng.
Làm mịn nhãn thay thế các giá trị 1 và 0 cứng nhắc này bằng các mục tiêu "mềm". Thay vì xác suất mục tiêu là
1.0Lớp học chính xác có thể được chỉ định. 0.9trong khi khối lượng xác suất còn lại (0.1) được phân bổ đồng đều trên các lớp không chính xác. Sự thay đổi nhỏ này làm thay đổi mục tiêu của hàm mất mát, chẳng hạn như
entropy chéo, ngăn chặn
chức năng kích hoạt (thường xuyên
Softmax) từ việc bão hòa. Kết quả là một mô hình học được các cụm lớp chặt chẽ hơn trong không gian đặc trưng và tạo ra kết quả tốt hơn.
hiệu chỉnh mô hìnhĐiều này có nghĩa là xác suất dự đoán phản ánh chính xác hơn khả năng đúng thực sự.
Kỹ thuật này đặc biệt quan trọng trong các lĩnh vực mà dữ liệu vốn dĩ không rõ ràng hoặc các tập dữ liệu dễ bị lỗi khi gắn nhãn.
Các framework học sâu hiện đại đơn giản hóa việc ứng dụng kỹ thuật này. Sử dụng
ultralytics Với gói phần mềm này, bạn có thể dễ dàng tích hợp làm mịn nhãn vào quy trình huấn luyện của mình.
phân loại hình ảnh hoặc các tác vụ phát hiện. Điều này thường được thực hiện để tối ưu hóa hiệu năng của các mô hình tiên tiến như...
YOLO26.
Ví dụ sau đây minh họa cách huấn luyện mô hình phân loại với tính năng làm mịn nhãn được bật:
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Train with label_smoothing set to 0.1
# The target for the correct class becomes 1.0 - 0.5 * 0.1 = 0.95 (depending on implementation specifics)
model.train(data="mnist", epochs=5, label_smoothing=0.1)
Việc phân biệt giữa làm mịn nhãn và các chiến lược điều chỉnh khác rất hữu ích để hiểu khi nào nên sử dụng nó.
Bằng cách giảm thiểu vấn đề suy giảm độ dốc ở các lớp cuối cùng và khuyến khích mô hình học được các đặc trưng mạnh mẽ hơn, làm mịn nhãn vẫn là một yếu tố thiết yếu trong các kiến trúc học sâu hiện đại.