Khám phá cách tinh chỉnh giúp điều chỉnh các mô hình đã được huấn luyện trước như thế nào, ví dụ như... Ultralytics YOLO26 hướng đến các tác vụ chuyên biệt. Tìm hiểu cách tận dụng học chuyển giao để tạo ra AI nhanh hơn, chính xác hơn.
Tinh chỉnh là một quá trình cơ bản trong học máy (ML) liên quan đến việc điều chỉnh một mô hình đã được huấn luyện trước đó cho một nhiệm vụ hoặc tập dữ liệu cụ thể. Thay vì huấn luyện từ đầu — điều này đòi hỏi lượng dữ liệu, thời gian và sức mạnh tính toán khổng lồ — các nhà phát triển bắt đầu với một "mô hình nền tảng" đã học được các đặc điểm chung từ một tập dữ liệu khổng lồ như ImageNet . Cách tiếp cận này là một triển khai thực tiễn của học chuyển giao , cho phép các hệ thống AI đạt được hiệu suất cao trên các bài toán chuyên biệt với tài nguyên ít hơn đáng kể.
Ý tưởng cốt lõi đằng sau việc tinh chỉnh là tận dụng "kiến thức" mà mô hình đã tích lũy được. Một mô hình cơ bản thường sở hữu sự hiểu biết vững chắc về các yếu tố hình ảnh cơ bản, chẳng hạn như cạnh, kết cấu và hình dạng. Trong quá trình tinh chỉnh, các tham số (trọng số) của mô hình được điều chỉnh nhẹ để phù hợp với những sắc thái của dữ liệu chuyên biệt mới.
Việc điều chỉnh này thường được thực hiện thông qua thuật toán gradient descent sử dụng tốc độ học thấp hơn. Tốc độ học thận trọng đảm bảo rằng các đặc trưng có giá trị được học trong quá trình huấn luyện ban đầu được tinh chỉnh thay vì bị phá hủy. Trong nhiều quy trình làm việc về thị giác máy tính (CV) , các kỹ sư có thể đóng băng các lớp ban đầu của mạng xương sống — điều này detect các tính năng phổ quát—và chỉ cập nhật các lớp sâu hơn và bộ phận phát hiện chịu trách nhiệm đưa ra dự đoán lớp cuối cùng.
Việc tinh chỉnh giúp thu hẹp khoảng cách giữa khả năng AI tổng quát và các yêu cầu cụ thể của từng ngành. Nó cho phép các mô hình tổng quát trở thành chuyên gia chuyên biệt.
Việc phân biệt giữa tinh chỉnh và huấn luyện toàn diện sẽ giúp hiểu rõ khi nào nên sử dụng từng phương pháp.
Các framework hiện đại giúp quá trình này trở nên dễ tiếp cận hơn. Ví dụ, nền tảng Ultralytics đơn giản hóa quy trình làm việc bằng cách tự động xử lý việc quản lý tập dữ liệu và huấn luyện trên đám mây. Tuy nhiên, các nhà phát triển cũng có thể tinh chỉnh mô hình cục bộ bằng cách sử dụng... Python .
Ví dụ sau đây minh họa cách tinh chỉnh một mô hình đã được huấn luyện trước đó.
YOLO26 mô hình trên tập dữ liệu tùy chỉnh. Lưu ý rằng chúng ta tải
yolo26n.pt (các trọng số được huấn luyện trước) thay vì một tệp cấu hình đơn giản, báo hiệu cho thư viện bắt đầu quá trình học chuyển giao.
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (n=nano size)
# This automatically loads weights trained on COCO
model = YOLO("yolo26n.pt")
# Fine-tune the model on a custom dataset (e.g., 'coco8.yaml')
# The 'epochs' argument determines how many passes over the data occur
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# The model is now fine-tuned and ready for specific inference tasks
Để đạt được kết quả tốt nhất, chất lượng của tập dữ liệu mới là yếu tố tối quan trọng. Sử dụng các công cụ tăng cường dữ liệu có thể mở rộng một tập dữ liệu nhỏ bằng cách xoay, lật hoặc điều chỉnh độ sáng của hình ảnh, ngăn ngừa hiện tượng quá khớp (overfitting). Ngoài ra, việc theo dõi các chỉ số như tổn thất xác thực (validation loss ) và độ chính xác trung bình ( mAP ) đảm bảo mô hình có khả năng khái quát hóa tốt đối với dữ liệu chưa được nhìn thấy.
Đối với những người quản lý quy trình làm việc phức tạp, việc sử dụng các chiến lược và công cụ MLOps như theo dõi thử nghiệm có thể giúp duy trì kiểm soát phiên bản trên các lần lặp được tinh chỉnh khác nhau. Cho dù là phát hiện đối tượng hay phân đoạn thực thể , việc tinh chỉnh vẫn là tiêu chuẩn ngành để triển khai các giải pháp AI hiệu quả.