Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Tinh chỉnh (Fine-tuning)

Khám phá cách tinh chỉnh giúp điều chỉnh các mô hình đã được huấn luyện trước như thế nào, ví dụ như... Ultralytics YOLO26 hướng đến các tác vụ chuyên biệt. Tìm hiểu cách tận dụng học chuyển giao để tạo ra AI nhanh hơn, chính xác hơn.

Tinh chỉnh là một quá trình cơ bản trong học máy (ML) liên quan đến việc điều chỉnh một mô hình đã được huấn luyện trước đó cho một nhiệm vụ hoặc tập dữ liệu cụ thể. Thay vì huấn luyện từ đầu — điều này đòi hỏi lượng dữ liệu, thời gian và sức mạnh tính toán khổng lồ — các nhà phát triển bắt đầu với một "mô hình nền tảng" đã học được các đặc điểm chung từ một tập dữ liệu khổng lồ như ImageNet . Cách tiếp cận này là một triển khai thực tiễn của học chuyển giao , cho phép các hệ thống AI đạt được hiệu suất cao trên các bài toán chuyên biệt với tài nguyên ít hơn đáng kể.

Cơ chế thích nghi

Ý tưởng cốt lõi đằng sau việc tinh chỉnh là tận dụng "kiến thức" mà mô hình đã tích lũy được. Một mô hình cơ bản thường sở hữu sự hiểu biết vững chắc về các yếu tố hình ảnh cơ bản, chẳng hạn như cạnh, kết cấu và hình dạng. Trong quá trình tinh chỉnh, các tham số (trọng số) của mô hình được điều chỉnh nhẹ để phù hợp với những sắc thái của dữ liệu chuyên biệt mới.

Việc điều chỉnh này thường được thực hiện thông qua thuật toán gradient descent sử dụng tốc độ học thấp hơn. Tốc độ học thận trọng đảm bảo rằng các đặc trưng có giá trị được học trong quá trình huấn luyện ban đầu được tinh chỉnh thay vì bị phá hủy. Trong nhiều quy trình làm việc về thị giác máy tính (CV) , các kỹ sư có thể đóng băng các lớp ban đầu của mạng xương sống — điều này detect các tính năng phổ quát—và chỉ cập nhật các lớp sâu hơn và bộ phận phát hiện chịu trách nhiệm đưa ra dự đoán lớp cuối cùng.

Các Ứng dụng Thực tế

Việc tinh chỉnh giúp thu hẹp khoảng cách giữa khả năng AI tổng quát và các yêu cầu cụ thể của từng ngành. Nó cho phép các mô hình tổng quát trở thành chuyên gia chuyên biệt.

  • Trí tuệ nhân tạo trong chăm sóc sức khỏe : Một mô hình thị giác tiêu chuẩn có thể phân biệt giữa mèo và chó nhưng thiếu ngữ cảnh y tế. Bằng cách tinh chỉnh mô hình này trên các tập dữ liệu phân tích hình ảnh y tế chứa ảnh chụp X-quang được chú thích, các nhà nghiên cứu có thể tạo ra các công cụ chẩn đoán giúp phân biệt được các thành phần cần thiết. detect Chẩn đoán chính xác cao các trường hợp viêm phổi hoặc gãy xương. Điều này hỗ trợ các bác sĩ X quang trong môi trường làm việc nhanh chóng bằng cách ưu tiên các trường hợp nguy kịch.
  • Ứng dụng Trí tuệ Nhân tạo trong Sản xuất : Trong môi trường công nghiệp, các mô hình có sẵn trên thị trường có thể không nhận diện được các linh kiện độc quyền. Các nhà sản xuất sử dụng phương pháp tinh chỉnh để điều chỉnh các kiến ​​trúc tiên tiến như YOLO26 cho phù hợp với dây chuyền lắp ráp cụ thể của họ. Điều này cho phép các hệ thống kiểm soát chất lượng tự động phát hiện các khuyết tật nhỏ, chẳng hạn như vết nứt siêu nhỏ hoặc lỗi sơn, cải thiện độ tin cậy của sản phẩm và giảm thiểu lãng phí.

Tinh chỉnh so với đào tạo từ đầu

Việc phân biệt giữa tinh chỉnh và huấn luyện toàn diện sẽ giúp hiểu rõ khi nào nên sử dụng từng phương pháp.

  • Huấn luyện từ đầu: Quá trình này bao gồm việc khởi tạo mô hình với các trọng số ngẫu nhiên và huấn luyện nó trên một tập dữ liệu cho đến khi hội tụ. Nó đòi hỏi một tập dữ liệu được gán nhãn rất lớn và nguồn lực đáng kể. GPU nguồn lực. Điều này thường được dành riêng cho việc tạo ra các kiến ​​trúc mới hoặc khi lĩnh vực này hoàn toàn độc đáo (ví dụ: phân tích các tinh vân trong không gian sâu thẳm so với các vật thể hàng ngày).
  • Tinh chỉnh: Bước này bắt đầu bằng việc tối ưu hóa trọng số. Nó yêu cầu ít dữ liệu hơn nhiều (thường chỉ vài nghìn hình ảnh) và huấn luyện nhanh hơn đáng kể. Đối với hầu hết các ứng dụng kinh doanh, chẳng hạn như quản lý hàng tồn kho bán lẻ hoặc giám sát an ninh , tinh chỉnh là con đường hiệu quả nhất để triển khai.

Thực hiện tinh chỉnh với Ultralytics

Các framework hiện đại giúp quá trình này trở nên dễ tiếp cận hơn. Ví dụ, nền tảng Ultralytics đơn giản hóa quy trình làm việc bằng cách tự động xử lý việc quản lý tập dữ liệu và huấn luyện trên đám mây. Tuy nhiên, các nhà phát triển cũng có thể tinh chỉnh mô hình cục bộ bằng cách sử dụng... Python .

Ví dụ sau đây minh họa cách tinh chỉnh một mô hình đã được huấn luyện trước đó. YOLO26 mô hình trên tập dữ liệu tùy chỉnh. Lưu ý rằng chúng ta tải yolo26n.pt (các trọng số được huấn luyện trước) thay vì một tệp cấu hình đơn giản, báo hiệu cho thư viện bắt đầu quá trình học chuyển giao.

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (n=nano size)
# This automatically loads weights trained on COCO
model = YOLO("yolo26n.pt")

# Fine-tune the model on a custom dataset (e.g., 'coco8.yaml')
# The 'epochs' argument determines how many passes over the data occur
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# The model is now fine-tuned and ready for specific inference tasks

Những yếu tố quan trọng cần xem xét để thành công

Để đạt được kết quả tốt nhất, chất lượng của tập dữ liệu mới là yếu tố tối quan trọng. Sử dụng các công cụ tăng cường dữ liệu có thể mở rộng một tập dữ liệu nhỏ bằng cách xoay, lật hoặc điều chỉnh độ sáng của hình ảnh, ngăn ngừa hiện tượng quá khớp (overfitting). Ngoài ra, việc theo dõi các chỉ số như tổn thất xác thực (validation loss ) và độ chính xác trung bình ( mAP ) đảm bảo mô hình có khả năng khái quát hóa tốt đối với dữ liệu chưa được nhìn thấy.

Đối với những người quản lý quy trình làm việc phức tạp, việc sử dụng các chiến lược và công cụ MLOps như theo dõi thử nghiệm có thể giúp duy trì kiểm soát phiên bản trên các lần lặp được tinh chỉnh khác nhau. Cho dù là phát hiện đối tượng hay phân đoạn thực thể , việc tinh chỉnh vẫn là tiêu chuẩn ngành để triển khai các giải pháp AI hiệu quả.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay