Thuật ngữ

Điều chỉnh siêu tham số

Điều chỉnh siêu tham số chính để tối ưu hóa các mô hình ML như Ultralytics YOLO . Tăng cường độ chính xác, tốc độ và hiệu suất bằng các kỹ thuật chuyên môn.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Điều chỉnh siêu tham số, còn được gọi là tối ưu hóa siêu tham số, là một quy trình cơ bản trong học máy (ML) nhằm tìm ra sự kết hợp tốt nhất của các siêu tham số để tối đa hóa hiệu suất của mô hình. Siêu tham số là các thiết lập cấu hình được thiết lập trước khi quá trình đào tạo bắt đầu, không giống như các tham số mô hình (như weights and biases trong mạng nơ-ron) được học trong quá trình đào tạo. Việc điều chỉnh các thiết lập bên ngoài này rất quan trọng vì chúng kiểm soát chính quá trình học, ảnh hưởng đến hiệu quả của mô hình học từ dữ liệu và khái quát hóa thành các ví dụ mới, chưa từng thấy.

Hiểu về siêu tham số

Siêu tham số xác định các thuộc tính cấp cao hơn của mô hình, chẳng hạn như độ phức tạp của mô hình hoặc tốc độ học của mô hình. Các ví dụ phổ biến bao gồm tốc độ học được sử dụng trong các thuật toán tối ưu hóa, kích thước lô xác định số lượng mẫu được xử lý trước khi cập nhật các tham số mô hình, số lớp trong mạng nơ-ron hoặc cường độ của các kỹ thuật chính quy hóa . Việc lựa chọn siêu tham số ảnh hưởng đáng kể đến kết quả của mô hình. Lựa chọn kém có thể dẫn đến thiếu phù hợp , khi mô hình quá đơn giản để nắm bắt các mẫu dữ liệu hoặc quá phù hợp , khi mô hình học dữ liệu đào tạo quá tốt, bao gồm cả nhiễu và không thể khái quát hóa.

Tại sao điều chỉnh siêu tham số lại quan trọng

Việc điều chỉnh siêu tham số hiệu quả là điều cần thiết để xây dựng các mô hình ML hiệu suất cao. Một mô hình được điều chỉnh tốt sẽ đạt được độ chính xác cao hơn, hội tụ nhanh hơn trong quá trình đào tạo và cải thiện khả năng khái quát hóa trên dữ liệu thử nghiệm. Đối với các tác vụ phức tạp như phát hiện đối tượng bằng các mô hình như Ultralytics YOLO , việc tìm ra các siêu tham số tối ưu có thể cải thiện đáng kể các số liệu hiệu suất như Độ chính xác trung bình (mAP) và tốc độ suy luận, vốn rất quan trọng đối với các ứng dụng đòi hỏi suy luận theo thời gian thực . Mục tiêu là điều hướng các sự đánh đổi, như sự đánh đổi độ lệch-phương sai , để tìm ra điểm phù hợp cho một vấn đề và tập dữ liệu nhất định.

Kỹ thuật điều chỉnh siêu tham số

Có một số chiến lược để tìm kiếm các giá trị siêu tham số tốt nhất:

  • Grid Search: Thử nghiệm triệt để tất cả các kết hợp có thể có của các giá trị siêu tham số được chỉ định. Mặc dù kỹ lưỡng, nhưng có thể tốn kém về mặt tính toán, đặc biệt là với nhiều siêu tham số. Tìm hiểu thêm về Grid Search .
  • Tìm kiếm ngẫu nhiên: Lấy mẫu các tổ hợp siêu tham số ngẫu nhiên từ các phân phối được chỉ định. Thường hiệu quả hơn Tìm kiếm lưới, vì các tham số tốt không phải lúc nào cũng được tìm thấy trên một lưới thống nhất. Khám phá chi tiết Tìm kiếm ngẫu nhiên .
  • Tối ưu hóa Bayesian: Sử dụng các mô hình xác suất để dự đoán siêu tham số nào có thể mang lại kết quả tốt hơn, tập trung tìm kiếm vào các khu vực có triển vọng. Điều này thường hiệu quả hơn tìm kiếm ngẫu nhiên hoặc tìm kiếm lưới. Các khuôn khổ như Optuna cung cấp các triển khai.
  • Thuật toán tiến hóa: Sử dụng các khái niệm lấy cảm hứng từ quá trình tiến hóa sinh học, như đột biến và chọn lọc, để tinh chỉnh các siêu tham số theo từng bước. Ultralytics YOLOv5 bao gồm hướng dẫn về Hyperparameter Evolution .

Các công cụ như Weights & Biases SweepsKerasTuner giúp tự động hóa và quản lý các quy trình điều chỉnh này.

Điều chỉnh siêu tham số so với các khái niệm liên quan

Điều quan trọng là phải phân biệt điều chỉnh siêu tham số với các khái niệm ML liên quan:

  • Tham số mô hình so với siêu tham số: Tham số mô hình (ví dụ: trọng số trong CNN) được học từ dữ liệu trong quá trình đào tạo. Siêu tham số (ví dụ: tốc độ học, số lượng bộ lọc) được thiết lập trước khi đào tạo để cấu hình quá trình học.
  • Thuật toán tối ưu hóa so với điều chỉnh siêu tham số: Thuật toán tối ưu hóa (như Adam hoặc SGD ) điều chỉnh các tham số mô hình để giảm thiểu hàm mất mát . Điều chỉnh siêu tham số tìm ra các thiết lập tối ưu cho các thuật toán này và các khía cạnh khác của quá trình đào tạo, bao gồm lựa chọn trình tối ưu hóa hoặc tốc độ học cụ thể của nó.
  • Điều chỉnh chuẩn hóa so với điều chỉnh siêu tham số: Các kỹ thuật điều chỉnh (ví dụ: lớp Dropout , hình phạt L1/L2) giúp ngăn ngừa tình trạng quá khớp. Sức mạnh hoặc tốc độ của các kỹ thuật này chính là các siêu tham số cần điều chỉnh.

Ứng dụng trong thế giới thực

Điều chỉnh siêu tham số được áp dụng trên nhiều miền khác nhau:

  1. Phân tích hình ảnh y tế: Khi đào tạo một Ultralytics YOLO mô hình phát hiện khối u , điều chỉnh các siêu tham số như tốc độ học, cài đặt tăng cường dữ liệu (ví dụ: phạm vi xoay, điều chỉnh độ sáng) và lựa chọn kiến trúc mô hình (như độ sâu xương sống) là rất quan trọng để tối đa hóa độ nhạy và độ đặc hiệu của việc xác định khối u trong các lần quét như MRI hoặc CT. Điều này đảm bảo mô hình phát hiện các bất thường một cách đáng tin cậy đồng thời giảm thiểu các kết quả dương tính giả. ( Khám phá các giải pháp AI trong chăm sóc sức khỏe ).
  2. Lái xe tự động: Trong quá trình phát triển hệ thống nhận thức cho xe tự hành , việc điều chỉnh siêu tham số sẽ tối ưu hóa các mô hình phát hiện đối tượng để xác định chính xác người đi bộ, xe cộ và biển báo giao thông trong nhiều điều kiện khác nhau (ngày, đêm, mưa). Việc điều chỉnh các tham số như ngưỡng tin cậy phát hiện, cài đặt Không triệt tiêu tối đa (NMS) và độ phân giải hình ảnh đầu vào giúp cân bằng tốc độ phát hiện và độ chính xác, rất quan trọng đối với các ứng dụng quan trọng đối với sự an toàn. ( Xem AI trong các giải pháp ô tô ).

Điều chỉnh siêu tham số với Ultralytics

Ultralytics cung cấp các công cụ để đơn giản hóa việc điều chỉnh siêu tham số cho YOLO các mô hình. Các Ultralytics Tuner lớp học, được ghi chép trong Hướng dẫn điều chỉnh siêu tham số, tự động hóa quy trình bằng các thuật toán tiến hóa. Tích hợp với các nền tảng như Ray Điều Chỉnh cung cấp thêm các khả năng cho các chiến lược tìm kiếm phân tán và nâng cao, giúp người dùng tối ưu hóa các mô hình của họ một cách hiệu quả cho các tập dữ liệu và tác vụ cụ thể bằng cách sử dụng các tài nguyên như Ultralytics HUB.

Đọc tất cả