Thuật ngữ

Trọng lượng mô hình

Khám phá tầm quan trọng của trọng số mô hình trong học máy, vai trò của chúng trong dự đoán và cách Ultralytics YOLO đơn giản hóa việc sử dụng chúng cho các nhiệm vụ AI.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trọng số mô hình là các tham số cốt lõi mà mô hình học máy học được trong quá trình đào tạo của nó. Các giá trị số này biểu thị kiến thức thu được từ dữ liệu đào tạo và là nền tảng cho cách mô hình đưa ra dự đoán hoặc quyết định về dữ liệu mới, chưa từng thấy. Về cơ bản, trọng số xác định cường độ và tầm quan trọng của các kết nối trong mô hình, chẳng hạn như giữa các nơ-ron trong mạng nơ-ron (NN) .

Hiểu trọng số mô hình

Hãy tưởng tượng một cỗ máy phức tạp với nhiều núm điều chỉnh; trọng số mô hình hoạt động giống như những núm này. Trong quá trình đào tạo, mô hình được hiển thị các ví dụ từ một tập dữ liệu và đưa ra dự đoán. Sự khác biệt giữa các dự đoán này và các câu trả lời đúng thực tế (sự thật cơ bản) được đo bằng hàm mất mát . Một thuật toán tối ưu hóa , chẳng hạn như Stochastic Gradient Descent (SGD) hoặc Adam , sau đó điều chỉnh một cách có hệ thống các trọng số này để giảm thiểu sự mất mát này. Quá trình này được lặp lại qua nhiều lần lặp hoặc kỷ nguyên , dần dần tinh chỉnh các trọng số. Ban đầu, các trọng số thường được đặt thành các giá trị ngẫu nhiên nhỏ, nhưng thông qua quá trình đào tạo, chúng hội tụ thành các giá trị nắm bắt các mẫu cơ bản trong dữ liệu. Điều quan trọng là phải phân biệt các trọng số với các siêu tham số , như tốc độ học hoặc kích thước lô , được đặt trước khi đào tạo và hướng dẫn chính quá trình học, thay vì được học trong quá trình đào tạo. Độ lệch, một loại tham số đã học khác thường được tìm thấy cùng với các trọng số trong NN, biểu thị kích hoạt cơ sở của một nơ-ron.

Tầm quan trọng của trọng số mô hình

Trọng số mô hình rất quan trọng vì chúng mã hóa các mẫu và mối quan hệ đã học được từ dữ liệu đào tạo. Trọng số được tối ưu hóa tốt cho phép mô hình tổng quát hóa hiệu quả, đưa ra dự đoán chính xác về dữ liệu mà nó chưa từng gặp trước đây. Chất lượng của trọng số ảnh hưởng trực tiếp đến số liệu hiệu suất của mô hình, chẳng hạn như độ chính xác và độ mạnh mẽ. Trọng số được đào tạo kém, thường là do các vấn đề như dữ liệu không đủ hoặc quá khớp , dẫn đến dự đoán không đáng tin cậy.

Trong nhiều ứng dụng AI hiện đại, đặc biệt là trong thị giác máy tính (CV) , các mô hình thường được đào tạo trước trên các tập dữ liệu chung, lớn như ImageNet hoặc COCO . Các trọng số kết quả nắm bắt các tính năng trực quan rộng. Các trọng số được đào tạo trước này, chẳng hạn như các trọng số có sẵn cho các mô hình Ultralytics YOLO , sau đó có thể được sử dụng trực tiếp để suy luận hoặc làm điểm khởi đầu để tinh chỉnh trên một tác vụ cụ thể hoặc tập dữ liệu tùy chỉnh. Kỹ thuật này, được gọi là học chuyển giao , tăng tốc đáng kể quá trình đào tạo và thường dẫn đến hiệu suất tốt hơn, đặc biệt là với dữ liệu tùy chỉnh hạn chế. Bạn có thể quản lý và đào tạo các mô hình với các trọng số cụ thể bằng cách sử dụng các nền tảng như Ultralytics HUB .

Ứng dụng trong thế giới thực

Trọng số mô hình là động cơ đằng sau vô số ứng dụng AI:

  1. Phát hiện đối tượng trong xe tự hành : Các mô hình như Ultralytics YOLOv8 sử dụng trọng số đã học của chúng để xác định và định vị các đối tượng như ô tô, người đi bộ và biển báo giao thông trong nguồn cấp dữ liệu video thời gian thực, cho phép điều hướng an toàn hơn. Các trọng số xác định cách mô hình diễn giải các mẫu pixel để nhận dạng các đối tượng cụ thể này.
  2. Phân tích hình ảnh y tế để phát hiện bệnh : Trong chăm sóc sức khỏe, các mô hình AI được đào tạo trên hình ảnh y tế (như X-quang hoặc MRI) sử dụng trọng số của chúng để phát hiện các bất thường nhỏ chỉ ra bệnh, chẳng hạn như xác định khối u tiềm ẩn trong ảnh chụp não bằng các tập dữ liệu như tập dữ liệu Brain Tumor . Các trọng số mã hóa các đặc điểm trực quan học được từ hàng nghìn hình ảnh y tế có chú thích. Các công cụ như Weights & Biases có thể giúp theo dõi các thí nghiệm tạo ra các trọng số này.
Đọc tất cả