Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Trọng số Mô hình

Tìm hiểu cách trọng số mô hình hoạt động như tri thức của trí tuệ nhân tạo. Khám phá cách thức... Ultralytics YOLO26 sử dụng các trọng số được tối ưu hóa để huấn luyện và suy luận nhanh hơn, chính xác hơn.

Trọng số mô hình là các tham số có thể học được trong một mô hình máy học, có chức năng chuyển đổi dữ liệu đầu vào thành đầu ra dự đoán. Trong mạng nơ-ron, các trọng số này thể hiện sức mạnh của các kết nối giữa các nơ-ron trên các lớp khác nhau. Khi một mô hình được khởi tạo, các trọng số này thường được đặt thành các giá trị nhỏ, ngẫu nhiên, có nghĩa là mô hình "không biết" gì cả. Thông qua một quá trình gọi là huấn luyện, mô hình điều chỉnh các trọng số này một cách lặp đi lặp lại dựa trên các lỗi mà nó mắc phải, dần dần học cách nhận ra các mẫu, đặc điểm và mối quan hệ trong dữ liệu. Bạn có thể coi trọng số mô hình như "bộ nhớ" hoặc "kiến thức" của AI; chúng lưu trữ những gì hệ thống đã học được từ dữ liệu huấn luyện của nó.

Vai trò của trọng số trong học tập

Mục tiêu chính của việc huấn luyện mạng nơ-ron là tìm ra tập hợp trọng số tối ưu của mô hình nhằm giảm thiểu sai số giữa dự đoán của mô hình và dữ liệu thực tế. Quá trình này bao gồm việc truyền dữ liệu qua mạng – bước được gọi là truyền tiến – và sau đó tính toán giá trị tổn thất bằng cách sử dụng một hàm tổn thất cụ thể. Nếu dự đoán không chính xác, một thuật toán tối ưu hóa như Stochastic Gradient Descent ( SGD ) hoặc thuật toán tối ưu hóa Muon mới hơn được sử dụng trong YOLO26 sẽ tính toán mức độ đóng góp của mỗi trọng số vào sai số.

Thông qua kỹ thuật lan truyền ngược (backpropagation) , thuật toán cập nhật nhẹ các trọng số để giảm lỗi cho lần tiếp theo. Chu kỳ này lặp lại hàng nghìn hoặc hàng triệu lần cho đến khi trọng số của mô hình ổn định và hệ thống đạt được độ chính xác cao. Sau khi quá trình huấn luyện hoàn tất, các trọng số được "đóng băng" và lưu lại, cho phép mô hình được triển khai để suy luận trên dữ liệu mới, chưa từng thấy.

Trọng số mô hình so với độ lệch

Điều quan trọng là phải phân biệt giữa weights and biases Chúng hoạt động cùng nhau nhưng phục vụ các mục đích khác nhau. Trong khi trọng số mô hình xác định độ mạnh và hướng của kết nối giữa các nơron (kiểm soát độ dốc của hàm kích hoạt), thì độ lệch cho phép hàm kích hoạt được dịch chuyển sang trái hoặc phải. Sự dịch chuyển này đảm bảo rằng mô hình có thể phù hợp với dữ liệu tốt hơn, ngay cả khi tất cả các đặc trưng đầu vào đều bằng không. Cùng nhau, trọng số và độ lệch tạo thành các tham số có thể học được, xác định hành vi của các kiến ​​trúc như Mạng nơron tích chập (CNN) .

Các Ứng dụng Thực tế

Trọng số mô hình là thành phần cốt lõi cho phép các hệ thống AI hoạt động trong nhiều ngành công nghiệp khác nhau. Dưới đây là hai ví dụ cụ thể về cách chúng được áp dụng:

  • Thị giác máy tính trong ngành bán lẻ: Trong hệ thống siêu thị thông minh , một mô hình như YOLO26 sử dụng các trọng số đã được huấn luyện để nhận diện sản phẩm trên kệ. Các trọng số này có các đặc điểm hình ảnh "đã học" được—chẳng hạn như hình dạng của hộp ngũ cốc hoặc màu sắc của lon nước ngọt—cho phép hệ thống nhận diện sản phẩm. detect quản lý hàng tồn kho, và thậm chí hỗ trợ quy trình thanh toán tự động một cách hiệu quả.
  • Phân tích hình ảnh y tế: Trong lĩnh vực chăm sóc sức khỏe, các mô hình học sâu sử dụng các trọng số chuyên biệt để phân tích ảnh chụp X-quang hoặc MRI. Ví dụ, một mô hình được huấn luyện để phát hiện khối u sử dụng các trọng số của nó để phân biệt giữa mô khỏe mạnh và các bất thường tiềm ẩn. Các trọng số này nắm bắt các mẫu phức tạp, phi tuyến tính trong dữ liệu pixel mà mắt người có thể khó nhận ra, giúp các bác sĩ X-quang đưa ra chẩn đoán nhanh hơn.

Lưu và tải trọng lượng

Trên thực tế, việc làm việc với trọng số mô hình bao gồm việc lưu các tham số đã được huấn luyện vào một tệp và tải chúng lại sau đó để dự đoán hoặc tinh chỉnhTrong Ultralytics hệ sinh thái, chúng thường được lưu trữ dưới dạng .pt ( PyTorch ) tập tin.

Đây là một ví dụ đơn giản về cách tải trọng lượng đã được huấn luyện trước vào... YOLO Mô hình và chạy dự đoán:

from ultralytics import YOLO

# Load a model with pre-trained weights (e.g., YOLO26n)
model = YOLO("yolo26n.pt")

# Run inference on an image using the loaded weights
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of detected objects
print(f"Detected {len(results[0].boxes)} objects.")

Học chuyển giao và tinh chỉnh

Một trong những khía cạnh mạnh mẽ nhất của trọng số mô hình là tính khả chuyển của chúng. Thay vì huấn luyện một mô hình từ đầu—điều này đòi hỏi các tập dữ liệu khổng lồ và sức mạnh tính toán đáng kể—các nhà phát triển thường sử dụng học chuyển giao . Điều này bao gồm việc lấy một mô hình với các trọng số đã được huấn luyện trước trên một tập dữ liệu lớn như COCO hoặc ImageNet và điều chỉnh nó cho một nhiệm vụ cụ thể.

Ví dụ, bạn có thể lấy các trọng số từ một bộ phát hiện đối tượng tổng quát và tinh chỉnh chúng trên một tập dữ liệu nhỏ hơn về các tấm pin mặt trời . Bởi vì các trọng số được huấn luyện trước đã hiểu được các cạnh, hình dạng và kết cấu, mô hình hội tụ nhanh hơn nhiều và yêu cầu ít dữ liệu được gắn nhãn hơn. Các công cụ như Nền tảng Ultralytics đơn giản hóa quy trình này, cho phép các nhóm quản lý tập dữ liệu, huấn luyện mô hình trên đám mây và triển khai các trọng số được tối ưu hóa cho các thiết bị biên một cách liền mạch.

Nén và Tối ưu hóa

Nghiên cứu AI hiện đại thường tập trung vào việc giảm kích thước tệp trọng số mô hình mà không làm giảm hiệu năng, một quá trình được gọi là lượng tử hóa mô hình . Bằng cách giảm độ chính xác của trọng số (ví dụ: từ số thực 32 bit xuống số nguyên 8 bit), các nhà phát triển có thể giảm đáng kể mức sử dụng bộ nhớ và cải thiện tốc độ suy luận. Điều này rất quan trọng để triển khai các mô hình trên phần cứng có tài nguyên hạn chế như điện thoại di động hoặc thiết bị Raspberry Pi . Ngoài ra, các kỹ thuật như cắt tỉa loại bỏ các trọng số đóng góp rất ít vào kết quả đầu ra, giúp tinh gọn mô hình hơn nữa cho các ứng dụng thời gian thực.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay