Thuật ngữ

Chuẩn hóa

Khám phá sức mạnh của chuẩn hóa trong học máy! Tìm hiểu cách nó nâng cao việc đào tạo mô hình, tăng cường hiệu suất và đảm bảo các giải pháp AI mạnh mẽ.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Chuẩn hóa là một kỹ thuật tiền xử lý quan trọng trong học máy và khoa học dữ liệu được sử dụng để định lại tỷ lệ dữ liệu theo phạm vi chuẩn, thường là từ 0 đến 1 hoặc -1 đến 1. Quy trình này nhằm đảm bảo rằng tất cả các tính năng đều đóng góp như nhau vào quá trình đào tạo mô hình, ngăn không cho các tính năng có giá trị lớn hơn lấn át các tính năng có giá trị nhỏ hơn. Bằng cách đưa các tính năng khác nhau vào cùng một tỷ lệ, chuẩn hóa giúp các thuật toán, đặc biệt là các thuật toán nhạy cảm với việc định tỷ lệ tính năng như các phương pháp dựa trên gradient descent được sử dụng trong học sâu, hội tụ nhanh hơn và hiệu quả hơn.

Tại sao chuẩn hóa lại quan trọng

Trong các tập dữ liệu, các tính năng thường có phạm vi khác nhau. Ví dụ, trong một tập dữ liệu dự đoán giá nhà, diện tích của một ngôi nhà có thể dao động từ 500 đến 5000 feet vuông, trong khi số phòng ngủ chỉ có thể dao động từ 1 đến 5. Nếu không có chuẩn hóa, các mô hình học máy có thể coi trọng quá mức các tính năng có phạm vi lớn hơn. Chuẩn hóa giải quyết vấn đề này, đảm bảo rằng tất cả các tính năng được xử lý thống nhất trong quá trình đào tạo. Điều này dẫn đến các mô hình ổn định và mạnh mẽ hơn, hiệu suất được cải thiện và thời gian đào tạo nhanh hơn, đặc biệt đối với các thuật toán như mạng nơ-ron được sử dụng trong Ultralytics YOLO mô hình.

Các loại chuẩn hóa

Một số kỹ thuật chuẩn hóa thường được sử dụng:

  • Min-Max Scaling: Đây là một trong những kỹ thuật phổ biến nhất. Nó chia tỷ lệ và dịch chuyển từng tính năng riêng lẻ sao cho nó nằm trong phạm vi [0, 1]. Bạn có thể tìm hiểu thêm về Min-Max scaling trên trang web Scikit-learn, một thư viện học máy phổ biến trong Python .
  • Chuẩn hóa điểm Z: Mặc dù về mặt kỹ thuật là chuẩn hóa, nhưng nó thường được sử dụng thay thế cho chuẩn hóa. Chuẩn hóa điểm Z chuyển đổi dữ liệu để có giá trị trung bình là 0 và độ lệch chuẩn là 1. Phương pháp này ít nhạy cảm với các giá trị ngoại lai hơn so với phương pháp chia tỷ lệ Min-Max.
  • Max Abs Scaling: Phương pháp này chia tỷ lệ từng tính năng theo giá trị tuyệt đối lớn nhất của nó. Phương pháp này đặc biệt hữu ích đối với dữ liệu thưa thớt và đảm bảo các giá trị vẫn nằm trong phạm vi [-1, 1].

Việc lựa chọn kỹ thuật chuẩn hóa phù hợp phụ thuộc vào tập dữ liệu và mô hình học máy đang được sử dụng. Đối với nhiều ứng dụng học sâu, bao gồm đào tạo Ultralytics YOLO mô hình phát hiện đối tượng, chuẩn hóa là bước tiền xử lý tiêu chuẩn.

Ứng dụng của Chuẩn hóa

Chuẩn hóa được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau trong AI và ML. Sau đây là một vài ví dụ:

  • Xử lý hình ảnh: Trong thị giác máy tính, hình ảnh thường được biểu diễn dưới dạng giá trị pixel từ 0 đến 255. Chuẩn hóa các giá trị pixel này thành phạm vi từ 0 đến 1 là một thực hành phổ biến trước khi đưa chúng vào Mạng nơ-ron tích chập (CNN). Điều này có thể tăng cường khả năng học các tính năng từ hình ảnh của mô hình, cải thiện các tác vụ như phát hiện đối tượng bằng cách sử dụng Ultralytics YOLOv8 hoặc phân loại hình ảnh . Hãy xem xét việc khám phá cách xử lý trước dữ liệu chú thích quan trọng như thế nào trong các dự án thị giác máy tính để có hiệu suất mô hình tối ưu.
  • Phân tích hình ảnh y tế: Trong phân tích hình ảnh y tế , chuẩn hóa là yếu tố quan trọng để chuẩn hóa phạm vi cường độ của hình ảnh từ các máy quét hoặc bệnh nhân khác nhau. Chuẩn hóa này rất quan trọng đối với các mô hình AI để phát hiện chính xác các bất thường hoặc bệnh tật, bất kể nguồn gốc của hình ảnh y tế. Ví dụ, trong phát hiện khối u não bằng Ultralytics YOLO11 trong hình ảnh y tế , chuẩn hóa nhất quán đảm bảo mô hình mạnh mẽ và đáng tin cậy trên nhiều tập dữ liệu khác nhau.

Tóm lại, chuẩn hóa là một bước cơ bản trong việc chuẩn bị dữ liệu cho máy học. Nó đảm bảo đóng góp công bằng từ tất cả các tính năng, tăng tốc đào tạo và cải thiện tính ổn định và hiệu suất của các mô hình AI trên nhiều ứng dụng khác nhau, bao gồm cả những ứng dụng được hỗ trợ bởi Ultralytics YOLO .

Đọc tất cả