Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Chuẩn hóa (Normalization)

Khám phá cách chuẩn hóa giúp cải thiện quá trình huấn luyện và độ chính xác của mô hình. Tìm hiểu về phép chia tỷ lệ Min-Max, chuẩn hóa điểm Z và vai trò của nó trong việc... Ultralytics Dự án YOLO26.

Chuẩn hóa là một kỹ thuật cơ bản trong xử lý dữ liệu sơ bộ , bao gồm việc điều chỉnh tỷ lệ các thuộc tính số về một phạm vi chuẩn. Trong bối cảnh học máy (ML) , các tập dữ liệu thường chứa các đặc trưng có thang đo khác nhau—chẳng hạn như phạm vi tuổi (0–100) so với mức thu nhập (0–100.000). Nếu không được xử lý, những sự khác biệt này có thể khiến thuật toán tối ưu hóa bị thiên vị về các giá trị lớn hơn, dẫn đến sự hội tụ chậm hơn và hiệu suất không tối ưu. Bằng cách chuẩn hóa dữ liệu, các kỹ sư đảm bảo rằng mỗi đặc trưng đóng góp một cách tương xứng vào kết quả cuối cùng, cho phép mạng nơ-ron học hiệu quả hơn.

Các kỹ thuật chuẩn hóa phổ biến

Có một số phương pháp chuẩn để chuyển đổi dữ liệu, mỗi phương pháp phù hợp với các phân bố dữ liệu và yêu cầu thuật toán khác nhau.

  • Phương pháp chia tỷ lệ Min-Max : Đây là hình thức chuẩn hóa trực quan nhất. Nó chia tỷ lệ dữ liệu về một phạm vi cố định, thường là [0, 1]. Phép biến đổi này được thực hiện bằng cách trừ đi giá trị nhỏ nhất và chia cho phạm vi (giá trị lớn nhất trừ đi giá trị nhỏ nhất). Nó được sử dụng rộng rãi trong xử lý ảnh, nơi cường độ pixel được biết là nằm trong khoảng từ 0 đến 255.
  • Chuẩn hóa Z-Score : Mặc dù thường được sử dụng thay thế cho chuẩn hóa thông thường, nhưng chuẩn hóa đặc biệt biến đổi dữ liệu để có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1. Điều này đặc biệt hữu ích khi dữ liệu tuân theo phân phối Gaussian và rất cần thiết cho các thuật toán như Máy hỗ trợ vectơ (SVM) giả định dữ liệu được phân phối chuẩn.
  • Biến đổi logarit : Đối với dữ liệu chứa các giá trị ngoại lệ cực đoan hoặc tuân theo quy luật lũy thừa, việc áp dụng phép biến đổi logarit có thể thu hẹp phạm vi giá trị. Điều này giúp công cụ suy luận dễ dàng quản lý phân bố hơn mà không bị sai lệch do các giá trị đột biến lớn.

Các Ứng dụng Thực tế

Chuẩn hóa dữ liệu là một bước tiêu chuẩn trong quy trình của các hệ thống AI hiệu năng cao trong nhiều ngành công nghiệp khác nhau.

  1. Thị giác máy tính (CV): Trong các tác vụ như phát hiện đối tượngphân loại hình ảnh , hình ảnh kỹ thuật số được tạo thành từ các giá trị pixel nằm trong khoảng từ 0 đến 255. Việc đưa trực tiếp các số nguyên lớn này vào mạng có thể làm chậm quá trình giảm độ dốc . Một bước tiền xử lý tiêu chuẩn bao gồm chia các giá trị pixel cho 255,0 để chuẩn hóa chúng về phạm vi [0, 1]. Thực hành này đảm bảo đầu vào nhất quán cho các mô hình tiên tiến như YOLO26 , cải thiện tính ổn định của quá trình huấn luyện trên Nền tảng Ultralytics .
  2. Phân tích hình ảnh y tế: Các hình ảnh quét y tế, chẳng hạn như những hình ảnh được sử dụng trong trí tuệ nhân tạo trong chăm sóc sức khỏe , thường được tạo ra từ các máy khác nhau với thang cường độ khác nhau. Chuẩn hóa đảm bảo rằng cường độ pixel từ ảnh chụp MRI hoặc CT có thể so sánh được giữa các bệnh nhân và thiết bị khác nhau. Tính nhất quán này rất quan trọng để phát hiện khối u chính xác, cho phép mô hình tập trung vào các bất thường về cấu trúc thay vì sự thay đổi độ sáng.

Phân biệt các khái niệm liên quan

Điều quan trọng là phải phân biệt chuẩn hóa với các thuật ngữ tiền xử lý và kiến ​​trúc tương tự được tìm thấy trong học sâu.

  • So với Chuẩn hóa theo lô (Batch Normalization ): Chuẩn hóa dữ liệu là một bước tiền xử lý được áp dụng cho tập dữ liệu đầu vào thô trước khi đưa vào mạng. Ngược lại, Chuẩn hóa theo lô hoạt động nội bộ giữa các lớp trong toàn bộ mạng trong quá trình huấn luyện mô hình . Nó chuẩn hóa đầu ra của lớp kích hoạt trước đó để ổn định quá trình học.
  • So với Tăng cường hình ảnh : Trong khi chuẩn hóa thay đổi tỷ lệ giá trị pixel, tăng cường hình ảnh thay đổi nội dung hoặc hình học của hình ảnh (ví dụ: lật, xoay hoặc thay đổi màu sắc) để tăng tính đa dạng của tập dữ liệu. Các công cụ như Albumentations được sử dụng để tăng cường hình ảnh, trong khi chuẩn hóa là một phép toán tỷ lệ toán học.

Ví dụ triển khai

Trong thị giác máy tính, chuẩn hóa thường là bước đầu tiên trong quy trình. Ví dụ Python sau đây minh họa cách chuẩn hóa dữ liệu hình ảnh thủ công bằng thư viện NumPy , một quá trình diễn ra tự động trong trình tải dữ liệu Ultralytics YOLO26 trong quá trình huấn luyện.

import numpy as np

# Simulate a 2x2 pixel image with values ranging from 0 to 255
raw_image = np.array([[0, 255], [127, 64]], dtype=np.float32)

# Apply Min-Max normalization to scale values to [0, 1]
# This standardizes the input for the neural network
normalized_image = raw_image / 255.0

print(f"Original Range: {raw_image.min()} - {raw_image.max()}")
print(f"Normalized Range: {normalized_image.min()} - {normalized_image.max()}")

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay