术语表

正常化

探索机器学习中规范化的力量!了解它如何增强模型训练、提高性能并确保强大的人工智能解决方案。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

归一化是机器学习和数据科学中一种重要的预处理技术,用于将数据重新缩放到一个标准范围,通常介于 0 和 1 或 -1 和 1 之间。 这一过程旨在确保所有特征对模型训练的贡献相同,防止数值较大的特征支配数值较小的特征。通过将不同的特征调整到相似的范围,归一化可以帮助算法,尤其是那些对特征缩放敏感的算法,如深度学习中使用的基于梯度下降的方法,更快、更高效地收敛。

规范化为何重要

在数据集中,特征的范围往往各不相同。例如,在预测房价的数据集中,房屋面积的范围可能从 500 平方英尺到 5000 平方英尺不等,而卧室数量的范围可能只有 1 到 5 间。如果不进行归一化处理,机器学习模型可能会过分重视范围较大的特征。归一化可以解决这个问题,确保在训练过程中统一处理所有特征。这将使模型更稳定、更健壮,提高性能,缩短训练时间,尤其是对于神经网络等用于Ultralytics YOLO 模型的算法而言。

标准化类型

常用的规范化技术有几种:

  • 最小-最大缩放:这是最常见的技术之一。它对每个特征进行单独缩放和转换,使其处于 [0, 1] 的范围内。你可以在 Scikit-learn 网站上了解更多有关 Min-Max 缩放的信息,Scikit-learn 是Python 中的一个流行机器学习库。
  • Z 分数标准化:虽然从技术上讲是标准化,但它经常与归一化交替使用。Z 分数标准化将数据转换为平均值为 0、标准差为 1 的数据。与最小值-最大值缩放法相比,这种方法对异常值的敏感度较低。
  • 最大绝对值缩放:这种方法按每个特征的最大绝对值进行缩放。它对稀疏数据特别有用,能确保数值保持在 [-1, 1] 的范围内。

选择合适的归一化技术取决于所使用的数据集和机器学习模型。对于许多深度学习应用,包括训练用于物体检测的Ultralytics YOLO 模型,归一化是一个标准的预处理步骤。

标准化的应用

规范化广泛应用于人工智能和 ML 的各个领域。下面是几个例子:

  • 图像处理:在计算机视觉中,图像通常以 0 到 255 之间的像素值表示。在将这些像素值输入卷积神经网络(CNN)之前,通常会将其归一化为 0 至 1 的范围。这可以增强模型从图像中学习特征的能力,从而改进使用Ultralytics YOLOv8 进行物体检测图像分类等任务。考虑探索在计算机视觉项目中预处理注释数据如何对优化模型性能至关重要。
  • 医学图像分析:医学图像分析中,归一化对于标准化来自不同扫描仪或患者的图像强度范围至关重要。无论医疗图像来源如何,这种标准化对于人工智能模型准确检测异常或疾病都至关重要。例如,在利用Ultralytics YOLO11 医学影像检测脑肿瘤时,一致的归一化可确保模型在不同数据集上的稳健性和可靠性。

总之,规范化是为机器学习准备数据的基本步骤。它能确保所有特征的公平贡献,加快训练速度,提高人工智能模型在各种应用中的稳定性和性能,包括由Ultralytics YOLO 支持的应用。

阅读全部