深圳Yolo 视觉
深圳
立即加入
词汇表

混合精度

了解混合精度如何Ultralytics 等模型的训练并减少内存占用。探索FP16和FP32技术如何助力更快获取AI洞察。

混合精度是模型优化中的关键技术,用于在减少内存消耗的同时加速深度学习模型的训练。 通过策略性地组合 不同数值格式(通常为16位和32位浮点类型),该方法使机器学习算法能够 在不牺牲模型最终精度的前提下 更快地执行计算。它已成为现代人工智能开发中的标准实践, 尤其适用于资源密集型任务,例如在海量数据集上训练 YOLO26架构。

混合精度的工作原理

在传统的深度学习工作流程中,模型通常采用单精度浮点格式(FP32)进行计算。FP32中的每个数值需要占用32位内存空间。尽管精度较高,但这种格式可能导致计算成本高昂且内存消耗巨大。

混合精度引入了半精度(FP16)的使用,其仅采用16位存储。 然而,仅使用FP16会因动态范围较小导致数值不稳定。为解决此问题,混合精度方法在保持FP32格式模型权重"主副本"以确保稳定性的同时,将卷积和矩阵乘法等高强度数学运算交由FP16处理。

该过程通常包括三个关键步骤:

  1. 铸造:将模型的输入和激活转换为FP16格式,以在兼容硬件(如NVIDIA Tensor )上加速执行。
  2. 损失缩放:放大损失函数值以防止"下溢"现象,即在FP16精度下微小梯度更新会归零。
  3. 累加:执行FP16格式的算术运算,但将结果累加为FP32格式,以便在更新主权重前保留必要信息。

人工智能培训的益处

采用混合精度为有效利用计算资源的开发者和研究人员带来显著优势:

  • 更快的训练速度:FP16运算所需的内存带宽更少,且能被现代GPU更快地处理。这可大幅缩短单epoch的训练时间。
  • 内存占用减少:由于FP16张量仅需FP32一半的内存空间,开发者可将批量大小提升一倍。更大的批量通常能带来更稳定的梯度估计和更快的收敛速度。
  • 能效:计算负载的降低意味着能耗的减少,这对大规模云端训练操作至关重要。

实际应用

混合精度技术被广泛应用于各行各业,用于高效处理复杂模型和海量数据集。

自动驾驶

自动驾驶汽车的开发过程中, 工程师必须利用数百万张高分辨率视频帧来训练物体检测模型。混合精度技术的应用 使他们能够高效训练 YOLO26 等尖端模型。内存占用量的降低使得处理更高分辨率的输入成为可能,这对 远距离检测交通标志或行人等小型物体至关重要。

医学图像分析

医学图像分析常涉及来自MRI或CT扫描的3D体积数据,这类数据对内存需求极高。若以完整的FP32精度对这类数据进行分割模型训练,往往会导致"内存不足"(OOM)错误。混合精度技术使研究人员能够将这些庞大GPU ,从而推动人工智能的发展,助力医生更早地诊断疾病。

利用Ultralytics实现混合精度

现代框架,如 PyTorch 通常通过名为自动混合精度(AMP)的功能自动处理混合精度的复杂性。 ultralytics 该包在训练期间默认启用加速移动页面(AMP),以确保最佳性能。

以下是一个简洁示例,展示如何启动YOLO26的训练,其中混合精度默认处于激活状态 (可通过 amp 参数:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# amp=True is the default setting for mixed precision training
results = model.train(data="coco8.yaml", epochs=5, imgsz=640, amp=True)

混合精度与相关概念

区分混合精度与术语表中类似术语有助于避免混淆:

  • 模型量化混合精度在训练过程中采用低精度浮点数(FP16),而量化技术通常在训练完成后将权重转换为整数(如INT8)以供部署。量化主要关注边缘设备上的推理延迟,混合精度则侧重于训练速度和稳定性。
  • 半精度特指FP16数据格式本身。混合精度技术则是同时使用FP16和FP32两种精度。若仅采用纯半精度而未包含"混合"的FP32主副本,模型常因数值误差导致收敛失败。

结论

混合精度彻底改变了神经网络的训练方式,成为当今庞大基础模型和视觉系统得以实现的关键推动力。通过在数学精度的需求与硬件速度及内存的限制之间取得平衡,它使开发者能够更快地迭代开发,构建更强大的AI解决方案。

对于希望无缝管理数据集并训练优化模型的用户,Ultralytics 提供了一个综合环境,能够自动运用这些现代优化技术。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入