术语表

纪元

了解纪元在机器学习中的作用、对模型训练的影响,以及如何优化纪元以提高准确性和性能。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

在机器学习中,一个历元指的是在训练模型的过程中对整个训练数据集进行一次完整的遍历。在一个历元期间,模型会对数据集中的每个数据点进行一次精确的观察和学习。历元数是一个超参数,它定义了学习算法对整个训练数据集进行学习的次数。了解历元对于训练有效的机器学习模型至关重要,因为它直接影响到模型从训练数据中学习和泛化的能力。

年代在模型训练中的意义

对于机器学习模型(尤其是基于神经网络的模型)的迭代训练而言,历元是基础。每个纪元由前向和后向两个部分组成。在前向过程中,模型会对输入数据进行预测;在后向过程中,模型的内部参数会根据预测误差,通过随机梯度下降(SGD)亚当(Adam 等优化算法进行更新。这种迭代过程可使模型在多个历时周期内逐步提高性能。

历时与其他训练参数的对比

重要的是要将历时与其他相关的训练参数区分开来:

  • 批次大小:一个纪元通常分为多个批次。批次大小决定了模型内部参数更新前一次正向和反向传递中处理的数据样本数量。较小的批次规模意味着在一个历时内更新更频繁,而较大的批次规模需要更多内存,但可以加快训练速度。了解有关机器学习中批次大小优化的更多信息。
  • 迭代:迭代是指完成一次迭代所需的批次数量。例如,如果一个数据集有 1,000 个样本,而批次大小为 100,那么完成一次迭代需要 10 次迭代。

确定最佳纪元数

选择正确的历元数至关重要。epoch 太少会导致拟合不足,即模型无法捕捉数据中的潜在模式。相反,epoch 太多会导致过度拟合,即模型开始记忆训练数据,在未见过的数据上表现不佳。

最佳历元数通常取决于数据集的复杂性、模型架构和学习率等因素。早期停止(即当模型在验证数据集上的性能停止提高时停止训练)等技术有助于防止过度拟合并找到合适的epoch次数。

实际应用

  1. 图像分类:在训练图像分类模型(如识别照片中的物体)时,需要使用多个历元来完善模型识别不同特征和模式的能力。例如,Ultralytics YOLO (You Only Look Once)模型可能需要在ImageNet这样的大型数据集上进行数百次历时训练,以获得较高的图像分类准确率。探索Ultralytics YOLO11 如何用于图像分类任务。
  2. 自然语言处理:在情感分析或机器翻译等自然语言处理(NLP)任务中,像Transformers这样的模型可能要经过无数次的历时训练才能理解人类语言的细微差别。每个阶段都有助于模型提高对上下文、语法和语义的理解,从而在文本生成或语言翻译等任务中取得更好的性能。了解有关自然语言处理中的人工智能及其应用的更多信息。

在培训过程中监测时间

监控模型在不同时间段的性能至关重要。通常要跟踪损失准确度精确度召回率F1 分数等关键指标。TensorBoardWeights & Biases等工具提供了可视化功能,有助于了解这些指标是如何随历时演变的,从而帮助识别过拟合或欠拟合等问题。

通过了解并有效管理历时,从业人员可以训练出更强大、更准确的机器学习模型,从而在从计算机视觉到自然语言处理等各种应用中实现更好的性能。了解有关监控和维护计算机视觉模型的更多信息。

阅读全部