术语表

迁移学习

释放迁移学习的威力,节省时间、提高人工智能性能,并使用预训练模型利用有限的数据处理新任务。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

迁移学习是机器学习中的一项强大技术,它允许模型将从解决一个问题中获得的知识应用到不同但相关的问题中。迁移学习不需要每次都从头开始训练一个模型,而是利用预先训练好的模型,从而节省时间和资源,而且往往能提高性能,尤其是在新任务的数据有限时。这种方法被广泛应用于各个领域,尤其是计算机视觉和自然语言处理领域,以构建更有效、更高效的人工智能系统。

迁移学习如何发挥作用

迁移学习的核心理念是将模型在大型数据集上学习到的特征用于新的、通常较小的数据集。通常情况下,模型首先要在ImageNet这样的海量数据集上进行训练,以完成图像分类等一般任务。这一预训练阶段能让模型从数据中学习基本特征和模式。然后,对于新的相关任务,预训练模型的权重被用作起点。第二阶段通常称为微调,即在新的特定任务数据集上进一步训练模型。通常情况下,只对模型的最后几层进行重新训练,而已经学习了一般特征的前面几层则保持不变或以较低的学习率进行训练。

这种方法特别有效,因为深度神经网络的初始层倾向于学习一般特征(如图像中的边缘、纹理),而这些特征通常可以在不同但相关的任务中转移。通过重复使用这些学习到的特征,迁移学习减少了每个新问题对大量数据和计算资源的需求。

迁移学习的益处

  • 缩短训练时间:从预先训练的权重开始,可大大缩短新任务的训练过程。模型的收敛速度更快,因为它们是从已经学习过的特征点开始的。
  • 所需数据更少:在处理有限的数据集时,迁移学习非常宝贵。预先训练的模型已经从大型数据集中学习到了强大的特征,即使新任务的示例较少,也能进行有效的学习。
  • 改进泛化:在大量数据集上训练过的预训练模型通常能更好地泛化到新的、未见过的数据上。在特定数据集上进行微调可以进一步增强目标任务的泛化能力,从而提高模型的准确性
  • 更快的开发周期:通过减少训练时间和数据要求,迁移学习加快了机器学习模型的开发和部署,使迭代和创新变得更加容易。

实际应用

迁移学习应用于众多领域。下面是几个具体的例子:

  • 医学图像分析:在医学图像分析中,特定疾病的数据集可能很小,而且很难获取。通过迁移学习,可以对在一般图像数据集上预先训练好的模型进行有效的微调,以完成检测 X 射线中的肿瘤或分割核磁共振成像扫描中的器官等任务。这对于提高诊断准确性和效率至关重要,这一点在人工智能在医疗保健领域的应用中尤为突出。

  • 特定领域的物体检测:虽然存在用于一般物体检测的大型数据集,但专业应用往往需要模型来检测特定环境中的特定物体。例如,在农业计算机视觉领域,可以对在广泛的物体检测数据集上预先训练好的模型进行微调,以检测农业图像中特定类型的作物或害虫。这种方法在精准农业等应用中尤为重要,因为在这些应用中,数据收集具有挑战性,特定领域的专业知识至关重要。Ultralytics YOLO 模型,如 YOLOv8YOLOv11 等模型经常与迁移学习一起用于各种物体检测任务,利用预训练权重和微调功能。

迁移学习与Ultralytics YOLO

Ultralytics YOLO这些模型的设计目的是通过迁移学习轻松实现适应性。用户可以随时利用Ultralytics HUB 中为 YOLOv5 、YOLOv8 和 YOLOv11 等模型提供的预训练权重。通过在自定义数据集上对这些预训练模型进行微调,用户可以在特定对象检测、分割分类任务中快速实现高性能。Ultralytics HUB云训练功能进一步简化了这一过程,用户无需进行大量设置即可在云环境中训练和微调模型。在微调过程中,还可以应用超参数调整等技术,进一步优化模型在特定任务中的性能。

结论

迁移学习是现代机器学习的基石,极大地影响了人工智能模型开发的效率和效果。通过重复使用预先训练好的模型中的知识,它使人工智能民主化,使其在更广泛的应用中,特别是在数据或计算资源有限的情况下,更容易获得和实用。它能够加快开发速度并提高模型性能,是人工智能领域不可或缺的工具。

阅读全部