标签平滑是一种正则化技术,常用于训练机器学习模型,尤其是分类任务。它包括修改地面实况标签以降低可信度,用平滑版本取代标签的单次编码。这种调整可以降低模型预测的过度置信度,提高泛化能力,减轻过拟合。
在典型的分类问题中,单次编码会将 1 的概率分配给正确的类别,而将 0 的概率分配给所有其他类别。标签平滑通过将正确类别的一小部分置信度重新分配给所有类别来调整这些概率。例如,将一个标签表示为 [1, 0, 0]
标签平滑法可以表示为 [0.9, 0.05, 0.05]
平滑系数为 0.1。
通过软化基本事实,模型可以避免对其预测过于自信。这使得模型更加稳健,尤其是在数据包含噪声或难以分类的情况下。
标签平滑被广泛应用于图像分类任务中,以改善模型校准和性能。例如,像在ImageNet 数据集上训练的图像分类模型,经常使用标签平滑来实现更好的泛化和减少过拟合。
在 NLP 中,标签平滑被用于序列到序列任务,如机器翻译。大型语言模型,如BERT(来自变换器的双向编码器表示)和基于变换器的模型,在训练过程中都受益于标签平滑,以确保稳定的学习,避免预测过于自信。
自动驾驶汽车:在自动驾驶汽车系统中,标签平滑被应用于为图像分类和物体检测任务而训练的模型。例如,用于高级物体检测的 COCO等数据集就受益于这一技术,从而提高了Ultralytics YOLO 等模型的鲁棒性,该模型被广泛应用于自动驾驶系统的物体检测。
医疗诊断:在医疗成像应用中,如使用脑肿瘤检测数据集进行肿瘤检测,标签平滑可提高预测的可靠性。它降低了模型对错误分类过于自信的风险,这在医疗保健等高风险领域至关重要。
Ultralytics HUB 无缝集成了标签平滑训练分类模型。无论您是使用CIFAR-10等数据集进行图像分类,还是使用自定义数据集,Ultralytics HUB 都能简化超参数(包括标签平滑因子)的设置过程,从而优化模型性能。
标签平滑是一种简单而强大的技术,能增强机器学习模型的鲁棒性和可靠性。通过软化目标标签,它可以帮助模型更好地泛化,避免过度拟合,并生成校准良好的预测结果。无论您是在进行图像分类、NLP 还是物体检测,标签平滑都是您机器学习工具包中的重要工具。欲了解更多相关技术和应用,请访问 Ultralytics 浏览 人工智能与计算机视觉术语表。