术语表

测试数据

了解测试数据在机器学习中的重要性。了解它如何确保对模型进行无偏见的评估,从而进行准确的真实世界预测。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

在机器学习领域,测试数据在评估训练模型的性能和泛化能力方面起着至关重要的作用。它是一个独立于训练数据验证数据的数据集,专门用于评估模型对未见数据的预测能力。这有助于确保模型不是简单地记忆训练数据,而是学习可应用于新的真实世界场景的模式。

测试数据的重要性

测试数据是在模型部署前衡量其有效性的最后一个检查点。验证数据在训练过程中用于微调超参数和防止过度拟合,而测试数据则与之不同,专门用于最终评估。这种分离对于避免模型性能评估出现偏差至关重要。通过在从未接触过的数据上对模型进行评估,开发人员可以更真实地估计模型在实际应用中的表现。有关数据在人工智能中的重要性的更多信息,请访问Ultralytics 博客

训练数据和验证数据的主要差异

虽然训练、验证和测试这三类数据在机器学习中都必不可少,但它们的作用却截然不同:

  • 训练数据:这是用于训练模型的数据。模型通过调整其内部参数从这些数据中学习,以尽量减少预测误差。了解有关训练数据的更多信息。
  • 验证数据:这些数据在训练过程中用于微调模型的超参数并监控其性能。它有助于决定何时停止训练以防止过度拟合。了解有关验证数据的更多信息。
  • 测试数据:只有在模型经过充分训练并确定其超参数后,才会使用这些数据。它能对模型泛化到新的、未见过的数据的能力进行无偏见的评估。

人工智能和机器学习的应用

测试数据用于不同领域,以评估不同应用中的模型:

  • 图像分类:在图像分类任务中,测试数据可能包括一组模型从未见过的图像。评估模型性能的依据是它将这些图像归入预定义类别的准确程度。了解有关图像分类的更多信息。
  • 物体检测:在物体检测中,测试数据包括带有模型需要识别和定位的物体的图像。衡量模型性能的标准是其正确识别物体并在物体周围绘制精确边界框的能力。进一步探索物体检测
  • 自然语言处理(NLP):对于 NLP 任务,测试数据可能包括模型必须分析的文本文档或句子。例如,在情感分析中,评估模型性能的依据是它能多好地确定未见文本的情感(正面、负面或中性)。深入学习自然语言处理(NLP)

真实案例

自动驾驶汽车

自动驾驶汽车的开发过程中,测试数据对于评估计算机视觉模型的性能至关重要。例如,为检测行人而训练的模型必须在一组不同的图像和视频上进行测试,而这些图像和视频是模型在训练过程中从未遇到过的。这样才能确保模型能够在不同的现实条件下(如不同的光线、天气和角度)可靠地检测到行人。

医疗诊断

在医疗保健领域,测试数据用于评估辅助医疗诊断的模型。例如,用于检测医学影像中肿瘤的模型(如脑肿瘤检测中使用的模型),必须在一组单独的图像上进行测试,这些图像在训练过程中没有使用过。这有助于确保模型能够准确检测出新患者的肿瘤,为医生提供可靠的工具。

结论

测试数据是机器学习管道中不可或缺的组成部分,可对模型的性能进行无偏见的最终评估。通过使用测试数据,开发人员可以确保他们的模型是稳健、可靠的,可以随时部署到实际应用中。使用独立的测试数据有助于建立对模型能力的信心,使其能够在新的、未见过的数据上进行泛化并表现良好,从而使其成为有效机器学习实践的基石。有关Ultralytics YOLO 及其应用的更多信息,请访问Ultralytics YOLO 页面。如需了解有关计算机视觉的更多信息,请访问计算机视觉词汇表页面。您还可以在维基百科上了解有关机器学习的更多信息。

阅读全部