术语表

模型监测

了解模型监控对于确保人工智能准确性、检测数据漂移以及在动态真实环境中保持可靠性的重要性。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

模型监控是对部署到生产中的机器学习(ML)模型的性能进行跟踪和评估的持续过程。它包括观察与模型准确性、运行健康状况和数据特征相关的关键指标,以确保模型随着时间的推移表现符合预期。这种做法是机器学习运营(MLOps)生命周期的重要组成部分,可确保部署的人工智能(AI)系统在真实环境中保持可靠、有效和可信。如果不进行监控,模型的性能就会无声无息地下降,从而导致糟糕的预测和负面的业务结果。

为什么模型监测很重要?

ML 模型是根据历史数据训练出来的,但现实世界是动态的。数据模式、用户行为或环境的变化会导致模型在部署后性能下降。进行监控的主要原因包括

  • 检测性能下降:随着时间的推移,模型的准确性会降低。监控有助于识别精确度召回率F1 分数等性能指标的下降。您可以在我们的指南中了解有关YOLO 性能指标的更多信息。
  • 识别数据漂移:输入数据的统计属性可能会发生变化,这种现象被称为数据漂移。当模型在生产中看到的数据与训练数据有很大差异时,就会发生这种情况。监控输入特征有助于检测这种偏移。
  • 发现概念漂移:输入特征与目标变量之间的关系会随着时间的推移而改变(概念漂移)。例如,客户的偏好可能会发生变化,从而使旧的预测模式变得过时。概念漂移需要对模型进行重新训练或调整。
  • 确保运行健康:监控跟踪推理延迟、吞吐量和错误率等运行指标,确保模型服务基础设施(模型服务)运行平稳。
  • 维护公平与道德:通过跟踪不同人口群体或数据片段的表现,监控有助于发现和减少人工智能中的偏见,从而促进人工智能伦理

监测哪些方面?

有效的模型监测通常需要跟踪几类指标:

  • 预测性能:准确率、平均精度(mAP)AUC 和错误率等指标,通常与验证过程中设定的基准进行比较。
  • 数据质量和完整性:跟踪输入数据中的缺失值、数据类型不匹配和范围违规。
  • 输入数据漂移:统计量(如群体稳定指数、Kolmogorov-Smirnov 检验),用于比较生产输入特征的分布与训练数据的分布。
  • 预测/输出漂移:监测模型预测的分布情况,以发现重大变化。
  • 运行指标:系统级指标,如 CPU/GPU利用率、内存使用率、请求延迟和吞吐量等系统级指标。普罗米修斯(Prometheus)等平台通常用于此目的。
  • 公平性和偏差度量:使用人口统计学均等或均等几率等指标,评估不同敏感属性(如年龄、性别、种族)的模型性能差异。

模型监控与相关概念

重要的是要将模式监控与类似术语区分开来:

  • 可观察性监控侧重于跟踪预定义的指标以评估已知的故障模式,而可观察性则提供工具(日志、指标、轨迹)以探索和了解未知的系统状态和行为。当监控发现异常时,可观察性可以进行更深入的调查。
  • MLOpsMLOps 是一套更广泛的实践,涵盖整个 ML 生命周期,包括数据管理、模型培训、部署、治理和监控。模型监控是 MLOps 框架中的一个重要组成部分,特别关注部署后的模型健康状况。
  • 模型评估:评估通常部署进行,使用静态验证数据测试数据来评估模型的质量。监测是在部署对实时生产数据执行的一个持续过程。在此了解有关模型评估和微调的见解。

实际应用

  1. 电子商务推荐系统:电子商务平台使用 ML 模型进行产品推荐(推荐系统)。模型监控跟踪推荐商品的点击率(CTR)和转换率。如果监控发现点击率突然下降(性能下降)或购买的产品类型发生变化(新趋势导致的概念漂移),就会触发警报。这将促使进行调查,并可能利用更新的交互数据重新训练模型。Amazon Personalize包括监控推荐有效性的功能。
  2. 自动驾驶汽车感知: 自动驾驶汽车在很大程度上依赖于计算机视觉模型,例如 Ultralytics YOLO等计算机视觉模型进行物体检测。模型监控可持续跟踪行人、骑车人和其他车辆等物体的检测准确度YOLO 性能指标)和置信度分数。它还监控输入数据特征(如图像亮度、天气条件),以检测漂移。如果模型的性能在特定条件下(如暴雨、光线不足)明显下降,系统可能会切换到更安全的运行模式,或提示需要更新在更多样化数据上训练的模型(数据增强)。Waymo等公司在监控感知系统方面投入了大量资金。

工具和实施

实施模型监控通常需要使用专门的工具和平台。从Evidently AINannyML等开源库到云提供商提供的托管服务(AWS SageMaker Model MonitorGoogle Vertex AI Model MonitoringAzure Machine Learning 数据漂移检测),以及Arize AIWhyLabs 等专用 MLOps 平台,都是不错的选择。Ultralytics HUB等平台提供支持部署和管理模型的基础设施,并与监控解决方案集成,以完成 MLOps 周期。有效的模型维护策略在很大程度上依赖于强大的监控。

阅读全部