术语表

服务模式

了解模型服务的基本要素--部署人工智能模型,实现实时预测、可扩展性和与应用程序的无缝集成。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

在人工智能和机器学习领域,模型一旦训练完成,它的旅程还远远没有结束。要想让这些模型发挥实际作用,就需要让它们能够对新的、未见过的数据进行预测。这就是模型服务发挥作用的地方。模型服务是将训练有素的机器学习模型部署到生产环境中的过程,在生产环境中,应用程序或系统可以访问该模型以执行推理。它从根本上弥补了模型开发与实际应用之间的差距,使企业和用户能够充分利用人工智能模型的力量。

示范服务的重要性

模型服务至关重要,因为它将静态的、经过训练的模型转化为动态的、可操作的服务。如果没有模型服务,机器学习模型就只能局限在开发环境中,无法在实际场景中实现价值。高效的模型服务可确保

  • 实时预测:使应用程序能够进行即时预测,这对于欺诈检测或自动驾驶等时间敏感型任务至关重要。实时推理在许多现代人工智能应用中都至关重要。
  • 可扩展性和可靠性:生产环境要求可扩展性,以处理不同的负载,并要求可靠性,以确保持续运行。模型服务基础设施旨在满足这些需求,根据需要扩展资源并保持高可用性。
  • 可访问性和集成性:提供通过应用程序接口(API)访问模型的标准化方法,从而轻松将人工智能功能集成到从网络服务到移动应用程序的各种应用中。这有助于将计算机视觉自然语言处理(NLP)整合到更广泛的系统中。
  • 模型管理和版本管理:便于管理不同的模型版本,实现无缝更新和回滚。这对于保持模型的准确性和适应不断变化的数据至关重要。Ultralytics HUB 提供高效的模型管理工具

实际应用

模型服务为各行各业的大量人工智能应用提供了动力。下面是几个具体的例子:

  • 电子商务产品推荐:电子商务平台利用模型服务实时提供个性化产品推荐。经过训练的推荐系统模型通过应用程序接口提供服务。当用户浏览网站时,应用程序会将用户数据发送到模型服务端点,然后返回预测的产品推荐给用户,从而提升客户体验并促进销售。
  • 用于诊断的医学图像分析:在医疗保健领域,医疗图像分析模型(如用于肿瘤检测的模型)是用来协助放射科医生的。获取新的医学影像(如 X 光片或核磁共振成像)后,将其发送到模型服务系统。模型执行推理并返回诊断见解,如突出显示潜在的异常,从而帮助更快、更准确地进行诊断。

示范服务的主要组成部分

典型的模型服务架构包括几个协同工作的关键组件:

  • 训练模型:核心组件是训练好的机器学习模型本身,通常以ONNX 或TensorFlow SavedModel 等格式保存,以便高效部署。Ultralytics YOLO 模型可导出为各种格式,以便灵活部署,包括 TensorRTOpenVINO.
  • 服务基础设施:这包括模型运行的硬件和软件环境。它可以是亚马逊 SageMakerGoogle Cloud AI Platform 等云平台,也可以是内部服务器。无服务器计算方案因其可扩展性和成本效益也越来越受欢迎。
  • API 服务器:API(应用程序接口)服务器是应用程序与服务模型之间的接口。它接收预测请求,将请求发送给模型进行推理,并返回预测结果。常见的 API 框架包括RESTgRPC
  • 负载平衡器:为了处理高流量并确保可扩展性,负载平衡器会将接收到的请求分配给服务基础设施的多个实例,以防止过载并保持性能。
  • 监控和日志:强大的监控和日志系统对于跟踪模型性能、发现问题和确保服务系统的长期可靠性至关重要。这包括监控推理延迟、吞吐量和错误率,也是模型监控的一部分。

模型部署与模型服务

虽然模型部署和模型服务经常互换使用,但两者的含义却截然不同。模型部署是使模型可供使用的更广泛过程,它可以包括各种方法,而不仅仅是通过应用程序接口提供服务。模型部署选项包括将模型直接嵌入应用程序、部署到边缘设备或建立批量推理管道。

具体来说,模型服务指的是为实时推理设置一个专用的、可扩展的、可访问的服务,通常是通过应用程序接口。这是一种特定的部署类型,侧重于持续、按需预测能力。部署方法的选择取决于应用需求,如延迟需求、可扩展性需求和集成复杂性。对于需要即时预测和无缝集成到不同系统中的应用,模型服务是最理想的方法。

阅读全部