术语表

模型部署

了解模型部署的基本要素,将 ML 模型转化为用于预测、自动化和人工智能驱动的洞察力的实际工具。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

模型部署是将训练有素的机器学习(ML)模型用于实时生产环境的关键过程。这一步骤将模型从开发或测试阶段转变为可在新的真实世界数据上生成预测(推理)的操作工具。这是机器学习生命周期中的一个关键阶段,是构建 ML 模型与实际使用该模型为应用程序、系统或业务流程带来价值之间的桥梁。

模型部署的相关性

如果没有有效的部署,即使是最精确的模型也只能停留在学术层面,无法带来切实的效益。部署对于实现人工智能和 ML 项目的投资回报(ROI)至关重要。它能让企业实现任务自动化,从数据中获得可操作的见解,提升用户体验,并推动知情决策。成功的部署可确保投入模型培训的资源转化为实际成果。持续运行通常涉及模型监控,以确保性能不会因数据漂移等因素而随时间下降。

模型部署的应用

通过模型部署,可以在各行各业实现大量由人工智能驱动的应用。下面是几个例子:

  • 零售库存管理:部署对象检测模型,如 Ultralytics YOLO模型,可以让摄像头自动监控货架库存、跟踪库存水平,并在商品不足时提醒员工,从而优化库存管理,减少人工检查。
  • 自主系统:自动驾驶汽车和无人机在很大程度上依赖于部署的感知和导航模型。针对物体检测、分割和路径规划等任务训练的模型被部署到系统的车载计算机上,以实时解释传感器数据。

模型部署的重要考虑因素

有效部署 ML 模型需要围绕几个因素进行精心规划:

  • 可扩展性部署基础设施必须处理不同的负载,并根据需求扩大或缩小。这通常使用云计算平台或容器编排系统进行管理。
  • 延迟和吞吐量:应用通常要求实时响应的低延迟。使用量化或剪枝等技术优化模型,并使用高效的运行时间,有助于满足性能要求。
  • 部署环境:模型可以部署在服务器(云或内部)上,直接部署在应用程序中,或通过边缘计算部署在资源受限的设备上。部署到边缘设备需要对模型的大小和计算效率进行优化。
  • 模型服务这包括通常通过API(应用编程接口)托管模型,允许应用程序发送数据和接收预测。Docker等技术常用于将模型及其依赖关系打包到便携式容器中,以便进行一致部署。
  • 维护:部署的模型需要持续监控和潜在的再训练或更新,以保持性能并适应不断变化的数据模式。这属于更广泛的MLOps(机器学习运营)实践。

工具和平台

各种工具和平台简化了部署过程。框架通常提供将模型导出为适合不同部署目标的各种格式的功能。Ultralytics HUB等平台为计算机视觉模型的训练、跟踪和部署提供了集成解决方案,简化了从开发到生产的工作流程。其他专用模型服务工具和云提供商服务也提供全面的部署功能。

阅读全部