术语表

推理引擎

了解推理引擎如何通过提供实时预测、优化模型和实现跨平台部署为人工智能提供动力。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

在人工智能和机器学习领域,推理引擎是负责部署训练有素的模型,对新的、未见过的数据进行预测的组件。它将训练有素的模型应用到现实世界的数据中,执行物体检测、图像分类或自然语言处理等任务。从本质上讲,它是驱动机器学习 "推理 "阶段的引擎,在这一阶段,学习到的模式被用来分析和解释新的输入,使人工智能系统能够实时解决问题并做出决策。

推理引擎如何工作

推理引擎使用在大型数据集上经过大量训练的预训练模型。这些模型通常使用 PyTorch等框架开发的,其中包含执行特定任务所需的学习知识。当新数据(如图像或文本)输入推理引擎时,它会通过预先训练好的模型来处理这些数据。这一过程会产生一个输出,可能是对象检测边界框、分类标签或预测情感。 Ultralytics YOLO例如,很多模型都依赖推理引擎在不同平台(从资源有限的边缘设备到功能强大的云服务器)上执行实时对象检测、分割和分类。推理引擎的效率对现实世界的应用至关重要,它影响着预测的速度和准确性。

推理引擎的主要特点

推理引擎的应用

1.自动驾驶

在自动驾驶汽车中,推理引擎是感知系统的核心。它们处理来自摄像头和激光雷达等传感器的实时数据,检测物体、行人和车道标记,使车辆能够安全导航。 Ultralytics YOLO在使用高效推理引擎部署模型时,可确保快速、准确地检测物体,这对自动驾驶汽车的安全性和响应速度至关重要。

2.医学图像分析

在医疗保健领域,推理引擎正在彻底改变诊断方法。例如,在医学图像分析中,推理引擎上可以部署经过训练的模型,以检测核磁共振成像或 CT 扫描等医学图像中的异常情况,从而为放射科医生提供帮助。这些引擎可以快速分析图像并突出显示潜在的关注区域,从而提高诊断速度和准确性,并支持更早地发现脑肿瘤等疾病。

优化技术

为确保推理引擎发挥最佳性能,我们采用了各种优化技术。模型量化降低了模型权重的数值精度,从而减小了模型大小并加快了计算速度。模型剪枝消除了神经网络中不那么重要的连接,简化了模型并提高了速度,同时不会明显降低精度。针对硬件的优化,如利用 NVIDIA TensorRTNVIDIA GPU,根据硬件架构调整模型执行,从而进一步提高推理速度。

区分推理引擎和相关概念

虽然推理引擎对部署人工智能模型至关重要,但它们有别于训练框架,如 PyTorch等训练框架不同,后者用于构建和训练模型。推理引擎只专注于部署和执行已训练好的模型。推理引擎也不同于模型部署实践,后者包含更广泛的战略和方法,用于使模型在现实世界环境中可访问和运行。

结论

要将人工智能和机器学习模型从实验室应用到现实世界,推理引擎是不可或缺的。推理引擎能够在各种环境中提供快速、准确的预测,是现代人工智能基础设施的基石。对于那些希望简化人工智能部署的人来说,像Ultralytics HUB 这样的平台可提供各种工具和资源,用于高效部署和管理由强大推理引擎驱动的人工智能模型。

阅读全部