绿色检查
链接复制到剪贴板

视觉人工智能解决方案中的实时推理正在产生影响

了解为什么计算机视觉中的实时推理对一系列应用非常重要,并探索它们在实现即时决策中的作用。

我们都曾经历过网络连接速度慢带来的挫败感。然而,试想一下,在事关重大的情况下,比如自动驾驶汽车对障碍物做出反应或医生分析重要扫描结果时,这种延迟会是什么样子。多耽误几秒钟就会造成严重后果。 

这就是实时人工智能推断能够发挥作用的地方。快速处理和实时预测使计算机视觉解决方案能够即时处理视觉数据并做出反应。这些瞬时决策可以提高安全性、效率和日常便利性。 

例如,外科医生使用机器人助手进行精细手术。每一个动作都通过高速连接进行控制,机器人的视觉系统实时处理手术区域,为外科医生提供即时视觉反馈。在这一反馈环路中,哪怕是最轻微的延迟都可能导致严重的错误,给病人带来危险。这是一个完美的例子,说明了为什么实时推断至关重要;没有任何延迟的余地。 

现实世界应用中的人工智能推理取决于三个关键概念:推理引擎(高效运行人工智能模型的软件或硬件)、推理延迟(输入与输出之间的延迟)和实时推理(人工智能系统以最小延迟进行处理和反应的能力)。

在本文中,我们将探讨这些核心概念,以及计算机视觉模型(如 Ultralytics YOLO11等计算机视觉模型如何实现依赖即时预测的应用。

什么是人工智能推理?

推理是使用训练有素的人工智能模型分析新数据,从而做出预测或解决任务的过程。与通过处理大量标注数据来教授模型的训练不同,推理的重点是使用已训练好的模型快速、准确地得出结果。

图 1.了解什么是推论。

例如,在野生动物保护领域,人工智能相机陷阱利用计算机视觉模型对动物进行实时识别和分类。当摄像头检测到动物移动时,人工智能模型会立即识别出是鹿、捕食者,甚至是偷猎者,从而帮助研究人员追踪动物种群并保护濒危物种,而无需人工干预。这种快速识别使实时监控和快速应对潜在威胁成为可能。

了解推理引擎

经过训练的机器学习模型并不总是可以以原始形式部署。推理引擎是一种专门的软件或硬件工具,旨在高效执行机器学习模型并对其进行优化,以便在现实世界中部署。它使用模型压缩、量化和图转换等优化技术来提高性能和减少资源消耗,使模型可以在各种环境中部署。 

推理引擎的核心是降低计算开销、减少延迟和提高效率,从而实现快速准确的预测。一旦优化完成,引擎就会在新数据上执行模型,从而高效地生成实时推断。这种优化可确保人工智能模型在高性能云服务器和资源受限的边缘设备(如智能手机、物联网设备和嵌入式系统)上顺利运行。

推理延迟导致的问题

推理延迟是指人工智能系统接收输入数据(如来自摄像头的图像)和产生输出(如检测图像中的物体)之间的时间延迟。即使是很小的延迟也会严重影响实时人工智能应用的性能和可用性。

推理延迟发生在三个关键阶段:

  • 预处理时间:预处理时间:将输入数据输入模型前所需的准备时间。这包括调整图像大小以匹配模型的输入尺寸、对像素值进行归一化以提高精确度,以及转换格式(如将 RGB 转换为灰度或将视频转换为帧序列)。
  • 计算时间:模型执行推理所需的实际时间。这涉及深度网络中的分层计算、矩阵乘法、卷积以及内存和处理单元之间的数据传输等操作。
  • 后处理时间:将原始模型输出转换为有意义的结果所需的时间。这可能包括在物体检测中绘制边界框,在图像识别中过滤误报,或在异常检测中应用阈值。

推理延迟在实时应用中至关重要。例如,在装配线的自动缺陷检测中,计算机视觉可用于在产品沿着传送带移动时对其进行检测。 

系统必须在产品进入下一阶段之前快速识别和标记缺陷。如果模型处理图像的时间过长,则可能无法及时发现缺陷项目,从而导致材料浪费、返工成本高昂或有问题的产品到达客户手中。通过减少延迟,制造商可以改进质量控制、提高效率并减少损失。

如何减少推理延迟

在许多计算机视觉应用中,保持最小的推理延迟至关重要。要做到这一点,可以使用各种技术。下面我们就来讨论一些最常用的减少推理延迟的技术。

模型修剪

模型剪枝通过删除不必要的连接(权重)来简化神经网络,使其更小更快。这一过程可减轻模型的计算负荷,在提高速度的同时不会对准确性造成太大影响。 

通过只保留最重要的连接,剪枝可确保高效推理和更好的性能,尤其是在处理能力有限的设备上。它被广泛应用于移动人工智能、机器人和边缘计算等实时应用中,在提高效率的同时保持可靠性。

图 2.使用模型剪枝消除效果较差的连接。

模型量化

模型量化是一种技术,它通过简化计算所用的数字,使人工智能模型运行得更快,使用的内存更少。通常,这些模型使用 32 位浮点数,这些数字非常精确,但需要大量的处理能力。量化将这些数字简化为 8 位整数,更易于处理,占用的空间也更小。 

图 3.使用模型量化将浮点数值转换为整数表示。

使用高效模型

人工智能模型的设计对其预测速度有很大影响。像YOLO11 这样为高效推理而设计的模型,非常适合对处理速度要求极高的应用。

在构建人工智能解决方案时,根据可用资源和性能需求选择合适的模型非常重要。如果一开始使用的模型太重,就很可能遇到处理时间慢、功耗高、难以在资源有限的设备上部署等问题。轻量级模型可确保性能流畅,尤其适用于实时和边缘应用。

速度与准确性:优化实时推理

虽然有各种技术可以减少延迟,但实时推理的一个关键部分是平衡速度和准确性。仅仅提高模型的速度是不够的,还需要在不影响准确性的前提下优化推理速度。推理速度快但预测错误的系统是无效的。这就是为什么全面测试对于确保模型在实际情况下表现良好至关重要。如果一个系统在测试过程中看起来很快,但在实际情况下却失效了,那么这个系统就没有得到真正的优化。

利用实时推理的视觉人工智能应用

接下来,让我们来看看一些真实世界的应用,在这些应用中,实时推理技术通过实现对视觉输入的即时响应,正在改变着各行各业。

零售店的自助收银系统

像YOLO11 这样的计算机视觉模型可以更快、更准确地识别商品,从而帮助改进自助结账系统。YOLO11 支持对象检测和实例分割等各种计算机视觉任务,即使条形码丢失或损坏,也能识别商品。视觉人工智能可以减少人工输入,加快结账流程。

除产品识别外,计算机视觉还可集成到自助结账系统中,以核实价格、防止欺诈并提高客户便利性。人工智能驱动的摄像头可以自动区分同类产品,并检测结账时的可疑行为。这包括识别 "非扫描 "行为,即顾客或收银员无意中遗漏了一件商品,以及更多蓄意欺诈行为,如 "商品调包",即在更贵的商品上贴上更便宜的条形码。

图 4.人工智能可以增强自助结账柜台的功能。

美国大型零售商克罗格就是一个很好的例子,它将计算机视觉和人工智能集成到了自助结账系统中。通过实时视频分析,克罗格能够自动纠正 75% 以上的结账错误,从而改善了客户体验和商店运营。

利用计算机视觉进行质量检测

为控制质量而对产品进行人工检测不仅速度慢,而且不一定准确。因此,越来越多的制造商开始转向使用计算机视觉的视觉检测工作流程,以便在生产过程中更早地发现缺陷。

高分辨率摄像头和视觉人工智能可以发现人类可能会忽略的微小瑕疵,YOLO11 等机型可以帮助进行实时质量检查、分类和计数,以确保只有完美的产品才能送到客户手中。这一过程的自动化可以节省时间、降低成本、减少浪费,使生产更加顺畅、高效。

图 5.使用YOLO11 对装配线上的产品进行计数的示例。

主要收获

实时推理有助于人工智能模型做出即时决策,这在许多行业都至关重要。无论是自动驾驶汽车避免事故、医生快速分析医疗扫描结果,还是工厂检测产品缺陷,快速准确的人工智能响应都能发挥巨大作用。

通过提高人工智能模型的速度和效率,我们可以创建更智能、更可靠的系统,在现实世界中无缝运行。随着技术的进步,实时人工智能解决方案将继续塑造未来,使日常流程更快、更安全、更高效。

要了解更多信息,请访问我们的GitHub 存储库并与我们的社区互动。在我们的解决方案页面,探索自动驾驶汽车中的人工智能农业中的计算机视觉等领域的创新。查看我们的许可选项,将您的视觉人工智能项目付诸实践。

Facebook 徽标Twitter 徽标LinkedIn 徽标复制链接符号

在此类别中阅读更多内容

让我们共同打造人工智能的未来

开始您的未来机器学习之旅