绿色检查
链接复制到剪贴板

将计算机视觉与 UltalyticsYOLO11集成到机器人技术中

近距离了解Ultralytics YOLO11 等计算机视觉模型如何让机器人变得更加智能,并塑造机器人技术的未来。

自 20 世纪 50 年代发明第一台工业机器人 Unimate 以来,机器人已经取得了长足的进步。从最初的预编程、基于规则的机器,到现在能够执行复杂任务并与现实世界无缝互动的智能系统。 

如今,从制造业、医疗保健到农业,各行各业都在使用机器人,实现各种流程自动化。机器人技术发展的一个关键因素是人工智能和计算机视觉,这是人工智能的一个分支,可帮助机器理解和解释视觉信息。

例如,计算机视觉模型 Ultralytics YOLO11等计算机视觉模型正在提高机器人系统的智能。将视觉人工智能集成到这些系统中后,机器人就能识别物体、导航环境并做出实时决策。

在本文中,我们将了解YOLO11 如何利用先进的计算机视觉功能增强机器人,并探讨其在各行各业的应用。

机器人技术中的人工智能和计算机视觉概述

机器人的核心功能取决于它对周围环境的了解程度。这种意识将物理硬件与智能决策联系起来。没有这种意识,机器人只能遵循固定的指令,难以适应不断变化的环境或处理复杂的任务。正如人类依靠视觉来导航一样,机器人利用计算机视觉来解读环境、了解情况并采取适当的行动。

图 1.一个机器人在玩井字游戏,利用计算机视觉解读棋盘并采取战略行动。

事实上,计算机视觉是大多数机器人任务的基础。它可以帮助机器人在移动过程中探测物体并避开障碍物。然而,要做到这一点,仅仅看到世界是不够的;机器人还必须能够迅速做出反应。在现实世界中,即使是轻微的延迟也会导致代价高昂的错误。Ultralytics YOLO11 等模型使机器人能够实时收集洞察力,即使在复杂或陌生的情况下也能立即做出反应。

了解Ultralytics YOLO11

在深入探讨如何将YOLO11 集成到机器人系统中之前,我们先来了解一下YOLO11的主要功能。

Ultralytics YOLO 模型支持各种计算机视觉任务,有助于提供快速、实时的洞察力。其中,Ultralytics YOLO11 性能更快、计算成本更低、精度更高。例如,它可用于高精度地检测图像和视频中的物体,因此非常适合机器人、医疗保健和制造业等领域的应用。 

以下是使YOLO11 成为机器人技术最佳选择的一些具有影响力的功能:

  • 易于部署:
  • 适应性强: YOLO11 在不同的环境和硬件设置下都能很好地工作,即使在动态条件下也能提供一致的性能。

用户友好: YOLO11易于理解的文档和界面有助于降低学习曲线,使其易于集成到机器人系统中。

图 2.使用YOLO11 分析图像中人物姿势的示例。

探索由YOLO11支持的计算机视觉任务YOLO11

下面我们将详细介绍YOLO11 支持的一些计算机视觉任务: 

  • 对象检测:YOLO11 的实时物体检测功能可让机器人即时识别和定位视野内的物体。这有助于机器人避开障碍物,执行动态路径规划,并在室内和室外环境中实现自动导航。
  • 实例分割:通过识别单个物体的准确边界和形状,YOLO11 可帮助机器人执行精确的拾放操作和复杂的装配任务。
  • 姿势估计:YOLO11支持姿势估计,使机器人能够识别和解释人类的肢体动作和手势。这对于协作机器人(cobots)安全地与人类一起工作至关重要。
  • 对象跟踪:
    YOLO11
  • 图像分类:YOLO11 可以对图像中的物体进行分类,让机器人可以根据物体类型对物品进行分类、检测异常或做出决策,例如识别医疗保健环境中的医疗用品。
图 3. YOLO11 支持的计算机视觉任务。

人工智能在机器人技术中的应用:由YOLO11提供技术支持

从智能学习到工业自动化,YOLO11 等模型有助于重新定义机器人的功能。它与机器人技术的结合展示了计算机视觉模型如何推动自动化领域的进步。让我们探讨一下YOLO11 能够产生重大影响的一些关键领域。

利用计算机视觉对机器人进行教学 

计算机视觉被广泛应用于仿人机器人,使其能够通过观察环境进行学习。像YOLO11 这样的模型可以提供先进的物体检测和姿态估计,帮助机器人准确解读人类的动作和行为,从而有助于加强这一过程。

通过实时分析机器人的细微动作和互动,可以训练机器人复制复杂的人类任务。这样,机器人就能超越预先编程的程序,只需观察人就能学会使用遥控器或螺丝刀等任务。

图 4.模仿人类动作的机器人。

这种学习方式在不同行业都很有用。例如,在农业领域,机器人可以观察人类工人学习种植、收割和管理农作物等任务。通过模仿人类完成这些任务的方式,机器人可以适应不同的耕作条件,而无需针对每种情况进行编程。

与医疗保健机器人相关的应用

同样,在医疗保健领域,计算机视觉也变得越来越重要。例如,YOLO11 可用于医疗设备,帮助外科医生完成复杂的手术。通过物体检测和实例分割等功能,YOLO11 可以帮助机器人发现身体内部结构、管理手术工具并进行精确的移动。

虽然这听起来像是科幻小说中的情节,但最近的研究证明了计算机视觉在外科手术中的实际应用。在一项关于自主机器人胆囊切除术(胆囊切除)的有趣研究中,研究人员将YOLO11 集成到组织分割 (对图像中的不同组织进行分类和分离)和手术器械关键点检测(识别工具上的特定地标)中。 

该系统能够准确区分不同的组织类型,即使在手术过程中组织发生变形(形状改变),也能根据这些变化进行动态调整。这使得机器人器械能够遵循精确的解剖(手术切割)路径。

智能制造和工业自动化

能够拾取和放置物品的机器人在制造操作自动化和优化供应链方面发挥着关键作用。机器人的速度和准确性使其能够以最小的人力投入执行任务,例如识别和分类物品。 

利用YOLO11的精确实例分割功能,可以训练机械臂检测和分割传送带上移动的物体,准确地拾取它们,并根据其类型和大小将它们放置到指定位置。

例如,流行的汽车制造商正在使用基于视觉的机器人来组装不同的汽车零件,从而提高装配线的速度和精度。像YOLO11 这样的计算机视觉模型可以让这些机器人与人类工人一起工作,确保自动化系统在动态生产环境中的无缝集成。这一进步可以加快生产速度,减少错误,提高产品质量。

图 5.基于视觉的机械臂正在组装汽车。

将Ultralytics YOLO11 集成到机器人技术中的优势

YOLO11 具有多项主要优势,是无缝集成到自主机器人系统的理想选择。以下是一些主要优势:

  • 推理延迟:
    YOLO11
  • 轻量级型号
    YOLO11
  • 节能: YOLO11 采用节能设计,非常适合需要在保持高性能的同时节约电能的电池供电机器人。

机器人视觉人工智能的局限性

虽然计算机视觉模型为机器人视觉提供了强大的工具,但在将其集成到现实世界的机器人系统中时,还需要考虑一些局限性。这些限制包括

  • 昂贵的数据收集:针对机器人特定任务训练有效的模型通常需要大量、多样化和标记良好的数据集,而获取这些数据集的成本很高。
  • 环境变化:机器人在不可预测的环境中工作,照明条件或杂乱的背景等因素都会影响视觉模型的性能。
  • 校准和对齐问题: 确保视觉系统得到正确校准并与机器人的其他传感器对齐,对于实现准确的性能至关重要,不对齐会导致决策失误。

机器人技术和人工智能发展的未来

计算机视觉系统不仅是当今机器人的工具,也是未来机器人自主运行的基石。凭借实时检测能力和对多种任务的支持,它们是下一代机器人技术的完美选择。

事实上,当前的市场趋势表明,计算机视觉在机器人技术中正变得越来越重要。行业报告强调,计算机视觉是全球人工智能机器人市场中使用第二广泛的技术。 

图 6.按技术划分的全球人工智能机器人市场份额。

主要收获

凭借处理实时视觉数据的能力,YOLO11 可以帮助机器人更准确地检测、识别周围环境并与之互动。这对于机器人可以与人类协作的制造业和可以协助复杂手术的医疗保健业等领域而言,意义重大。 

随着机器人技术的不断进步,将计算机视觉集成到此类系统中对于使机器人更高效地处理各种任务至关重要。随着人工智能和计算机视觉技术的发展,机器人将变得更加智能、适应性更强,机器人技术的未来将充满希望。

加入我们的社区,查看我们的GitHub 存储库,了解有关人工智能最新发展的更多信息。在我们的解决方案页面上探索人工智能在医疗保健计算机视觉在农业中的各种应用。查看我们的许可计划,构建您自己的计算机视觉解决方案。

Facebook 徽标Twitter 徽标LinkedIn 徽标复制链接符号

在此类别中阅读更多内容

让我们共同打造人工智能的未来

开始您的未来机器学习之旅