遇见 YOLO26: 下一代视觉 AI。
Ultralytics
视觉 AI

2025 年 AI 趋势:今年值得关注的创新

发现 2025 年的顶级计算机视觉和 AI 趋势,从 AGI 进步到自监督学习,它们共同塑造智能系统的未来。

ABAbdelrahman Elgendy
5 min read
塑造 2025 年的顶级 AI 和计算机视觉趋势

人工智能 (AI) 正在以空前的速度发展,突破性的进展正在重塑各行各业并重新定义技术。随着我们步入 2025 年,AI 创新将继续突破界限,从提高易用性到优化 AI 模型的学习与交互方式。

最显著的发展之一是 AI 模型效率的提升。更低的训练成本和优化的架构使 AI 变得更加易于使用,让企业和研究人员能够以更少的资源部署高性能模型。此外,自监督学习和可解释 AI 等趋势正在使 AI 系统变得更加稳健、可解释且可扩展。

计算机视觉 领域,视觉 Transformer (ViTs)、边缘 AI 和 3D 视觉等新方法正在推动实时感知与分析的发展。这些技术正在自动化、医疗保健、可持续发展和机器人技术领域开启新的可能,使计算机视觉比以往任何时候都更加高效和强大。

在本文中,我们将探讨 2025 年定义 AI 的五大全球 AI 趋势和五大计算机视觉趋势,并重点介绍像 Ultralytics YOLO 模型这样的计算机视觉进展如何推动这些变革。

Link to this section2025 年五大 AI 趋势#

AI 在各行各业的采用正在加速,新的进展正在提升模型效率、决策能力和伦理考量。从降低训练成本到提高可解释性,AI 正在演进以变得更加可扩展、透明和易用。

Link to this sectionAI 的易用性与更低的训练成本#

AI 日益增强的易用性正在改变模型的训练和部署方式。模型架构和硬件效率的改进显著降低了大规模 AI 系统的训练成本,使更多的用户能够使用这些系统。

例如,Ultralytics 推出的最新计算机视觉模型 Ultralytics YOLO11,在 COCO 数据集上实现了更高的平均精度均值 (mAP),而参数量却比 Ultralytics YOLOv8 少 22%。

这使其在保持高精度的同时实现了计算效率。随着 AI 模型变得更加轻量化,企业和研究人员无需庞大的计算资源即可利用它们,从而降低了准入门槛。

图表显示 YOLO11 以减少 22% 的参数量实现了更高的 mAP

图 1. YOLO11 优于之前的模型,以减少 22% 的参数量实现了更高的 mAP。

这种 AI 技术易用性的提高正在促进各行各业的创新,使初创企业和小型企业能够开发和部署曾经仅由大公司掌握的 AI 解决方案。训练成本的降低也加速了迭代周期,从而能够对 AI 模型进行更快速的实验和优化。

Link to this sectionAI 智能体与通用人工智能 (AGI)#

AI 智能体 正在变得更加先进,正缩小与通用人工智能 (AGI) 之间的差距。与为单一任务设计的传统 AI 系统不同,这些智能体可以持续学习、适应动态环境,并根据实时数据做出独立决策。

预计在 2025 年,多智能体系统(即多个 AI 智能体协作实现复杂目标)将变得更加突出。这些系统可以优化工作流程、产生见解,并协助各行各业的决策。例如,在客户服务中,AI 智能体可以处理复杂的咨询,从每次交互中学习以改进未来的响应。在制造业中,它们可以监控生产线,实时调整以保持效率并解决潜在的瓶颈。在物流中,多智能体 AI 可以动态协调供应链,减少延迟并优化资源分配。

AI 智能体架构图,从单智能体到层级多智能体系统

图 2. 不同的 AI 智能体架构,从单智能体模型到复杂的层级多智能体系统。

通过整合强化学习和自我改进机制,这些 AI 智能体正朝着更高的自主性发展,减少了复杂操作任务中对人工干预的需求。随着多智能体 AI 系统的进步,它们可能为更具适应性、可扩展性和智能化的自动化铺平道路,从而进一步提高各行各业的效率。

Link to this section生成式虚拟游乐场#

AI 生成的虚拟环境正在改变机器人、自主系统和数字助理的训练方式。生成式虚拟游乐场 允许 AI 模型模拟真实世界的场景,在部署前提高它们的适应性。

例如,自动驾驶汽车在模拟多变天气条件、道路场景和行人交互的 AI 生成环境中进行训练。同样,自动化工厂中的机械臂在进入物理环境运行之前,也会在模拟生产线上进行训练。

通过利用这些虚拟学习空间,AI 系统可以减少对昂贵的真实世界数据采集的依赖,从而实现更快的模型迭代,并增强对新奇情况的韧性。这种方法不仅加速了开发,还确保 AI 智能体能更好地应对现实应用中的复杂性。

Link to this section伦理与负责任的 AI#

随着 AI 越来越多地参与决策过程,围绕偏差、隐私和问责制的伦理担忧正变得愈发重要。AI 模型需要确保公平性、透明度和法规合规性,特别是在医疗保健、金融和招聘等敏感行业中。

我们预计在 2025 年将会有更严格的法规,并更加强调负责任的 AI,这将促使企业开发可解释且可审计的模型。积极采用伦理 AI 框架的企业将获得消费者信任,满足合规要求,并确保 AI 采用的长期可持续性。

Link to this section可解释 AI (XAI)#

随着 AI 模型日益复杂,可解释性正成为首要优先级。可解释 AI (XAI) 旨在提高 AI 系统的透明度,确保人类能够理解其决策过程。

在医疗和金融等行业,AI 的建议会影响高风险决策,因此 XAI 可能成为一种强大的工具。使用 AI 进行诊断成像的医院和依赖 AI 简化工作流程的银行,将需要能够提供可解释性见解的模型,让利益相关者理解做出某项决策的原因。

通过实施 XAI 框架,组织可以建立对 AI 模型的信任,改进监管合规性,并确保自动化系统保持问责制。

Link to this section2025 年五大计算机视觉 AI 趋势#

计算机视觉正在迅速发展,新的技术提高了各行各业的准确性、效率和适应性。随着 AI 驱动的视觉系统变得更加可扩展和通用,它们正在自动化、医疗保健、可持续发展和机器人技术领域开启新的可能。

在 2025 年,自监督学习、视觉 Transformer 和边缘 AI 等进展预计将增强机器感知、分析和与世界交互的方式。这些创新将继续推动实时图像处理、目标检测和环境监测,使 AI 驱动的视觉系统在各行各业中更加高效和易用。

Link to this section自监督学习#

传统的 AI 训练依赖于大型标注数据集,而这可能既耗时又昂贵。自监督学习 (SSL) 通过使 AI 模型能够从无标注数据中学习模式和结构来减少这种依赖,使其更具可扩展性和适应性。

在计算机视觉中,SSL 对于标注数据稀缺的应用(如医学成像、制造缺陷检测和自主系统)特别有价值。通过学习原始图像数据,模型可以在无需手动标注的情况下改进对对象和模式的理解。

例如,计算机视觉模型可以利用 自监督学习 来提高目标检测性能,即使是在较小或较嘈杂的数据集上训练时也是如此。这意味着 AI 驱动的视觉系统可以在多样化的环境中以最小的重新训练工作量运行,提高了它们在机器人技术、农业和智能监控等行业中的灵活性。

随着 SSL 的持续成熟,它将实现高性能 AI 模型的大众化,降低训练成本,并使 AI 驱动的视觉系统在各行各业中更加稳健和可扩展。

Link to this section视觉 Transformer (ViTs)#

视觉 Transformer (ViTs) 正在成为一种强大的图像分析工具,提供了除卷积神经网络 (CNNs) 之外处理视觉数据的有效途径。然而,与使用固定感受野处理图像的 CNNs 不同,ViTs 利用自注意力机制捕捉整张图像的全局关系,从而改进了长程特征提取。

ViTs 在图像分类、目标检测和分割方面表现出强劲的性能,特别是在需要高分辨率细节的应用中,如医学成像、遥感和质量检测。它们全面处理整张图像的能力使它们非常适合空间关系至关重要的复杂视觉任务。

ViTs 面临的最大挑战之一是其计算成本,但最近的进展已经改善了它们的效率。在 2025 年,我们可以预期优化的 ViT 架构将被更广泛地采用,特别是在实时处理至关重要的边缘计算应用中。

随着 ViTs 和 CNNs 并行演进,AI 驱动的视觉系统将变得更加通用和强大,为自主导航、工业自动化和高精度医学诊断开启新的可能。

Link to this section3D 视觉与深度估计#

计算机视觉正在超越 2D 图像分析,3D 视觉和深度估计 使 AI 模型能够更准确地感知空间关系。这一进展对于需要精确深度感知的应用(如机器人技术、自主车辆和增强现实 (AR))至关重要。

传统的深度估计方法依赖于立体相机或 LiDAR 传感器,但现代 AI 驱动的方法利用单目深度估计和多视图重建从标准图像中推断深度。这实现了实时 3D 场景理解,使 AI 系统在动态环境中更具适应性。

使用 AI 驱动的计算机视觉进行深度估计,可视化空间信息

图 3. 使用 AI 驱动的计算机视觉模型进行深度估计,可视化空间信息。

例如,在自主导航中,3D 视觉通过提供周围环境的详细深度图来增强障碍物检测和路径规划。在工业自动化中,配备 3D 感知能力的机器人可以更精确地操作物体,提高了制造、物流和仓库自动化的效率。

此外,AR 和 VR 应用正在受益于 AI 驱动的深度估计,通过将虚拟物体准确映射到物理空间中,从而实现更沉浸式的体验。随着深度感知视觉模型变得更加轻量化和高效,预计它们在消费电子、安全和遥感领域的采用将会增加。

Link to this section高光谱成像与多光谱分析#

AI 驱动的高光谱和多光谱成像通过分析可见光谱之外的光,正在改变农业、环境监测和医学诊断。与捕捉红、绿、蓝 (RGB) 波长的传统相机不同,高光谱成像捕捉数百个光谱波段,为材料属性和生物结构提供了丰富的见解。

在精准农业中,高光谱成像可以评估土壤健康、监测植物病害并检测营养缺乏。农民可以使用 AI 驱动的模型实时分析作物状况,优化灌溉和农药使用,同时提高整体产量效率。

多光谱和高光谱成像技术的比较

图 4. 多光谱和高光谱成像技术的比较。

在医学影像中,高光谱分析正被探索用于早期疾病检测,特别是在癌症诊断和组织分析方面。通过检测生物组成的微小变化,AI 驱动的成像系统可以辅助早期诊断,从而改善患者的预后。

随着高光谱成像硬件变得更加紧凑和经济高效,AI 驱动的分析工具将在各行各业得到更广泛的采用,提高农业、保护和医疗保健领域的效率。

Link to this section用于实时 AI 视觉的边缘计算#

AI 正在向边缘端靠近,计算机视觉模型直接在 无人机、安全摄像头和工业传感器等边缘设备上运行。通过在本地处理数据,边缘 AI 减少了延迟,增强了安全性,并最小化了对基于云的计算的依赖。

边缘计算的一个关键优势是它能够在云连接受限或不切实际的环境中实现实时决策。例如,农业中的边缘 AI 可以部署在无人机上,用于实时监测作物健康、检测虫害和评估土壤状况。通过直接在无人机上处理数据,这些系统可以在无需持续云连接的情况下为农民提供即时的见解,优化资源使用并提高产量效率。

精准农业中采用边缘 AI 的无人机

图 5. 精准农业中采用边缘 AI 的无人机。

像 YOLO11 这样针对轻量化部署进行优化的模型,能够在边缘设备上实现高速、实时的目标检测,使其成为低功耗环境的理想选择。随着边缘 AI 变得更加节能和经济高效,我们预计在自动无人机、机器人技术和基于 IoT 的监控系统中将会得到更广泛的采用。

通过将边缘计算与 AI 驱动的视觉相结合,各行各业可以实现更高的可扩展性、更快的响应时间和增强的安全性,使实时 AI 视觉成为 2025 年自动化的基石。

Link to this section关键要点#

随着 AI 和计算机视觉的持续进步,这些趋势将塑造自动化、易用性和智能决策的未来。从自监督学习到边缘计算,AI 驱动的系统正在变得更加高效、可扩展且具有适应性。

在计算机视觉领域,视觉 Transformer、3D 感知和高光谱成像的采用将扩大 AI 在医学成像、自主系统和环境监测中的作用。这些进展突显了 AI 驱动的视觉如何超越传统应用,在现实场景中实现更高的效率和准确性。

无论是改进实时 AI 视觉、增强可解释性,还是开启更智能的生成式环境,这些趋势都强调了 AI 对创新和可持续发展的日益增长的影响。

了解 YOLO 模型如何推动各行各业的进步,从 农业医疗保健。访问我们的 GitHub 仓库 以探索最新进展,并加入 我们的社区 与 AI 爱好者和专家交流。查看我们的 许可选项,立即开始你的视觉 AI 项目。

Explore solutions

Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多
Real-time AI that works with your team

机器人技术中的 AI

使用 Ultralytics YOLO 模型为智能机器赋能。机器人技术中的视觉 AI 可推动自主导航、感知、物体跟踪和实时控制。

了解更多
Real-time AI that works with your team

物流中的 AI

使用 Ultralytics YOLO 模型简化物流。视觉 AI 可实现包裹检查、分拣、车辆跟踪和实时仓库安全监控。

了解更多
Real-time AI that works with your team

零售业 AI

使用 Ultralytics YOLO 模型重塑零售业。视觉 AI 推动库存跟踪、货架监控、队列管理和更智能的客户洞察。

了解更多
Real-time AI that works with your team

医疗保健中的 AI

利用 Ultralytics YOLO 模型构建医疗保健解决方案。医疗保健中的视觉 AI 可助力更快速的医学影像分析、更智能的诊断和患者监测。

了解更多
Real-time AI that works with your team

制造业中的 AI

使用 Ultralytics YOLO 模型优化制造业。视觉 AI 推动质量控制、缺陷检测、PPE 合规性和装配线自动化。

了解更多
Real-time AI that works with your operation

汽车中的 AI

将计算机视觉应用于汽车行业,并配合 Ultralytics YOLO 模型。汽车视觉 AI 可提升道路安全、辅助驾驶和车辆自动化,打造更智能的道路。

了解更多
Real-time AI tailored to your operation

农业中的 AI

借助 Ultralytics YOLO 模型,将视觉 AI 引入智慧农业。赋能作物监测、牲畜追踪和精准农业,实现更高、更智能的产量。

了解更多

让我们一起构建 AI 的未来!

开启你的机器学习未来之旅