2025 年人工智能趋势：今年值得关注的创新

探索 2025 年计算机视觉和人工智能的主要趋势，从 AGI 进步到自我监督学习，塑造智能系统的未来。

撰写人

Abdelrahman Elgendy

分钟阅读

2025 年 2 月 18 日

2025 年 4 月 3 日

人工智能（AI）正以前所未有的速度发展，其突破性进展影响着各行各业并重新定义着技术。进入 2025 年，人工智能创新将继续突破界限，从提高可访问性到改进人工智能模型的学习和交互方式。

最重要的发展之一是人工智能模型的效率不断提高。更低的训练成本和优化的架构使人工智能更容易获得，让企业和研究人员能够以更少的资源部署高性能模型。此外，自监督学习和可解释的人工智能等趋势正在使人工智能系统变得更加强大、可解释和可扩展。

在计算机视觉领域，视觉转换器（ViTs）、边缘人工智能和 3D 视觉等新方法正在推进实时感知和分析。这些技术为自动化、医疗保健、可持续发展和机器人技术带来了新的可能性，使计算机视觉比以往任何时候都更加高效和强大。

在本文中，我们将探讨 2025 年全球五大人工智能趋势和五大计算机视觉趋势，重点介绍Ultralytics YOLO 模型等计算机视觉先进技术如何帮助推动这些变化向前发展。

2025 年人工智能的五大趋势

各行各业都在加速采用人工智能，新的进步提高了模型效率、决策和道德考量。从降低培训成本到提高可解释性，人工智能正朝着更可扩展、更透明、更易获取的方向发展。

人工智能的可及性和较低的培训成本

人工智能的普及正在改变模型的训练和部署方式。模型架构和硬件效率的提高大大降低了大规模人工智能系统的训练成本，使更多用户可以使用这些系统。

例如，Ultralytics 的最新计算机视觉模型Ultralytics YOLO11 在 COCO 数据集上实现了更高的平均精度 (mAP)，而使用的参数却比Ultralytics YOLOv8 少 22%。

这使其在保持高精确度的同时，还能提高计算效率。随着人工智能模型变得越来越轻量级，企业和研究人员无需大量计算资源即可利用这些模型，从而降低了进入门槛。

图 1. YOLO11 表现优于之前的模型，以减少 22% 的参数实现了更高的 mAP。

‍

人工智能技术的普及促进了各行各业的创新，使初创企业和小型企业能够开发和部署曾经属于大型企业领域的人工智能解决方案。培训成本的降低也加快了迭代周期，使人工智能模型的实验和完善更加迅速。

人工智能代理和人工通用智能（AGI）

人工智能代理正变得越来越先进，为实现人工通用智能（AGI）架起了桥梁。与传统的人工智能系统专为狭窄的任务而设计不同，这些代理可以不断学习，适应动态环境，并根据实时数据做出独立决策。

2025 年，多代理系统--多个人工智能代理合作实现复杂目标--有望变得更加突出。这些系统可以优化工作流程，产生洞察力，并协助各行各业做出决策。例如，在客户服务领域，人工智能代理可以处理错综复杂的咨询，从每次互动中学习，改进未来的回应。在制造业，它们可以监督生产线，实时调整以保持效率并解决潜在的瓶颈问题。在物流领域，多代理人工智能可以动态协调供应链，减少延误并优化资源分配。

‍

通过整合强化学习和自我完善机制，这些人工智能代理正朝着更高的自主性迈进，从而减少复杂操作任务中的人工干预需求。随着多代理人工智能系统的发展，它们可以为更具适应性、可扩展性和智能化的自动化铺平道路，进一步提高各行各业的效率。

生成虚拟游乐场

人工智能生成的虚拟环境正在改变机器人、自主系统和数字助理的训练方式。生成式虚拟游戏场允许人工智能模型模拟真实世界的场景，在部署前提高其适应性。

例如，自动驾驶汽车是在人工智能生成的环境中进行训练的，这些环境模拟了不同的天气条件、道路场景和行人互动。同样，自动化工厂中的机械臂在实际环境中运行之前，也要在模拟生产线上接受训练。

通过使用这些虚拟学习空间，人工智能系统可以减少对成本高昂的现实世界数据收集的依赖，从而加快模型迭代，提高对新情况的适应能力。这种方法不仅能加快开发速度，还能确保人工智能代理更好地应对现实世界应用的复杂性。

有道德和负责任的人工智能

随着人工智能越来越多地参与决策过程，围绕偏见、隐私和责任的伦理问题变得越来越重要。人工智能模型需要确保公平、透明和符合法规，尤其是在医疗保健、金融和招聘等敏感行业。

2025 年，我们预计会有更严格的法规，并更加强调负责任的人工智能，推动企业开发可解释和可审计的模型。积极采用道德人工智能框架的企业将赢得消费者的信任，满足合规要求，并确保人工智能应用的长期可持续性。

可解释的人工智能（XAI）

随着人工智能模型日益复杂，可解释性正成为重中之重。可解释的人工智能（XAI）旨在使人工智能系统更加透明，确保人类能够理解其决策过程。

在医疗和金融等行业，人工智能的建议会影响到事关重大的决策，因此 XAI 可能会成为一个强大的工具。将人工智能用于诊断成像的医院和依靠人工智能简化工作流程的银行，都需要能够提供可解释见解的模型，让利益相关者了解决策的原因。

通过实施 XAI 框架，企业可以建立对人工智能模型的信任，提高监管合规性，并确保自动化系统保持可问责性。

2025 年计算机视觉人工智能的五大趋势

计算机视觉技术发展迅速，新技术提高了各行各业的准确性、效率和适应性。随着人工智能驱动的视觉系统变得更具可扩展性和通用性，它们正在为自动化、医疗保健、可持续发展和机器人技术带来新的可能性。

2025 年，自监督学习、视觉转换器和边缘人工智能等先进技术有望提升机器感知、分析和与世界交互的能力。这些创新将继续推动实时图像处理、物体检测和环境监测的发展，使人工智能驱动的视觉系统更高效、更易于在各行各业使用。

自我监督学习

传统的人工智能训练依赖于大型标记数据集，而这些数据集的整理既耗时又昂贵。自监督学习（SSL）使人工智能模型能够从无标记数据中学习模式和结构，从而降低了这种依赖性，使其更具可扩展性和适应性。

在计算机视觉领域，SSL 对于标注数据稀缺的应用尤其有价值，例如医疗成像、制造缺陷检测和自主系统。通过从原始图像数据中学习，模型可以完善其对物体和模式的理解，而无需人工标注。

例如，计算机视觉模型可以利用自我监督学习来提高物体检测性能，即使是在较小或噪音较大的数据集上进行训练时也是如此。这意味着人工智能驱动的视觉系统可以在不同的环境中运行，只需最少的再训练，提高了它们在机器人、农业和智能监控等行业中的灵活性。

随着 SSL 的不断成熟，它将实现高性能人工智能模型的普及，降低训练成本，使人工智能驱动的视觉系统更加强大，并可在各行各业扩展。

视觉变压器（ViT）

视觉变换器（ViT）正在成为图像分析的强大工具，与卷积神经网络（CNN）一起为处理视觉数据提供了另一种有效方法。然而，与使用固定感受野处理图像的 CNN 不同，ViT 利用自我注意机制捕捉整个图像的全局关系，从而改进了远距离特征提取。

ViT 在图像分类、物体检测和分割方面表现出色，尤其是在需要高分辨率细节的应用中，如医学成像、遥感和质量检测。它们能够整体处理整个图像，因此非常适合空间关系至关重要的复杂视觉任务。

计算成本一直是 ViT 面临的最大挑战之一，但最近的技术进步提高了 ViT 的效率。2025 年，我们可以预期优化的 ViT 架构将得到更广泛的采用，尤其是在需要实时处理的边缘计算应用中。

随着 ViT 和 CNN 的并肩发展，人工智能驱动的视觉系统将变得更加多才多艺、能力更强，从而为自主导航、工业自动化和高精度医疗诊断带来新的可能性。

3D 视觉和深度估计

计算机视觉的发展已经超越了二维图像分析，三维视觉和深度估计使人工智能模型能够更准确地感知空间关系。这一进步对于机器人、自动驾驶汽车和增强现实（AR）等需要精确深度感知的应用至关重要。

传统的深度估算方法依赖于立体相机或激光雷达传感器，而现代人工智能驱动的方法则使用单目深度估算和多视角重构来从标准图像中推断深度。这可以实现实时三维场景理解，使人工智能系统在动态环境中更具适应性。

‍

例如，在自主导航中，三维视觉通过提供周围环境的详细深度图，增强了障碍物探测和路径规划能力。在工业自动化领域，配备 3D 感知功能的机器人可以更精确地操控物体，从而提高制造、物流和仓储自动化的效率。

此外，AR 和 VR 应用也受益于人工智能驱动的深度估算，通过将虚拟物体精确映射到物理空间，实现更身临其境的体验。随着深度感知视觉模型变得更加轻便和高效，预计其在消费电子、安防和遥感领域的应用将越来越广泛。

高光谱成像和多光谱分析

人工智能驱动的高光谱和多光谱成像技术通过分析可见光谱以外的光线，正在改变农业、环境监测和医疗诊断。与捕捉红、绿、蓝（RGB）波长的传统相机不同，高光谱成像可捕捉数百个光谱波段，为材料特性和生物结构提供丰富的洞察力。

在精准农业领域，高光谱成像技术可以评估土壤健康状况、监测植物病害和检测养分不足。农民可以利用人工智能驱动的模型实时分析作物状况，优化灌溉和杀虫剂的使用，同时提高总体产量效率。

‍

在医学成像领域，高光谱分析正被用于早期疾病检测，特别是癌症诊断和组织分析。通过检测生物成分的细微变化，人工智能驱动的成像系统可以帮助进行早期诊断，改善患者的预后。

随着高光谱成像硬件变得更加小巧、更具成本效益，人工智能驱动的分析工具将在各行各业得到更广泛的应用，从而提高农业、自然保护和医疗保健的效率。

用于实时人工智能视觉的边缘计算

人工智能正在向边缘靠拢，计算机视觉模型可直接在无人机、安全摄像头和工业传感器等边缘设备上运行。通过在本地处理数据，边缘人工智能减少了延迟，提高了安全性，并最大限度地减少了对云计算的依赖。

边缘计算的一个关键优势是它能够在云连接有限或不切实际的环境中实现实时决策。例如，农业领域的边缘人工智能可以部署在无人机上，实时监测作物健康状况、检测虫害和评估土壤条件。通过直接在无人机上处理数据，这些系统可以为农民提供即时见解，优化资源利用，提高产量效率，而无需依赖持续的云连接。

‍

像YOLO11 这样针对轻量级部署进行了优化的型号，能够在边缘设备上实现高速、实时的物体检测，是低功耗环境的理想选择。随着边缘人工智能的能效和成本效益不断提高，我们期待在自主无人机、机器人和基于物联网的监控系统中得到更广泛的应用。

通过将边缘计算与人工智能驱动的视觉相结合，各行业可以实现更高的可扩展性、更快的响应速度和更强的安全性，使实时人工智能视觉成为 2025 年自动化的基石。

主要收获

随着人工智能和计算机视觉的不断发展，这些趋势将塑造自动化、无障碍和智能决策的未来。从自我监督学习到边缘计算，人工智能驱动的系统正在各行各业变得更加高效、可扩展和自适应。

在计算机视觉领域，视觉变换器、三维感知和高光谱成像的采用将扩大人工智能在医疗成像、自主系统和环境监测中的作用。这些进步凸显了人工智能驱动的视觉如何超越传统应用，在现实世界场景中实现更高的效率和准确性。

无论是改善实时人工智能视觉、提高可解释性，还是实现更智能的生成环境，这些趋势都凸显了人工智能对创新和可持续发展日益增长的影响。

探索YOLO 模型如何推动从农业到医疗保健等各行各业的进步。访问我们的GitHub 存储库，了解最新进展，加入我们的社区，与人工智能爱好者和专家合作。查看我们的许可选项，立即开始您的 Vision AI 项目。

2025 年人工智能趋势：今年值得关注的创新