术语表

GPU (图形处理器)

了解 GPU 如何通过加速深度学习、优化工作流程和支持现实世界的应用,彻底改变人工智能和机器学习。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

图形处理器GPU)是一种专用电子电路,最初设计用于加速图像、视频和动画的创建和渲染。GPU 起源于游戏和图形设计行业,其独特的架构使其成为现代人工智能(AI)和机器学习(ML)领域不可或缺的工具。GPU 拥有数千个并行工作的处理内核,可以同时处理大量计算。这种能力非常适合深度学习算法中对计算要求极高的任务,能够实现更快的模型训练和高效的实时推理。了解 GPU的演变过程,就能了解 GPU目前在人工智能领域发挥的作用。

人工智能和机器学习的重要性

GPU 的并行处理能力是最近人工智能领域取得突破的主要催化剂。训练深度神经网络需要处理庞大的数据集和执行无数复杂的数学运算,如矩阵乘法。GPU 擅长这些运算,与传统的中央处理器(CPU)相比,大大缩短了训练模型所需的时间。这种加速功能使人工智能开发领域的研究人员和开发人员能够更快地迭代、试验更大更复杂的模型,并在物体检测图像分割等任务中实现更高的精度

以下是 GPU 在现实世界中的 AI/ML 应用的两个例子:

  1. 实时物体检测: Ultralytics YOLO 模型以速度和效率著称,在自动驾驶、安全监控(增强安全系统)和机器人等应用中,主要依靠 GPU 来实时执行物体检测。GPU 的并行特性使这些模型能够快速处理视频帧,并同时准确识别多个物体。探索通过GPU 加速实现的各种YOLO11 应用
  2. 大型模型训练:训练大型语言模型(LLM)或复杂的计算机视觉模型通常需要强大的计算能力,而这些能力通常可以通过云计算平台获得。Ultralytics HUB Cloud Training等服务利用AWSGoogle CloudAzure等提供商提供的强大GPU 集群,在庞大的数据集上训练模型,以完成从自然语言处理 (NLP)到高级医学图像分析等各种任务。

与 CPU 和 TPU 的主要区别

虽然 GPU、CPUTensor 处理单元 (TPU)都属于处理器类型,但它们的优势各不相同,并针对不同的任务进行了优化:

  • CPU (CPU ):专为通用计算而设计,擅长处理顺序任务和管理系统操作。CPU 拥有几个功能强大的内核,并针对低延迟进行了优化。查看CPU 与GPU 概述
  • 图形处理器(GPU ):针对并行操作进行了优化,拥有数千个更简单的内核。非常适合可同时分解和处理的任务,如渲染图形和训练深度学习模型。衡量性能通常涉及FLOPS 等指标。
  • TPU (Tensor 处理单元): Google定制设计的专用集成电路(ASIC),专门用于使用 TensorFlow框架加速机器学习工作负载。它们针对神经网络中常见的大规模矩阵运算进行了高度优化。了解更多Google TPU 详情

GPU 兼顾了并行处理任务的高性能和各种应用的多功能性,因此成为许多人工智能和高性能计算 (HPC)工作负载的热门选择。

生态系统和使用

强大的软件生态系统为 GPU 在人工智能领域的广泛应用提供了支持。主要制造商如 NVIDIAAMD等主要制造商都提供了适用于人工智能任务的 GPU。NVIDIA公司的 CUDA(计算统一设备架构)平台是NVIDIA (NVIDIA ®)GPU 广泛使用的并行计算平台和编程模型。深度学习框架,如 PyTorch和TensorFlow 等深度学习框架进行了优化,以充分利用GPU 加速。使用 Docker 等容器化工具可以简化GPU开发环境的设置;有关设置说明,请参阅Ultralytics Docker 快速入门指南。高效的模型部署通常需要对模型进行优化,以便在目标GPU 硬件上有效运行。探索各种利用GPU 功能的Ultralytics 解决方案

阅读全部