术语表

图形处理器(GPU)

了解 GPU 如何通过加速深度学习、优化工作流程和支持现实世界的应用,彻底改变人工智能和机器学习。

图形处理器(GPU)是一种专用电子电路,最初设计用于加速图像、视频和动画的创建和渲染,以便显示。然而,它的高度并行架构使其在同时处理大数据块时异常高效。这种能力使 GPU 成为现代人工智能(AI)机器学习(ML)的主力军,大大加快了训练复杂模型所需的时间,并使开发更复杂的人工智能解决方案成为可能。

图形处理器在人工智能和机器学习中的作用

GPU 在人工智能领域的强大功能源于它能够同时执行成千上万次计算,这一概念被称为并行处理深度学习模型,如卷积神经网络(CNN),是建立在数学运算的基础上的,而数学运算可以分解成成千上万个更小的、独立的任务。开创性的研究,如关于AlexNet 架构的论文,证明了在 GPU 上训练 CNN 的有效性。

拥有数千个内核的 GPU 可以并行执行这些任务,从而将模型训练的计算时间从数周或数月大幅缩短到数天或数小时。这种加速对于迭代模型、试验不同架构和执行大量超参数调整至关重要。这些处理器的性能通常以FLOPS(每秒浮点运算)来衡量。

Cpus 和 Tpus 的主要区别

虽然 GPU、CPU张量处理单元 (TPU)都是处理器,但它们针对不同类型的任务进行了优化:

GPU 兼顾了并行任务的高性能和广泛应用的灵活性,是许多人工智能开发人员的首选。

实际应用

在众多人工智能应用中,GPU 加速的影响显而易见。下面是两个突出的例子:

  1. 自动驾驶汽车:自动驾驶汽车依靠一系列传感器来感知周围环境。GPU 对于实时处理来自摄像头和激光雷达的海量数据流至关重要。它们为物体检测模型(如Ultralytics YOLO11)提供动力,以识别行人、其他车辆和路标,使车辆能够即时做出关键的驾驶决策。这是现代人工智能汽车解决方案的关键组成部分。
  2. 医学图像分析:在医疗保健领域,GPU 加快了对核磁共振成像和 CT 等复杂医学扫描的分析。正如《自然-临床肿瘤学评论》(Nature Reviews Clinical Oncology)等期刊所详述的,人工智能在放射学中的作用正在不断增强。在 GPU 上运行的模型可以执行图像分割等任务,从而高精度地划分肿瘤,协助放射科医生做出更快、更准确的诊断。这项技术是现代人工智能在医疗保健领域的基石,可用于检测医学图像中的肿瘤等应用。

生态系统和使用

成熟而强大的生态系统为 GPU 在人工智能领域的广泛应用提供了支持。英伟达™(NVIDIA®)的CUDA平台是主流的并行计算框架和编程模型,允许开发人员在通用计算中释放英伟达™(NVIDIA®)GPU的强大功能。

PyTorchTensorFlow等深度学习框架已针对利用 GPU 加速进行了大量优化,因此可以直接在这种硬件上训练模型。使用Docker容器化工具可以简化开发环境的设置。有关指导,您可以参考 UltralyticsDocker 快速入门指南。高效的模型部署通常需要使用TensorRTOpenVINO等工具进行进一步优化,以最大限度地提高目标硬件上的实时推理速度。您可以探索各种旨在有效利用 GPU 功能的Ultralytics 解决方案。使用Ultralytics HUB 等平台可以简化从数据集到部署的整个工作流程。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板