术语表

图形处理器（GPU）

了解 GPU 如何通过加速深度学习、优化工作流程和支持现实世界的应用，彻底改变人工智能和机器学习。

图形处理器（GPU）是一种专用电子电路，最初设计用于加速图像、视频和动画的创建和渲染，以便显示。然而，它的高度并行架构使其在同时处理大数据块时异常高效。这种能力使 GPU 成为现代人工智能（AI）和机器学习（ML）的主力军，大大加快了训练复杂模型所需的时间，并使开发更复杂的人工智能解决方案成为可能。

图形处理器在人工智能和机器学习中的作用

GPU 在人工智能领域的强大功能源于它能够同时执行成千上万次计算，这一概念被称为并行处理。深度学习模型，如卷积神经网络（CNN），是建立在数学运算的基础上的，而数学运算可以分解成成千上万个更小的、独立的任务。开创性的研究，如关于AlexNet 架构的论文，证明了在 GPU 上训练 CNN 的有效性。

拥有数千个内核的 GPU 可以并行执行这些任务，从而将模型训练的计算时间从数周或数月大幅缩短到数天或数小时。这种加速对于迭代模型、试验不同架构和执行大量超参数调整至关重要。这些处理器的性能通常以FLOPS（每秒浮点运算）来衡量。

Cpus 和 Tpus 的主要区别

虽然 GPU、CPU 和张量处理单元 (TPU)都是处理器，但它们针对不同类型的任务进行了优化：

中央处理器（CPU）：专为通用计算而设计，擅长处理顺序任务和管理系统操作。CPU 拥有几个功能强大的内核，并针对低延迟进行了优化。您可以阅读CPU 与 GPU 的详细比较。
图形处理器（GPU）：针对并行操作进行了优化，拥有数千个更简单的内核。适用于可同时分解和处理的任务，如渲染图形和训练深度学习模型。英伟达（NVIDIA ）和AMD等制造商生产的 GPU 是高性能计算（HPC）的主力产品。
TPU（张量处理单元）： 由谷歌定制设计的专用集成电路（ASIC），用于加速机器学习工作负载。它们针对神经网络（NN）中常见的大规模矩阵计算进行了高度优化，尤其是在TensorFlow 等框架中。

GPU 兼顾了并行任务的高性能和广泛应用的灵活性，是许多人工智能开发人员的首选。

实际应用

在众多人工智能应用中，GPU 加速的影响显而易见。下面是两个突出的例子：

自动驾驶汽车：自动驾驶汽车依靠一系列传感器来感知周围环境。GPU 对于实时处理来自摄像头和激光雷达的海量数据流至关重要。它们为物体检测模型（如Ultralytics YOLO11）提供动力，以识别行人、其他车辆和路标，使车辆能够即时做出关键的驾驶决策。这是现代人工智能汽车解决方案的关键组成部分。
医学图像分析：在医疗保健领域，GPU 加快了对核磁共振成像和 CT 等复杂医学扫描的分析。正如《自然-临床肿瘤学评论》（Nature Reviews Clinical Oncology）等期刊所详述的，人工智能在放射学中的作用正在不断增强。在 GPU 上运行的模型可以执行图像分割等任务，从而高精度地划分肿瘤，协助放射科医生做出更快、更准确的诊断。这项技术是现代人工智能在医疗保健领域的基石，可用于检测医学图像中的肿瘤等应用。

生态系统和使用

成熟而强大的生态系统为 GPU 在人工智能领域的广泛应用提供了支持。英伟达™（NVIDIA®）的CUDA平台是主流的并行计算框架和编程模型，允许开发人员在通用计算中释放英伟达™（NVIDIA®）GPU的强大功能。

PyTorch和TensorFlow等深度学习框架已针对利用 GPU 加速进行了大量优化，因此可以直接在这种硬件上训练模型。使用Docker 等容器化工具可以简化开发环境的设置。有关指导，您可以参考 UltralyticsDocker 快速入门指南。高效的模型部署通常需要使用TensorRT或OpenVINO等工具进行进一步优化，以最大限度地提高目标硬件上的实时推理速度。您可以探索各种旨在有效利用 GPU 功能的Ultralytics 解决方案。使用Ultralytics HUB 等平台可以简化从数据集到部署的整个工作流程。

图形处理器（GPU）

灵活的企业许可解决方案为您的创新提供动力

使用 Ultralytics YOLO 在数秒内训练人工智能模型

使用 Ultralytics HUB 简单训练 YOLO 模型

图形处理器在人工智能和机器学习中的作用

Cpus 和 Tpus 的主要区别

实际应用

生态系统和使用

在此类别中阅读更多内容

机器人技术在制造业中的发展与未来

利用 Ultralytics YOLO11 加强智能监控

U-Net 架构及其应用指南

加入 Ultralytics 社区