用語集

GPU（グラフィックス・プロセッシング・ユニット）

ディープラーニングを加速し、ワークフローを最適化し、実世界のアプリケーションを可能にすることで、GPUがAIと機械学習にどのような革命をもたらすかをご覧ください。

グラフィック・プロセッシング・ユニット（GPU）は、もともとディスプレイ用の画像、ビデオ、アニメーションの作成とレンダリングを高速化するために設計された特殊な電子回路である。しかし、高度に並列化されたアーキテクチャーにより、大きなデータ・ブロックを同時に処理する効率が非常に高くなっている。この能力により、GPUは現代の人工知能（AI）や機械学習（ML）の主力となり、複雑なモデルの学習にかかる時間を劇的に短縮し、より洗練されたAIソリューションの開発を可能にしている。

AIと機械学習におけるGpusの役割

AIにおけるGPUの威力は、何千もの計算を一度に実行する能力に由来する。これは並列処理として知られる概念だ。畳み込みニューラルネットワーク（CNN）などのディープラーニング・モデルは、何千もの小さな独立したタスクに分解できる数学的演算に基づいて構築されている。AlexNetアーキテクチャに関する論文のような重要な研究は、GPU上でCNNをトレーニングすることの有効性を実証した。

何千ものコアを持つGPUは、これらのタスクを並列に実行することができ、モデルトレーニングの計算時間を数週間から数ヶ月から数日から数時間へと劇的に短縮することができる。この高速化は、モデルの反復、異なるアーキテクチャの実験、および大規模なハイパーパラメータのチューニングの実行に不可欠です。これらのプロセッサの性能は、多くの場合FLOPS（1秒あたりの浮動小数点演算回数）で測定されます。

CpusやTpusとの主な違い

GPU、CPU、テンソル処理ユニット（TPU）はすべてプロセッサーの一種であるが、それぞれ異なる種類のタスクに最適化されている：

CPU（中央演算処理装置）：汎用コンピューティング用に設計され、シーケンシャルなタスクやシステム操作の管理に優れている。CPUには、低レイテンシに最適化された強力なコアがいくつかあります。CPUとGPUの詳細な比較はこちらをご覧ください。
GPU（グラフィックス・プロセッシング・ユニット）：数千の単純なコアで並列処理に最適化されている。グラフィックスのレンダリングやディープラーニングモデルの学習など、分解して同時に処理できるタスクに最適。NVIDIAや AMDといったメーカーのGPUは、ハイパフォーマンス・コンピューティング（HPC）の定番となっている。
TPU（Tensor Processing Unit）： Googleが機械学習のワークロードを高速化するためにカスタム設計した特定用途向け集積回路（ASIC）。ニューラルネットワーク（NN）、特にTensorFlowのようなフレームワークで一般的な大規模行列計算用に高度に最適化されている。

GPUは、並列タスクのための高性能と幅広いアプリケーションのための柔軟性の強力なバランスを提供し、多くのAI開発者に好まれる選択肢となっている。

実世界での応用

GPUアクセラレーションのインパクトは、数多くのAIアプリケーションで明らかだ。以下はその顕著な2つの例である：

自律走行車：自動運転車は、環境を認識するために一連のセンサーに依存しています。GPUは、カメラやLiDARからの膨大なデータストリームをリアルタイムで処理するために不可欠です。GPUは、Ultralytics YOLO11のような物体検出モデルに電力を供給し、歩行者、他の車両、道路標識を識別して、車両が重要な運転判断を瞬時に下せるようにします。これは、車載ソリューションにおける最新のAIの重要な要素です。
医療画像解析：ヘルスケアでは、GPUがMRIやCTのような複雑な医療スキャンの解析を加速させる。Nature Reviews Clinical Oncology』誌などで詳しく紹介されているように、放射線医学におけるAIの役割は大きくなっている。GPU上で動作するモデルは、腫瘍を高精度で描出する画像セグメンテーションのようなタスクを実行でき、放射線科医がより迅速で正確な診断を下せるよう支援する。この技術は、医療における最新のAIの基礎であり、医療画像の腫瘍検出などの用途に使用されている。

エコシステムと利用

AIにおけるGPUの幅広い採用は、成熟した強固なエコシステムによって支えられています。NVIDIAのCUDAプラットフォームは、開発者が汎用コンピューティングのためにNVIDIA GPUのパワーを解き放つことを可能にする、支配的な並列コンピューティングフレームワークとプログラミングモデルです。

PyTorchや TensorFlowのようなディープラーニングフレームワークは、GPUアクセラレーションを活用するように大きく最適化されているため、このハードウェアでモデルを学習するのは簡単だ。開発環境のセットアップは、Dockerのようなコンテナ化ツールを使用して簡素化できます。ガイダンスについては、UltralyticsDocker Quickstartガイドを参照してください。効率的なモデルのデプロイには、TensorRTや OpenVINOのようなツールを使用してさらに最適化し、ターゲットハードウェア上でのリアルタイム推論速度を最大化する必要があります。GPUの能力を効果的に活用するように設計された様々なUltralyticsソリューションを調べることができます。データセットからデプロイまでのワークフロー全体の管理は、Ultralytics HUBのようなプラットフォームを使って合理化できます。

GPU（グラフィックス・プロセッシング・ユニット）

柔軟なエンタープライズライセンシングソリューションでイノベーションを促進

Ultralytics YOLOでAIモデルを数秒でトレーニング

Ultralytics HUBでYOLOモデルを簡単にトレーニング

AIと機械学習におけるGpusの役割

CpusやTpusとの主な違い

実世界での応用

エコシステムと利用

このカテゴリの続きを読む

製造業におけるロボティクスの進化と未来

Ultralytics YOLO11でスマート監視を強化

U-Netアーキテクチャとその応用に関するガイド

Ultralyticsコミュニティに参加する