用語集

ジェネレーティブAI

ジェネレーティブAIがどのようにテキスト、画像、音声などのオリジナルコンテンツを作成し、革新的なアプリケーションで業界を変革しているかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

生成的人工知能(AI)は、テキスト、画像、音声、コード、合成データなど、新しいコンテンツを生成できるシステムの構築に焦点を当てた人工知能(AI)のサブセットである。入力データに基づいて分類や予測を学習する判別型AIモデル(画像内のオブジェクトの識別など)とは異なり、生成型モデルはデータセット内の基本的なパターンや分布を学習し、学習データに似た新しいオリジナルの出力を生成する。最近の進歩、特にGPT(Generative Pre-trained Transformers)や拡散モデルのようなモデルによって、非常にリアルで複雑なコンテンツの作成が可能になりました。

生成AIの仕組み

生成AIモデルは通常、学習データの確率分布の表現を学習することで機能する。そして、この学習した分布からサンプリングして新しいデータ点を生成する。一般的なアーキテクチャには以下のものがある:

  • 生成的逆数ネットワーク (GANs):これは、生成器と識別器の2つのニューラルネットワークが、生成された出力の品質を向上させるために互いに競合するものである。
  • トランスフォーマー:GPT-4のような大規模言語モデル(LLM)で広く使用されているこれらのモデルは、主にテキストで、首尾一貫した文脈に関連したシーケンスを生成するために注意メカニズムを使用します。
  • 変分オートエンコーダ(VAE):これはデータの圧縮表現を学習し、潜在空間からサンプリングされた点をデコードすることによって新しいデータを生成することができる。
  • 拡散モデル:これらのモデルは、データに徐々にノイズを加え、そのプロセスを逆に学習することで機能し、特に画像に対して忠実度の高い生成を可能にする(Stable Diffusionなど)。

ジェネレーティブAIとコンピュータ・ビジョンの比較

どちらもAIの一分野ではあるが、ジェネレーティブAIとコンピュータビジョン(CV)は根本的に目的が異なる。

  • ジェネレーティブAIの焦点:新しいコンテンツの作成(例:テキストの説明から画像を生成する、記事を書く、音楽を作曲する)。
  • コンピュータ・ビジョン既存の視覚データの分析と理解(例:物体検出画像分類、Ultralytics YOLOようなモデルを使用したインスタンス分割)。

YOLO Vision 2024で議論されたように、Generative AIモデルは、リアルタイム分析用に設計された効率的なCVモデル(以下のような)に比べて、かなり大規模(数十億のパラメータ)になることが多い。 Ultralytics YOLOv8のような、数百万パラメータから始まるモデル)に比べて、大幅に大きくなります。多くのCVモデルが標準的なハードウェアやエッジデバイスでの展開に最適化されているのに対し、ジェネレーティブAIは学習と推論にかなりの計算リソースを必要とする。

しかし、これらの分野はますます交わりつつある。ジェネレーティブAIは、特に稀なシナリオの検出やセグメンテーションモデルをトレーニングするための合成データを作成することで、CVを支援し、モデルのロバスト性とパフォーマンスを向上させる可能性がある。

実際の応用と例

ジェネレーティブAIは、さまざまな領域で数多くの応用例がある:

  1. コンテンツ制作:記事、マーケティングコピー、スクリプトの作成(テキスト生成)、オリジナルの画像やアートの作成(テキストから画像へ)、作曲、ビデオの作成(テキストからビデオへ)。以下のようなツールがある。 ChatGPTなどのツールがよく使われる。
  2. データ拡張:限られたデータセットを拡張するために人工的なデータサンプルを作成すること。例えば、医療画像分析に使用される診断AIシステムの精度を向上させるために、稀な病状の合成画像を生成する。これにより、データ不足を克服し、モデルの汎化を向上させることができる。
  3. 創薬と医薬品開発: DeepMindのような企業が探求しているように、新薬の探索を加速するために分子構造をシミュレートし、その特性を予測する。
  4. パーソナライゼーション:洗練されたチャットボットやバーチャルアシスタント、パーソナライズされた学習教材の作成、オーダーメイドの製品推奨の生成。

倫理的配慮

ジェネレーティブAIの力は、倫理的な課題ももたらす。誤情報や有害なコンテンツを生成する可能性、説得力のあるディープフェイクの作成、生成されたコンテンツの著作権や知的財産に関する問題、学習データから学習される固有のバイアスなどである。これらに対処するには、AIの倫理、透明性、強固な規制の枠組みを慎重に検討する必要がある。これらのテクノロジーを責任を持って開発し、展開することは極めて重要である。独自のAIモデルの管理とトレーニングには、Ultralytics HUBのようなプラットフォームをご検討ください。

すべて読む