用語集

GPT(生成的事前訓練変換器)

テキスト生成、NLPタスク、チャットボット、コーディングなどのための高度な変換ベースのAIです。今すぐ主な機能をご覧ください!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

Generative Pre-trained Transformer (GPT)モデルは、機械が人間の言語を理解し生成できるようにすることに焦点を当てた人工知能(AI)のサブフィールドである自然言語処理(NLP)における大きな飛躍を意味する。主にOpenAIによって開発されたGPTは、Transformerアーキテクチャに基づいて構築された大規模言語モデル(LLM)の一種です。最初はテキストやコードの膨大なデータセットで「事前訓練」され、文法、事実、推論能力、言語構造を学習する。その後、より小さな特定のデータセットで「ファインチューニング」することで、特定のタスクを得意とするようになる。

ジェネレーティブ・プリ・トレーニング・トランスフォーマー(GPT)とは?

GPTモデルは、トランスフォーマーと呼ばれるニューラルネットワーク・アーキテクチャを使用しており、テキストのようなシーケンシャルなデータの処理に特に効果的です。名前を分解してみよう:

  • 生成的:これは、モデルの主な機能である、学習させたデータのスタイルと内容を模倣した、新しい首尾一貫したテキストを生成することに重点を置いています。分析や分類のみに焦点を当てたモデルとは異なり、GPTはオリジナルのコンテンツを作成します。
  • 事前学習:膨大なテキストデータから一般的な言語理解を学習する、リソース集約的な初期学習段階を指す。この基礎知識により、モデルは後の様々な特定のタスクに適応できるようになる。
  • トランスフォーマー:これは基礎となるニューラルネットワーク(NN)アーキテクチャである。トランスフォーマーはアテンション・メカニズムを利用し、入力シーケンス内の異なる単語の重要性を重み付けすることで、テキスト内の文脈や長距離依存関係を効果的に捉えることができる。

事前学習後、GPTモデルは、質問応答テキスト要約、あるいはソフトウェアコードの生成のような特殊なアプリケーションのために微調整を行うことができる。

GPTモデルの主な特徴

GPTモデルには、そのパワーと多用途性に貢献するいくつかの特徴がある:

  • スケーラビリティ:GPTモデルにはさまざまなサイズがあり、リソースに制約のある環境に適した小型のものから、GPT-3や GPT-4のような最先端の性能を提供する超大型のものまであります。モデルのサイズはしばしば能力と相関します。
  • 汎用性:事前学習/微調整のパラダイムにより、1つの事前学習済みGPTをさまざまなNLPタスクに適応させることができます。
  • 数ショット学習とゼロショット学習:大きなGPTモデルは、印象的な数ショット学習や ゼロショット学習能力を示すことが多い。これは、明示的に微調整されていないタスクを、時にはわずかな例やまったくない例で実行できることを意味する。
  • 文脈の理解:Transformerアーキテクチャにより、GPTは長い文章でも文脈を維持し、活用することができる。

GPTの実世界での応用

GPTテクノロジーは、さまざまな領域で数多くのアプリケーションを支えている:

  1. コンテンツ作成:GPTモデルはテキスト生成に使用され、記事、マーケティングコピー、Eメール、クリエイティブライティング、コード生成を支援する。GitHub Copilotのようなツールは、コーディング支援にGPTのようなモデルを活用しています。
  2. 会話型AI:以下のような高度なチャットボットやバーチャルアシスタントのバックボーンを形成する。 ChatGPT自然言語の指示に基づき、複雑な対話、質問への回答、タスクの実行が可能。
  3. 要約と分析:GPTは、長い文書や記事を素早く要約し(テキスト要約)、テキストで表現された意見を測定するために感情分析を実行することができます。

GPTと類似コンセプトの比較

GPTを関連用語と区別するのに役立つ:

  • GPTとAGIの比較:GPTモデルは、特定の言語関連タスクのために設計された人工狭域知能(ANI)の一形態である。これは、多様な領域にわたって人間のような認知能力を持つ仮想的なAIを指す。
  • GPTとUltralytics YOLO比較:GPTモデルはテキストの処理と生成に特化している。一方、Ultralytics YOLO モデルは、次のようなものです。 YOLOv8のように、オブジェクト検出画像セグメンテーション、画像や動画内のポーズ推定などのコンピュータビジョン(CV)タスクに焦点を当てた最先端のモデルです。両者ともTransformerコンポーネントを利用していますが(特に新しいCVモデル)、主要なドメイン(言語対ビジョン)と出力(テキスト対バウンディングボックス/マスク)は基本的に異なります。Ultralytics YOLO モデルは、Ultralytics HUBのようなプラットフォームを使用してトレーニングおよびデプロイできます。
すべて読む