用語集

大規模言語モデル(LLM)

大規模言語モデル(LLM)が、チャットボットやコンテンツ作成など、高度なNLPでAIにどのような革命をもたらすかをご覧ください。重要なコンセプトを学ぶ

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

大規模言語モデル(LLM)は、人工知能(AI)の分野、特に自然言語処理(NLP)の分野で大きな進歩を遂げている。これらのモデルは、しばしば数十億のパラメータを含む巨大なスケールと、テキストとコードからなる膨大なデータセットで学習されることが特徴です。この広範な訓練により、LLMは文脈を理解し、首尾一貫した人間のようなテキストを生成し、言語を翻訳し、質問に答え、言語ベースの幅広いタスクを驚くほど熟練して実行することができる。LLMはディープラーニング(DL)モデルの一種であり、数多くのアプリケーションでイノベーションを推進し、現代のジェネレーティブAIの礎となっている。

定義

ラージ・ランゲージ・モデルは、基本的には洗練されたニューラルネットワーク(NN)であり、一般的には、影響力のある論文「Attention Is All You Need」で紹介されたTransformerアーキテクチャをベースにしている。LLMの "ラージ "とは、数十億から数兆にも及ぶ膨大な数のパラメータ(学習中に調整される変数)を指す。一般的に、パラメータ数が多いほど、モデルはデータからより複雑なパターンを学習することができる。

LLMは、インターネットや書籍などから収集された膨大なテキストコーパス(しばしばビッグデータと呼ばれる)に対する教師なし学習を通じて、これらのパターンを学習する。このプロセスは、文法、事実、推論能力、さらには口調や文体のようなニュアンスを把握するのに役立つが、学習データに存在するバイアスを学習してしまうこともある。トレーニング中に開発される中核的な能力は、文中の後続語を予測することである。この予測能力は、テキスト生成言語モデリング質問応答などのより複雑なタスクの基礎を形成する。

よく知られている例としては、OpenAIの GPTシリーズGPT-4など)、Meta AIのLlamaモデル(Llama 3など)、Google DeepMindのGemini、Claudeなどがある。 Anthropic.

アプリケーション

LLMの多用途性は、多様な領域での応用を可能にする。具体例を2つ紹介しよう:

キーコンセプト

LLMを理解するには、いくつかの関連概念に精通する必要がある:

  • 財団モデル:LLMは多くの場合、基礎モデルとみなされる。なぜなら、LLMは広範なデータで学習され、ゼロから学習することなく、下流の幅広いタスクに適応(または微調整)できるからである。
  • 注意のメカニズム:特に自己注意は、モデルが特定の単語を処理する際に、入力シーケンス内の異なる単語(トークン)の重要性を評価することを可能にするメカニズムである。これは、テキスト内の文脈や関係を理解する上で非常に重要である。
  • プロンプトエンジニアリング:これは、LLMが望ましい出力を生成するように導くための効果的な入力プロンプトを設計する技術と科学を指します。プロンプトの質は、応答の正確さと関連性に大きく影響する。思考連鎖プロンプトのような技術は、複雑なタスクにおける推論を向上させるのに役立つ。
  • トークン化:テキストを処理する前に、LLMはテキストをトークンと呼ばれる小さな単位に分解する。トークンには単語、サブワード、文字などがある。トークン化は生テキストをモデルが理解できる数値フォーマットに変換する。以下のようなプラットフォームがある。 Hugging Faceのようなプラットフォームは、さまざまなトークン化戦略に関するツールや情報を提供している。

LLMとコンピュータ・ビジョン・モデルの比較

LLMは言語タスクを得意とするが、主にコンピュータビジョン(CV)用に設計されたモデルとは大きく異なる。CVモデル Ultralytics YOLOモデル(例えば YOLOv8YOLO118、YOLOv9YOLOv10、YOLO11)は、画像や動画から視覚情報を解釈することに特化している。そのタスクには、物体検出画像分類インスタンス分割などがある。

しかし、マルチモーダルモデルや 視覚言語モデル(VLM)の台頭により、その境界は曖昧になりつつある。OpenAIのGPT-4oや GoogleGeminiのようなこれらのモデルは、異なるモダリティ(例えば、テキストと画像)にまたがる理解を統合し、画像の説明や視覚コンテンツに関する質問への回答のようなタスクを可能にする。

Ultralytics HUBのようなプラットフォームは、視覚タスクを含む様々なAIモデルをトレーニングし、デプロイするためのツールとインフラを提供し、多様なAIアプリケーションの開発を促進します。LLMやその他のAIモデルがより強力になるにつれ、AIの倫理アルゴリズムの偏りデータのプライバシーに関する考慮がますます重要になっています。AIの概念とモデル比較の詳細については、Ultralytics ドキュメントと モデル比較のページをご覧ください。

すべて読む