用語集

言語モデリング

言語モデリングが、テキスト生成、機械翻訳、音声認識などのNLPやAIアプリケーションにどのような高度なテクニックをもたらすかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

言語モデリングは、人工知能(AI)や自然言語処理(NLP)における基本的なタスクである。その主な目的は、人間の言語を理解、生成、予測できるシステムを構築することである。その中核となる言語モデルは、膨大なテキストデータに基づいて単語(または文字、トークン)のシーケンスの確率分布を学習する。これによりモデルは、特定の文やフレーズが自然に出現する可能性を判断し、さまざまな言語関連タスクを効果的に実行できるようになる。これは、バーチャルアシスタントから高度なテキストエディタまで、多くの最新AIアプリケーションを駆動する基礎技術である。

言語モデリングの仕組み

言語モデルは、学習したテキストデータのパターン、文法、文脈上の関係を分析することで機能する。初期のアプローチは、先行する「n」個の単語に基づいて単語の確率を計算するN-gramのような統計的手法に依存していた。このような手法は有用ではあるが、長距離の依存関係や、より深い意味の把握に苦労することが多かった。

ディープラーニング(DL)の登場により、言語モデリングは大きく進歩した。ニューラルネットワーク(NN)アーキテクチャなどだ:

これらのニューラル・モデルは通常、次のようなフレームワークを使ってトレーニングされます。 PyTorchまたは TensorFlowのようなフレームワークを使って学習され、バックプロパゲーションのような技術を使って複雑な言語的特徴を学習する。

言語モデリングの応用

単語の並びを予測し理解する能力により、言語モデリングは驚くほど多目的に利用できる。主な応用例をいくつか紹介しよう:

  • 予測入力とオートコンプリート:スマートフォンのキーボードが次の単語を提案したり、検索エンジンがクエリを補完したりする際、言語モデルが働き、これまでの入力に基づいて最も可能性の高い続きを予測する。GoogleSmart Composeのようなツールに見られるように、これはユーザーエクスペリエンスとタイピングスピードを向上させる。
  • 機械翻訳: Google 翻訳のようなツールは、高度な言語モデル(多くの場合、配列対配列モデルに基づく)を使用して、言語間のテキストを正確かつ流暢に翻訳する。このモデルは、言語間のアライメントを学習し、意味と文法構造を保持した翻訳を生成します。詳しくは、機械翻訳の用語集をご覧ください。
  • 音声認識:話し言葉をテキストに変換するには、音声入力に対応する最も可能性の高い単語の並びを予測する必要があり、アップルのSiriのような技術を支えている。
  • テキスト生成:記事、要約、対話システム(チャットボット)、クリエイティブライティングのための人間らしいテキストを作成します。
  • センチメント分析:テキストの一部で表現された感情的なトーン(肯定的、否定的、中立的)を決定することで、顧客レビューやソーシャルメディアの分析によく使用されます。
  • 質問回答:アレンAI研究所が開発したシステムのように、自然言語で投げかけられた質問を理解し、与えられた文脈や知識ベースに基づいて適切な回答を提供する。

関連概念

言語モデリングを関連用語と区別することは有益である:

すべて読む