用語集

変圧器

AIにおけるTransformerモデルの影響について、Ultralytics 。Transformerモデルのアーキテクチャ、主要コンポーネント、およびNLPとビジョンにおけるアプリケーションをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

Transformerモデルは、人工知能の分野、特に自然言語処理(NLP)、そして最近ではコンピュータビジョンのタスクにおける礎石となっている。2017年にVaswaniらによる論文「Attention is All You Need」で初めて紹介されたTransformerアーキテクチャは、自己注意メカニズムを活用することで、機械が言語を処理・理解する方法を根本的に変えた。

トランスフォーマーを理解する

Transformersは、リカレント・ニューラル・ネットワーク(RNN)や畳み込みニューラルネットワーク(CNN)のような従来のモデルよりも柔軟にシーケンシャルなデータを処理できるように設計されている。逐次的にデータを処理するRNNとは異なり、Transformersははるかに大きな並列化を可能にし、学習時間を大幅に短縮し、大規模なデータセットでのパフォーマンスを向上させる。

Transformerモデルの中心は、自己注意メカニズムである。これによって、文中の異なる単語の重要性を評価し、文脈を考慮した言語の理解と生成を可能にする。自己注意については、自己注意の用語解説ページをお読みください。

主要コンポーネント

  1. エンコーダー・デコーダー構造:トランスフォーマーは、エンコーダー・デコーダー構造で構築されており、エンコーダーが入力テキストを処理し、デコーダーが出力を生成する。エンコーダーは入力されたテキストを処理し、デコーダーは出力を生成する。それぞれは、自己アテンション・メカニズムとフィード・フォワード・ニューラル・ネットワークを含む複数のレイヤーで構成されている。

  2. 位置エンコーディング:Transformerは本質的にシーケンスの順序を理解しないので、シーケンス内の単語の位置をエンコードするために、位置エンコーディングが入力埋め込みに追加される。

  3. アテンション・メカニズム:トランスフォーマーの心臓部は、入力シーケンスの各部分に異なる重要度を割り当てるアテンション・メカニズムであり、出力を生成しながら関連する部分に焦点を当てることができる。

実世界での応用

自然言語処理

トランスフォーマーは、自然言語処理における大きな進歩を支えてきた。GPT-3やBERTなどのTransformerアーキテクチャに基づくモデルは、テキスト生成からセンチメント分析や機械翻訳に至るまで、さまざまなタスクにおいて新たなベンチマークを設定してきた。これらのモデルは、文脈をニュアンスレベルで理解することで、以前のモデルよりも優れたタスクを処理します。

  • BERTは、その双方向性注意メカニズムにより、単語の左右両方の文脈を理解する必要がある課題で知られている。

コンピュータ・ビジョン

当初は自然言語処理(NLP)用に設計されたトランスフォーマーだが、コンピュータビジョンのタスクに応用されることも増えている。ViT(Vision Transformer)のようなモデルは、画像分類やセグメンテーションなどで最先端の結果を達成するためにトランスフォーマーを使用しています。視覚モデルにおけるTransformerの役割を掘り下げて、コンピュータビジョンにおけるTransformerの影響を理解する。

ご興味のある方は、Ultralytics HUBで、Transformerモデルをさまざまなプロジェクトに統合し、パフォーマンスとスケーラビリティを向上させるツールをご利用いただけます。Ultralytics HUBを使用した、実際のアプリケーションへのモデルの導入について、詳しくはこちらをご覧ください。

関連モデルとの違い

  • RNNとLSTM:RNNやLSTMと異なり、Transformerはシーケンスを並列に処理できるため、学習が高速化し、長距離の依存関係を捉える効果が向上する。

  • CNN:CNNは伝統的に画像データに使用されてきたが、トランスフォーマーは、空間的階層に制約されることなくデータの文脈的関係を捉える能力により、その有効性が証明されつつある。

さらなる探求

論文「Attention is All You Need」や関連文献を読んで、AIにおけるトランスフォーマーの可能性を探ってみよう。これらのアーキテクチャーの進化については、Transformer-XLやLongformerのようなモデルのバリエーションについて学ぶことを検討してください。

Transformerは、NLPからヘルスケア、金融、そしてそれ以上の分野へと応用範囲を広げ、AI領域全体のイノベーションを推進し続けています。トランスフォーマー技術の最新動向と進歩については、Ultralytics'ブログをご覧ください。

すべて読む