用語集

配列間モデル

翻訳、チャットボット、音声認識のようなAIタスクにパワーを与える、シーケンス・トゥ・シークエンス・モデルがどのように入力を出力シーケンスに変換するかをご覧ください。

Sequence-to-Sequence（Seq2Seq）モデルは、入力と出力の長さが異なる入力シーケンスを出力シーケンスに変換するように設計されたディープラーニングモデルのクラスです。この柔軟性により、自然言語処理（NLP）をはじめとする幅広いタスクで非常に強力な性能を発揮する。このコアとなるアイデアは、Googleと Yoshua Bengioの研究室の研究者による論文で紹介され、機械翻訳などの分野に革命をもたらした。

Seq2Seqモデルの仕組み

Seq2Seqモデルはエンコーダー・デコーダーアーキテクチャーの上に構築されている。この構造により、モデルは可変長のシーケンスを効果的に扱うことができる。

エンコーダー：このコンポーネントは、英語の文章などの入力シーケンス全体を処理する。一度に1つの要素ずつ（例えば単語ずつ）シーケンスを読み取り、情報をコンテキスト・ベクトルまたは "思考ベクトル "と呼ばれる固定長の数値表現に圧縮する。伝統的に、エンコーダーはリカレント・ニューラル・ネットワーク（RNN）か、シーケンシャルな情報を捉えることに長けているロング・ショート・ターム・メモリー（LSTM）のような高度な変種である。
デコーダー：このコンポーネントは、エンコーダーからのコンテキスト・ベクトルを初期入力として受け取る。このコンポーネントの仕事は、一度に1つの要素ずつ出力シーケンスを生成することである。例えば、翻訳タスクでは、単語ごとに翻訳文を生成する。各ステップからの出力は、次のステップでデコーダーにフィードバックされ、首尾一貫したシーケンスを生成することができる。このプロセスは、特別なシーケンス終了トークンが生成されるまで続けられる。Seq2Seqの性能を大幅に向上させた重要な技術革新は、アテンション・メカニズムである。アテンション・メカニズムにより、デコーダは出力を生成しながら、元の入力シーケンスのさまざまな部分を振り返ることができる。

Seq2Seqモデルの応用

可変長の入力を可変長の出力にマッピングできるため、Seq2Seqモデルは非常に汎用性が高い。

機械翻訳：これは典型的なアプリケーションだ。ある言語の文章（例："How are you?"）をモデルが別の言語（例："Wie geht es Ihnen?"）に翻訳する。グーグル翻訳のようなサービスは、この原理を大いに活用している。
テキストの要約：Seq2Seqモデルは、長い記事や文書（入力配列）を読み取り、簡潔な要約（出力配列）を生成することができる。これは大量のテキストを消化しやすい洞察に凝縮するのに便利です。
チャットボットと会話AI:ユーザーからの問い合わせや発言（入力シーケンス）に対して、適切で文脈に沿った応答（出力シーケンス）を生成するようにモデルを学習させることができる。
画像キャプション：これはコンピュータ・ビジョンに関係するが、原理は似ている。CNNがエンコーダーの役割を果たし、画像を処理してコンテキスト・ベクトルを作成し、デコーダーがそれを使って説明的なテキスト列を生成する。これはマルチモーダルモデルの一例である。

Seq2Seqと他のアーキテクチャーとの比較

RNNに基づくSeq2Seqモデルは画期的であったが、この分野は進化している：

標準的なRNN：通常、配列は同じ長さの配列にマップされるか、配列全体を分類する。
トランスフォーマー：以前はRNNベースのSeq2Seqモデルによって処理されていた多くの自然言語処理タスクが、現在支配的なものとなっている。再帰の代わりに自己アテンションと位置エンコーディングを使用するため、並列化が容易で、長距離の依存関係をより効果的に捉えることができる。しかし、根底にあるエンコーダ・デコーダの概念は、多くのTransformerベースのモデルの中心であることに変わりはない。UltralyticsがサポートするBaiduのRT-DETRのようなモデルは、オブジェクト検出のためにTransformerコンポーネントを組み込んでいる。
CNN：主に画像のようなグリッド状のデータに使用される（例：検出やセグメンテーションのためのUltralytics YOLOモデル）が、シーケンスタスクに適応されることもある。

Seq2SeqはRNNベースのエンコーダ・デコーダ構造を指すことが多いが、中間表現を使って入力配列を出力配列にマッピングするという一般的な原理は、多くの最新アーキテクチャの中心であり続けている。PyTorchや TensorFlowのようなツールは、従来のシーケンスモデルと最新のシーケンスモデルの両方を実装するためのビルディングブロックを提供します。Ultralytics HUBのようなプラットフォームを使用することで、学習プロセスの管理を合理化することができ、モデル展開パイプライン全体を簡素化することができます。

配列間モデル

柔軟なエンタープライズライセンシングソリューションでイノベーションを促進

Ultralytics YOLOでAIモデルを数秒でトレーニング

Ultralytics HUBでYOLOモデルを簡単にトレーニング

Seq2Seqモデルの仕組み

Seq2Seqモデルの応用

Seq2Seqと他のアーキテクチャーとの比較

このカテゴリの続きを読む

製造業におけるロボティクスの進化と未来

Ultralytics YOLO11でスマート監視を強化

U-Netアーキテクチャとその応用に関するガイド

Ultralyticsコミュニティに参加する