用語集

ロングフォーマー

長いシーケンス用に最適化されたトランスフォーマーモデルであるLongformerは、NLP、ゲノミクス、ビデオ解析のためのスケーラブルな効率性を提供します。

Longformerは、非常に長い文書を効率的に処理するために設計された先進的なTransformerベースのモデルである。アレンAI研究所の研究者によって開発されたこのモデルの主な革新点は、BERTのような標準的なTransformerモデルの2次関数的スケーリングとは異なり、シーケンスの長さに応じて線形にスケーリングするアテンションメカニズムである。この効率性により、数千から数万のトークンを含むテキストに対して複雑な自然言語処理（NLP）タスクを実行することが可能になる。

Longformerの仕組み

Longformerの効率の核心は、標準的なTransformerの完全な自己注意メカニズムに代わる、独自の注意パターンにある。すべてのトークンが他のトークンに注目するのではなく、Longformerは2種類の注目を組み合わせている：

スライディング・ウィンドウ（ローカル）・アテンション：ほとんどのトークンは、左右に隣接する一定数のトークンのみに注意を払う。これは局所的な文脈をとらえるもので、人間の読者が単語を理解するときに、そのすぐ周囲にある単語に基づいて理解するのと似ている。このアプローチは、畳み込みニューラルネットワーク（CNN）が局所的パターンを活用することに成功したことにヒントを得ている。
グローバルな注目： 事前に選択された少数のトークンはグローバルな注意を持つように指定される。これらの「グローバル」トークンは、文書全体から高レベルの情報を収集する役割を果たす。タスク固有の微調整このようなグローバル・トークンは、戦略的に選ばれることが多い。 [CLS] 分類タスクのためのトークン。

この組み合わせにより、計算効率と、複雑な文書を理解するために必要な長距離の依存関係を捉えることのバランスが取れる。オリジナル研究の詳細は論文"Longformer：The Long-Document Transformer" に詳しい。

AIと機械学習における応用

Longformerは長いシーケンスを扱うことができるため、以前は実用的でなかった多くの用途に可能性が広がります。

長い文書の分析：書籍全体、長文の研究論文、複雑な法律文書に対して、テキストの要約や質問応答などのタスクを実行することができる。例えば、リーガルテック企業は、Longformerベースのモデルを使って、何千ページもの証拠開示文書を自動的にスキャンし、関連する証拠を見つけることができる。
対話システムとチャットボット チャットボットやバーチャルアシスタントのコンテキストでは、Longformerはより長い会話履歴を保持することができ、より首尾一貫した、コンテキストを意識したインタラクションを長期間にわたって行うことができる。
ゲノミクスとバイオインフォマティクス：そのアーキテクチャは、長いDNA配列やタンパク質配列の解析に適しており、研究者が膨大な遺伝子データセットの中からパターンや機能を特定するのに役立つ。研究ラボでは、染色体全体の中から特定の遺伝子配列を見つけるために応用できるだろう。

訓練済みのLongformerモデルは、Hugging Faceのようなプラットフォームで広く利用可能であり、開発者は様々なタスクに適応させることができる。

ロングフォーマー

UltralyticsのYOLOモデルをトレーニングし、業種を問わずワークフローを効率化する

柔軟なエンタープライズライセンシングソリューションでイノベーションを促進

Ultralytics YOLOでAIモデルを数秒でトレーニング

Longformerの仕組み

AIと機械学習における応用

関連用語との比較

このカテゴリの続きを読む

コンピュータ・ビジョンにおけるリーン・マニュファクチャリング

機械学習における精度と再現性

評価者間信頼性：定義、例、計算

Ultralyticsコミュニティに参加する