用語集

リカレント・ニューラル・ネットワーク(RNN)

NLPから時系列分析まで、シーケンシャル・データのためのリカレント・ニューラル・ネットワーク(RNN)のパワーを発見してください。重要な概念とアプリケーションを今すぐ学びましょう!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

リカレントニューラルネットワーク(RNN)は、シーケンシャルなデータを処理するために特別に設計された人工ニューラルネットワーク(NN)の基本的なクラスである。情報が一方向にのみ流れるフィードフォワードネットワークとは異なり、RNNは内部ループを持ち、情報を持続させることができる。この「記憶」により、RNNは以前の情報を現在のタスクにつなげることができ、言語の理解や人工知能(AI)の広い分野における経時的傾向の分析など、文脈や順序が重要なアプリケーションに非常に効果的である。

RNNの仕組み

RNNの中核となる考え方は、シーケンスの前のステップの情報を保持し、現在および将来のステップの処理に影響を与える能力である。これは隠れ状態によって実現され、隠れ状態はメモリとして機能し、これまでに処理された内容に関する情報を保持する。シーケンスの各ステップにおいて、ネットワークは現在の入力と前の隠れ状態を取り込んで出力を生成し、その隠れ状態を更新する。このリカレント接続により、ネットワークは動的な時間的挙動を示すことができ、時系列分析や自然言語処理(NLP)のようなシーケンスを含むタスクには不可欠である。RNNに関するスタンフォード大学のCS230コース教材などで、基礎的な概念を調べることができる。

実世界での応用

RNNは、様々なAIアプリケーションの発展に貢献してきた:

  • 自然言語処理(NLP):正確な翻訳には単語の並びを理解することが不可欠である機械翻訳、テキストから意見を測定する感情分析、文中の次の単語を予測する言語モデリング(スマートフォンのキーボードに見られる)、テキスト生成などのタスクに幅広く使用されている。
  • 音声認識:RNNは、音声の特徴シーケンスを処理して話し言葉をテキストに変換する。ウィキペディアの音声認識のページに概要が掲載されている。
  • 時系列予測:金融の株式市場予測、天気予報、IoTデバイスのセンサーデータの分析などに応用される。

RNNと他のネットワーク・アーキテクチャの比較

RNNを理解するには、他のニューラルネットワークと区別する必要がある:

バリエーションと課題

標準的なRNNは、消失勾配や 爆発勾配のような問題のために、長距離依存性の学習に苦労することがある。これらの問題を軽減するために、より洗練された変種が開発された:

  • 長期短期記憶(LSTM)情報の流れを制御するためにゲート(入力、忘却、出力)を導入し、ネットワークが長いシーケンスにわたって情報を選択的に記憶または忘却できるようにする。
  • ゲーテッド・リカレント・ユニット(GRU)LSTMの単純化バージョンで、パラメータ(更新ゲートとリセットゲート)が少なく、多くのタスクで同等の性能を達成することが多い。

以下のようなフレームワーク PyTorchTensorFlowなどのフレームワークは、これらのRNNの実装を提供している。

Transformersのような新しいアーキテクチャが多くの分野で支配的になっている一方で、RNNは依然としてディープラーニングの重要な基礎概念であり、特定のアプリケーションや、より大きなハイブリッドモデル内のコンポーネントとして、依然として関連している。RNNのメカニズムを理解することは、AIにおけるシーケンスモデリングの進化に関する貴重な洞察を提供します。さらなる探求のために、DeepLearning.AI専門科目のようなリソースがRNNを詳細に扱っています。Ultralytics HUBのようなプラットフォームを使用して、RNNコンポーネントを組み込む可能性のあるモデルを含む様々なモデルを管理およびトレーニングすることができます。

すべて読む