用語集

アクティベーション機能

ニューラルネットワークにおける活性化関数の役割、その種類、そしてAIや機械学習における実際の応用例についてご紹介します。

活性化関数は、ニューラルネットワーク（NN）のニューロンやノードに適用される数学関数である。その主な役割は、重み付けされた入力に基づいてニューロンの出力を決定することである。簡単に言えば、ニューロンを「活性化」または「発火」させるかどうかを決定し、「活性化」させる場合は、次の層に進むときの信号の強さを決定する。このメカニズムは、ネットワークに非線形性を導入し、データから複雑なパターンや関係を学習できるようにするために極めて重要である。活性化関数がなければ、ニューラルネットワークは何層あっても単純な線形回帰モデルのように振る舞い、現実世界の複雑な問題を解決する能力を著しく制限してしまう。

活性化機能の種類

活性化関数には多くの種類があり、それぞれがユニークな特性を持っている。関数の選択はモデルの性能とトレーニング効率に大きく影響する。

シグモイド:この関数は、任意の入力値を0から1の間の範囲にマッピングする。歴史的によく使われてきたが、学習が遅くなる勾配の消失問題のため、現在ではディープラーニングモデルの隠れ層ではあまり使われなくなった。二値分類タスクの出力層ではまだ使われている。
タン（双曲線タンジェント）:シグモイドに似ているが、入力を-1から1の範囲にマッピングする。出力がゼロ中心であるため、シグモイドよりもモデルの収束が速くなることが多い。リカレント・ニューラル・ネットワーク（RNN）でよく使われる。PyTorchや TensorFlowなどのフレームワークで実装されている。
ReLU（整流リニアユニット）:これは現代のニューラルネットワーク、特に畳み込みニューラルネットワーク（CNN）で最も広く使われている活性化関数である。入力が正であればそのまま出力し、そうでなければゼロを出力する。シンプルで効率的なため、勾配の消失問題を緩和し、学習の高速化につながります。
雨漏りのReLU:ReLUの変形で、入力が負であるときに、小さくゼロでない勾配を許容する。これは、ニューロンが不活性化して学習を停止してしまう「瀕死のReLU」問題に対処するために設計された。
SiLU（シグモイド・リニア・ユニット）:Ultralytics YOLOのような最先端のモデルで人気を博している、滑らかで非単調な関数。線形性と非線形性の利点を組み合わせることで、ディープモデルではReLUを上回ることが多い。
ソフトマックス:マルチクラス画像分類タスクのニューラルネットワークの出力層にのみ使用される。生のスコア（logits）のベクトルを確率分布に変換し、各値は入力が特定のクラスに属する確率を表す。

AIと機械学習の応用

活性化関数は、ニューラルネットワークに依存するほぼすべてのAIアプリケーションの基本である。

コンピュータビジョン：物体検出のようなタスクでは、CNNは隠れ層でReLUや SiLUのような関数を使用して視覚情報を処理する。例えば、自律走行車の知覚システムは、カメラデータから歩行者、他の車、交通標識をリアルタイムで識別するためにこれらの関数を使用する。
自然言語処理(NLP):機械翻訳では、LSTMはゲーティング機構の中でシグモイド関数とタン関数を使い、ネットワークを通して情報の流れを制御し、文の前の部分の文脈を記憶するのに役立っている。包括的な概要は、Christopher Olah著 "Understanding LSTMs "に掲載されている。

アクティベーション機能

柔軟なエンタープライズライセンシングソリューションでイノベーションを促進

Ultralytics YOLOでAIモデルを数秒でトレーニング

Ultralytics HUBでYOLOモデルを簡単にトレーニング

活性化機能の種類

AIと機械学習の応用

関連用語との比較

このカテゴリの続きを読む

アディティブ・マニュファクチャリングを理解する技術と使用例

Ultralytics YOLO11による空港地上業務のモニタリング

製造業におけるロボティクスの進化と未来

Ultralyticsコミュニティに参加する