用語集

ランダムフォレスト

強力なアンサンブル学習アルゴリズムであるランダムフォレストが、分類、回帰、および実際のAIアプリケーションにおいてどのように優れているかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

ランダムフォレストは、汎用性が高く強力な機械学習(ML)アルゴリズムであり、分類と回帰の両方のタスクに広く使用されている。これはアンサンブル学習法の一群に属し、複数の個別モデルを組み合わせることで、単一モデルが単独で達成できるよりも優れた予測精度とロバスト性を達成する。Leo Breimanによって提案されたこの手法は、決定木の概念にランダム性を導入したものである。

ランダムフォレストの仕組み

その核となるランダムフォレストは、学習段階で多数の決定木を構築することで動作する。各樹木は、訓練データの異なるランダムなサブセットで訓練され(バギングまたはブートストラップ集約と呼ばれる手法)、各ノードで最適な分割を決定するために特徴のランダムなサブセットのみを使用する。この二重のランダム性は、木を装飾するのに役立ち、アンサンブルをよりロバストにする。

分類問題では、ランダムフォレストの最終出力は、すべての個々の木の多数決によって選択されたクラスである。回帰問題では、予測は通常個々の木の平均予測です。このアプローチは「群衆の知恵」を活用し、多様なモデルの集合がより正確な予測を行い、単一の決定木でよくある問題であるオーバーフィッティングのリスクを大幅に低減します。

主な特徴

ランダムフォレストを定義するいくつかの重要な側面がある:

  • アンサンブル法:複数の決定木からの予測を組み合わせる。
  • バギング:各ツリーは、元のデータセットからブートストラップされたサンプルで学習されます。ブートストラップ集計(Bagging)の詳細はこちら。
  • 特徴のランダム性:各ノード分割では、特徴のランダムなサブセットのみが考慮される。
  • 分散の削減.多くの装飾関連ツリーにわたって予測を平均化することで、モデルの全体的な分散が小さくなります。
  • 特徴の重要性.予測においてどの入力変数が最も影響力があるかを示す、特徴の重要度の推定値を提供できる。

ランダムフォレストの応用

ランダムフォレストは、その精度、ロバスト性、使いやすさから、幅広い分野で応用されている。具体的な例をいくつか紹介しよう:

  1. 金融:財務データから複雑なパターンを特定することが重要な、クレジットスコアリングや不正検知などのタスクに広く使用されている。
  2. ヘルスケア画像ベースのタスクではディープラーニングが優位に立つことが多いが、患者記録に基づく疾病予測や、異常を特定するための医療画像解析などの分野でも応用されている。ヘルスケアにおけるAIソリューションをご覧ください。

テクノロジーとツール

いくつかの一般的な機械学習ライブラリは、ランダムフォレストアルゴリズムの実装を提供している。広く使われているPython ライブラリであるScikit-learnはハイパーパラメータのチューニングオプションを備えた包括的なランダムフォレストの実装を提供している。XGBoostや LightGBMのような他のライブラリは、関連する木ベースのアンサンブル手法の効率的な実装を提供し、多くの場合、大規模なデータセットでの速度とパフォーマンスのために最適化されている。

ランダムフォレストは構造化されたデータや表形式のデータを得意とするが、ディープラーニング・モデルと比較すると、一般的に画像のような非構造化データを含むタスクには不向きである。物体検出や 画像セグメンテーションのような最先端のコンピュータ・ビジョン・タスクには、次のようなモデルが適しています。 Ultralytics YOLOのようなモデルが一般的に好まれます。YOLO モデルは、Ultralytics HUB のようなプラットフォームを使用してトレーニングおよびデプロイすることができ、ビジョン AI プロジェクトのMLOpsライフサイクルを簡素化します。YOLO モデルを実際のアプリケーションに活用した様々なUltralytics ソリューションをご覧ください。

すべて読む