用語集

教師あり学習

教師あり学習がラベル付きデータでAIを強化し、正確な予測や物体検出や感情分析などのアプリケーションを可能にする方法をご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

教師あり学習は、機械学習(ML)の基本的なカテゴリーであり、アルゴリズムは、ラベル付きデータとして知られる入力と出力のペアを含むデータセットから学習する。要するに、アルゴリズムは、入力データに対する予測を、学習データで提供された既知の正しい出力(ラベル)と比較することによって学習するので、「教師あり」である。アルゴリズムの目標は、新しい未知の入力に対する出力を正確に予測できるマッピング関数を学習することである。このアプローチは、現代の多くの人工知能(AI)アプリケーションの中心であり、ベンチマークデータセットやカスタムデータセットに見られる過去の例に基づいて、システムが予測や決定を行うことを可能にする。

教師あり学習の仕組み

このプロセスは、各データポイントが入力特徴とそれに対応する正しい出力ラベルで構成される、注意深く準備されたデータセットから始まる。これには多くの場合、データ収集とアノテーションに多大な労力を要する。例えば画像分類タスクでは、入力は画像(おそらくOpenCVのようなライブラリの技術を用いて前処理されたもの)であり、ラベルはそれらが属するカテゴリ(例えば「猫」、「犬」)である。アルゴリズムは学習データに対して繰り返し予測を行い、確率的勾配降下(SGD)やAdamのような最適化アルゴリズムを用いて内部パラメータ(またはモデルの重み)を調整し、予測と実際のラベルの差を最小化する。この差は損失関数で測定される。この学習は、多くの場合複数のエポックにわたって、モデルが別の検証データで満足のいくレベルの精度やその他の関連するパフォーマンス指標を達成するまで継続され、新しいデータに対してうまく汎化し、オーバーフィッティングを回避することを保証する。

関連性と応用

教師あり学習は非常に汎用性が高く、過去のデータから将来の出来事を予測したり、新しい情報を分類したりする膨大なアプリケーションを強力にサポートする。ラベル付けされた例から直接学習するその能力は、高い精度を必要とするタスクに適している。多くのコンピュータ・ビジョン(CV)タスクは、以下のような最先端のモデルによって実行されるものを含め、教師あり学習に大きく依存している。 Ultralytics YOLO.

具体例を2つ挙げよう:

  • 医療画像解析:教師あり学習モデルは、放射線科医によってラベル付けされた医療スキャン(MRIやCTスキャンなど)に対して学習させることができ、医療画像から腫瘍を検出することができる。これは医療専門家の診断を支援し、ヘルスケアにおける多くのAIソリューションの中核を形成する。Radiology などの関連研究をご覧ください:人工知能.
  • センチメント分析:アルゴリズムは、センチメントカテゴリー(ポジティブ、ネガティブ、ニュートラルなど)でラベル付けされたテキストデータから学習し、カスタマーレビューやソーシャルメディアへの投稿など、新しいテキストで表現されたセンチメントを自動的に判断します。これは市場調査やブランドモニタリングに役立ちます。センチメント分析の詳細

その他の一般的な用途としては、画像や映像の物体検出自律走行車や セキュリティシステムで使用)、スパムメールのフィルタリング、住宅価格の予測(回帰タスク)、顔認識などがある。また、よりスマートな小売在庫管理のためのAIや農業ソリューションのAIにも応用されている。

キーコンセプト

教師あり学習を理解し、効果的に適用するためには、いくつかのコンセプトが中心となる:

他の学習パラダイムとの比較

教師あり学習は、他の主要な機械学習パラダイムとは異なる:

  • 教師なし学習このアプローチでは、ラベル付けされていないデータを使用し、アルゴリズムは、類似したデータポイントのグループ化(クラスタリング)やデータの次元の削減など、パターンや構造を独自に見つけようとする。既知の答えから直接入出力マッピングを学習することはない。教師なし学習の概要を読む。
  • 強化学習このパラダイムでは、エージェントは環境と相互作用し、その行動に基づいて報酬やペナルティを受け取ることで、一連の決定を行うことを学習する。強化学習は、ラベル付けされた例からではなく、試行錯誤を通じて最適な行動を学習する。強化学習の概要を見る。

要約すると、教師あり学習は、予測タスクのモデルを訓練するためにラベル付きデータを活用する強力で広く使用されている技術です。教師あり学習は、Ultralytics開発・サポートするものを含め、多くの成功したAIアプリケーションのバックボーンを形成しており、データサイエンスやAIに携わる人にとって極めて重要なスキルです。

すべて読む