教師あり学習がラベル付きデータでAIを強化し、正確な予測や物体検出や感情分析などのアプリケーションを可能にする方法をご覧ください。
教師あり学習は、機械学習(ML)の基本的なカテゴリーであり、アルゴリズムは、ラベル付きデータとして知られる入力と出力のペアを含むデータセットから学習する。要するに、アルゴリズムは、入力データに対する予測を、学習データで提供された既知の正しい出力(ラベル)と比較することによって学習するので、「教師あり」である。アルゴリズムの目標は、新しい未知の入力に対する出力を正確に予測できるマッピング関数を学習することである。このアプローチは、現代の多くの人工知能(AI)アプリケーションの中心であり、システムが過去の事例に基づいて予測や決定を行うことを可能にする。
このプロセスは、各データ点が入力特徴量とそれに対応する正しい出力ラベルで構成されるデータセットから始まる。例えば画像分類タスクの場合、入力は画像であり、ラベルはそれらが属するカテゴリ(例えば「猫」、「犬」)である。アルゴリズムは学習データに対して繰り返し予測を行い、勾配降下のような最適化アルゴリズムを用いて内部パラメータを調整し、予測値と実際のラベルの差(損失関数で測定)を最小化する。この学習は、モデルが検証データで満足のいく精度を達成するまで続けられる。
教師あり学習は非常に汎用性が高く、過去のデータから将来の出来事を予測したり、新しい情報を分類したりする膨大なアプリケーションを強力にサポートする。ラベル付けされた例から直接学習できるため、高い精度が要求されるタスクに適している。多くのコンピュータ・ビジョン・タスクは、次のようなモデルを含む教師あり学習に大きく依存しています。 Ultralytics YOLO.
具体例を2つ挙げよう:
その他の一般的な用途としては、画像や映像中の物体検出(自律走行車やセキュリティシステムで使用)、スパムメールのフィルタリング、住宅価格の予測(回帰タスク)、顔認識などがある。
教師あり学習を理解する上で中心となる概念がいくつかある:
教師あり学習は、他の主要な機械学習パラダイムとは異なる:
要約すると、教師あり学習は、予測タスクのモデルを訓練するためにラベル付けされたデータを活用する強力な技術であり、Ultralytics Ultralytics HUBのようなプラットフォームで開発・サポートされているものを含め、多くの成功したAIアプリケーションのバックボーンを形成している。