教師あり学習がラベル付きデータでAIを強化し、正確な予測や物体検出や感情分析などのアプリケーションを可能にする方法をご覧ください。
教師あり学習は、機械学習(ML)の基本的なカテゴリーであり、アルゴリズムは、ラベル付きデータとして知られる入力と出力のペアを含むデータセットから学習する。要するに、アルゴリズムは、入力データに対する予測を、学習データで提供された既知の正しい出力(ラベル)と比較することによって学習するので、「教師あり」である。アルゴリズムの目標は、新しい未知の入力に対する出力を正確に予測できるマッピング関数を学習することである。このアプローチは、現代の多くの人工知能(AI)アプリケーションの中心であり、ベンチマークデータセットやカスタムデータセットに見られる過去の例に基づいて、システムが予測や決定を行うことを可能にする。
このプロセスは、各データポイントが入力特徴とそれに対応する正しい出力ラベルで構成される、注意深く準備されたデータセットから始まる。これには多くの場合、データ収集とアノテーションに多大な労力を要する。例えば画像分類タスクでは、入力は画像(おそらくOpenCVのようなライブラリの技術を用いて前処理されたもの)であり、ラベルはそれらが属するカテゴリ(例えば「猫」、「犬」)である。アルゴリズムは学習データに対して繰り返し予測を行い、確率的勾配降下(SGD)やAdamのような最適化アルゴリズムを用いて内部パラメータ(またはモデルの重み)を調整し、予測と実際のラベルの差を最小化する。この差は損失関数で測定される。この学習は、多くの場合複数のエポックにわたって、モデルが別の検証データで満足のいくレベルの精度やその他の関連するパフォーマンス指標を達成するまで継続され、新しいデータに対してうまく汎化し、オーバーフィッティングを回避することを保証する。
教師あり学習は非常に汎用性が高く、過去のデータから将来の出来事を予測したり、新しい情報を分類したりする膨大なアプリケーションを強力にサポートする。ラベル付けされた例から直接学習するその能力は、高い精度を必要とするタスクに適している。多くのコンピュータ・ビジョン(CV)タスクは、以下のような最先端のモデルによって実行されるものを含め、教師あり学習に大きく依存している。 Ultralytics YOLO.
具体例を2つ挙げよう:
その他の一般的な用途としては、画像や映像の物体検出(自律走行車や セキュリティシステムで使用)、スパムメールのフィルタリング、住宅価格の予測(回帰タスク)、顔認識などがある。また、よりスマートな小売在庫管理のためのAIや、農業ソリューションのAIにも応用されている。
教師あり学習を理解し、効果的に適用するためには、いくつかのコンセプトが中心となる:
教師あり学習は、他の主要な機械学習パラダイムとは異なる:
要約すると、教師あり学習は、予測タスクのモデルを訓練するためにラベル付きデータを活用する強力で広く使用されている技術です。教師あり学習は、Ultralytics開発・サポートするものを含め、多くの成功したAIアプリケーションのバックボーンを形成しており、データサイエンスやAIに携わる人にとって極めて重要なスキルです。