K-Nearest Neighbors (KNN)は、分類や回帰タスクに使用されるシンプルで強力な機械学習アルゴリズムです。KNNの主な機能は、特徴空間内の「k」個の最も近いデータ点に基づいて、データ点のクラスまたは値を予測することである。KNNは、分類問題、特に決定境界が線形でないデータセットを扱う際のシンプルさと有効性で知られている。
KNNは、利用可能なすべてのデータポイントを格納し、予測が必要な場合は、クエリーポイントに「k」最も近い近傍を識別することで動作する。そしてアルゴリズムは、これらの近傍の間で最も一般的なクラス(分類の場合)または平均値(回帰の場合)を予測値として決定する。
距離メトリック: KNNでは距離メトリックの選択が重要である。一般的なメトリックにはユークリッド距離、マンハッタン距離、ミンコフスキー距離がある。このメトリックはデータ点の「近さ」がどのように測定されるかを決定する。
k'の選択:k'の適切な値を選択することは、モデルの性能にとって非常に重要である。k'の値が小さいと、モデルはノイズに対してより敏感になり、一方'k'が大きいと、決定境界を単純化しすぎて、微妙なパターンを見逃してしまう可能性がある。
計算の複雑さ:KNNはクエリーポイントとデータセット内の他の全てのポイント間の距離を計算する必要があるため、データセットのサイズが大きくなるほど計算量が多くなる。この特性により、KNNを最適化せずに大規模なデータセットで使用することは困難である。
画像認識:KNNはピクセルの強度値に基づいて画像を分類することができる。コンピュータビジョンでは、新しい画像を以前に分類された画像と比較することで、画像データセットのパターンを検出するために使用される。
推薦システム:ユーザーとアイテムの相互作用データを活用し、KNNはレコメンデーションを提供するために類似したユーザーやアイテムを特定する。このテクニックはeコマースプラットフォームで一般的に使用され、ユーザーの過去の行動や嗜好に基づいて商品を提案する。
医療診断:KNNは、新しい患者データと過去の患者記録の既存データを比較することで、患者の状態を予測し、診断や治療計画の立案に役立てる。
不正行為の検出:金融機関は、過去の取引履歴に基づいて不正の典型的なパターンを特定することにより、KNNを使用して不正取引を検出する。
株価予測:金融の分野では、KNNは過去の傾向を分析し、将来の動きを予測するために類似した過去のパターンを識別することによって、株価を予測するために適用される。
長所だ:
短所だ:
K-Meansクラスタリング:KNNが分類に使用されるのに対し、K-Meansクラスタリングは、特徴の類似性に基づいてデータをクラスタにグループ化する教師なし学習アルゴリズムである。
サポートベクターマシン(SVM):KNNとは異なり、SVMは異なるクラスを最もよく分離する特徴空間の超平面を見つける教師あり学習モデルです。サポートベクターマシンの詳細はこちら
決定木:これらのモデルは、ツリー状の決定グラフを作成し、分類を支援します。決定木の詳細については、こちらをご覧ください。
実用的なアプリケーションとデプロイメントについては、Ultralytics HUBの機能を探求してください。 HUBは、KNNなどの機械学習モデルの簡単なトレーニングとデプロイメントを可能にするプラットフォームです。Ultralytics HUBにアクセスして、AIプロジェクトにコード不要のソリューションをご活用ください。
KNNがより広い機械学習タスクの中でどのように位置づけられるかを理解するには、教師あり学習やその他の関連する機械学習の概念についてさらに調べてみよう。