サポートベクターマシン(SVM)は、分類や回帰のタスクに使われる強力な教師あり機械学習アルゴリズムである。高次元空間や、次元数がサンプル数を上回るような状況で特に効果的である。SVMの第一の目標は、データ集合を最もよくクラスに分ける超平面を見つけることである。この超平面は、サポート・ベクトルとして知られる異なるクラスの最も近いデータ点間のマージンを最大化する決定境界として定義される。
SVMは、異なるクラスのデータ点間の距離が最大となるマージンを持つ超平面を特定することで動作する。これは、クラス分離のためのより広いマージンを確保する最適化技術によって達成される。SVMは、超平面分離を可能にするためにデータを高次元に変換するカーネル関数を用いて、非線形境界のために拡張することができる。
SVMは、線形および非線形のデータを扱う際のロバスト性により、様々な領域で広く使用されている:
テキストの分類:SVMは自然言語処理(NLP)でテキストを分類するのに使われる。SVMはスパム検出、感情分析、トピック分類に効果的である。NLPの詳細については、自然言語処理(NLP)をご覧ください。
画像の分類:SVMはピクセルデータ内のパターンを識別することによって画像を分類することができる。これは顔認識システムや医療画像診断などに広く応用されている。同様のアプリケーションについては、画像分類をご覧ください。
バイオインフォマティクスバイオインフォマティクスでは、SVMは遺伝子の分類、タンパク質のフォールド認識、その他の複雑なデータセットに役立っており、高次元データを扱う能力に優れている。
医療診断:SVMはMRIやCTスキャンなどの医療画像を分類し、病気の検出や診断に役立てる。AIがヘルスケアに与える影響については、AI in Healthcareをご覧ください。
金融金融分野では、SVMはクレジットスコアリングに採用され、過去のクレジットデータのパターンを分析することで債務不履行の可能性を特定する。このアプリケーションは、SVMのカテゴリー的な結果を予測する能力を利用している。
SVMと決定木の比較決定木は直感的で解釈しやすいが(決定木)、SVMは一般的に、データが線形分離可能であるか、カーネルを使って変換された場合、分類境界の点でより良いパフォーマンスを提供する。
SVMとニューラルネットワークの比較:畳み込みニューラルネットワーク(CNN)のようなニューラルネットワークは、効果的なトレーニングのために多くのデータを必要とし、複雑なパターンをモデル化することができる(畳み込みニューラルネットワーク(CNN))。対照的に、SVMはより少ないチューニングで、すぐに使える強力なパフォーマンスを提供する。
カーネル:多項式、放射基底関数(RBF)、シグモイドのようなカーネルは、SVMが非線形データを明示的に変換することなくうまく処理できるようにする。これは、Embeddingsと同様に、機械学習で埋め込みを使用するという考え方と一致する。
サポートベクトル:超平面の位置と向きを定義する重要なデータ点はサポート・ベクトルとして知られている。サポート・ベクトルは決定面に直接影響するため、データセット全体を処理する他の手法と比較して、SVMの計算を効率化する。
要約すると、サポート・ベクトル・マシンは、特に高次元データを扱う場合に、機械学習ツールキットの中で多用途かつ効果的なツールである。ノーコードの機械学習ソリューションに興味のあるユーザーのために、Ultralytics HUBは、SVMベースのアプローチを含むモデルを簡単に導入できるツールを提供している。Ultralytics HUBにアクセスして、これらの機能を探求してください。