用語集

異常検知

AI/MLにおける異常検知は、データの異常なパターンを特定し、不正防止やヘルスケアなどに応用されます。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

異常値検出とは、データセット内で期待される、あるいは正常な動作から著しく逸脱したデータポイント、イベント、または観測を特定するプロセスである。しばしば異常値検出と呼ばれ、エラー、詐欺、システム障害などの重大なインシデントを示す可能性のある異常なパターンにフラグを立てることで、様々な領域で重要な役割を果たしている。人工知能(AI)機械学習(ML)の文脈では、異常検知システムは、正常な行動のパターンを学習し、次にこれらの学習されたパターンからの逸脱を識別するように訓練される。これらのシステムは、多くの産業において安全性、セキュリティ、業務効率を確保するために不可欠である。

異常検知の仕組み

異常検知技術はデータを分析し、正常のベースラインを確立する。この基準値から外れたものはすべて異常としてフラグが立てられる。使用される手法は、平均値からかけ離れたポイントを特定するような単純な統計的アプローチから、高次元データの複雑なパターンを理解できる複雑なディープラーニングモデルまで様々である。主なアプローチには以下のようなものがある:

  • 教師あり学習正常な例と異常な例の両方を含むラベル付きデータセットが必要。効果的ではあるが、異常はしばしば稀で予期せぬものであるため、ラベル付き異常データを得ることは困難である。
  • 半教師あり学習正常なデータのみを含むデータセットで学習する。モデルは正常なパターンを学習し、適合しないデータポイントは異常とみなされる。これは、異常が多様であったり、定義が不十分であったりする場合に有効である。
  • 教師なし学習ラベル付けされたデータを必要としない。クラスタリング(例:DBSCAN)や次元削減(例:PCA)のような技術を使用し、孤立している、あるいは大多数とは異なるデータ点を特定する。オートエンコーダも一般的に使用される。

異常検知と関連概念との比較

他のデータ分析タスクと関連しているが、異常検知には明確な目的がある:

  • 物体検出 バウンディングボックスを使用して、画像内の既知のオブジェクトインスタンス(車や人など)を識別し、位置を特定することを目的とする。特にコンピュータ・ビジョンにおける異常検出は、あらかじめ定義されたオブジェクト・クラスに対応しない可能性のある、予期せぬ視覚パターンや標準に当てはまらない欠陥を識別することに重点を置く。
  • 画像の分類画像全体に単一のラベルを割り当てる(「猫」や「犬」など)。異常検知は様々なデータタイプ(画像、時系列、ネットワークログ)に対して動作し、データポイント全体を分類するのではなく、異常なデータ内の特定のインスタンスやパターンを特定する。
  • 異常値検出:しばしば異常値検出と同じ意味で使われる。しかし、「外れ値」は一般的に統計的に他のデータからかけ離れたデータポイントを指すのに対し、「異常値」は単純な統計的外れ値ではない異常なパターンや文脈上の不規則性など、より複雑な逸脱を含むことがある。

実世界での応用

異常検知は多くの分野で重要である:

  • 製造品質管理ビジョンシステムを使用して、組立ライン上の製品のひび割れ、傷、ズレなどの欠陥を特定すること。例えば、航空機部品の小さなひび割れや、医薬品に印刷されたラベルの誤りの検出など。
  • サイバーセキュリティ異常なネットワーク・トラフィック・パターン、ログイン試行、または侵入、マルウェア感染、サービス拒否攻撃を示す可能性のあるシステム動作を検出します。セキュリティ・アラーム・システムは、異常検知を活用して疑わしいアクティビティにフラグを立てることができます。
  • 金融詐欺の検出典型的な顧客行動から逸脱した不正なクレジットカード取引、異常な取引活動、保険金請求を特定する。
  • ヘルスケアと医療画像分析医療スキャン(X線やMRIなど)において、腫瘍や病気を示す可能性のある異常を発見し、放射線科医を支援することが多い。腫瘍検出にYOLO11 使用するのはその一例である。
  • システム・ヘルス・モニタリング:ITシステムCPU 使用率、メモリリーク)または産業機械(予知保全)の異常なパフォーマンス指標を検出し、故障を防止する。
  • 環境モニタリング 衛星画像解析による汚染事象、違法な森林伐採、生態系の異常な変化の特定。

ツールとテクノロジー

異常検知システムの開発には、標準的なMLライブラリや特殊なプラットフォームが使われることが多い。例えば PyTorchTensorFlowのようなフレームワークは、カスタムモデルを構築するための基本的なツールを提供する。視覚ベースのタスクには Ultralytics YOLOのようなモデルを適応させることができる。事前にトレーニングされたYOLO モデルは、一般的なオブジェクトの検出に優れていますが、COCOのようなデータセットではカバーされないユニークな欠陥や異常な視覚パターンなど、ドメイン固有の異常を識別するために、特定のデータセットでカスタムトレーニングすることができます。Ultralytics HUBのようなプラットフォームは、Ultralytics HUB SDKのようなツールを使用して、クラウドでのトレーニング、デプロイメント(モデルデプロイメントオプション)、およびそのようなモデルの効率的な管理のための統合環境を提供します。Scikit-learnのようなライブラリは、外れ値や異常値検出のための様々なアルゴリズムも提供している。

異常検知は、現代のAIとMLにおいて不可欠な機能であり、多くの業界において重大な問題や逸脱を事前に特定することを可能にします。関連概念については、Ultralytics 用語集をご覧ください。

すべて読む