AI/MLにおける異常検知は、データの異常なパターンを特定し、不正防止やヘルスケアなどに応用されます。
異常値検出とは、データセット内で期待される、あるいは正常な動作から著しく逸脱したデータポイント、イベント、または観測を特定するプロセスである。しばしば異常値検出と呼ばれ、エラー、詐欺、システム障害などの重大なインシデントを示す可能性のある異常なパターンにフラグを立てることで、様々な領域で重要な役割を果たしている。人工知能(AI)や機械学習(ML)の文脈では、異常検知システムは、正常な行動のパターンを学習し、次にこれらの学習されたパターンからの逸脱を識別するように訓練される。これらのシステムは、多くの産業において安全性、セキュリティ、業務効率を確保するために不可欠である。
異常検知技術はデータを分析し、正常のベースラインを確立する。この基準値から外れたものはすべて異常としてフラグが立てられる。使用される手法は、平均値からかけ離れたポイントを特定するような単純な統計的アプローチから、高次元データの複雑なパターンを理解できる複雑なディープラーニングモデルまで様々である。主なアプローチには以下のようなものがある:
他のデータ分析タスクと関連しているが、異常検知には明確な目的がある:
異常検知は多くの分野で重要である:
異常検知システムの開発には、標準的なMLライブラリや特殊なプラットフォームが使われることが多い。例えば PyTorchや TensorFlowのようなフレームワークは、カスタムモデルを構築するための基本的なツールを提供する。視覚ベースのタスクには Ultralytics YOLOのようなモデルを適応させることができる。事前にトレーニングされたYOLO モデルは、一般的なオブジェクトの検出に優れていますが、COCOのようなデータセットではカバーされないユニークな欠陥や異常な視覚パターンなど、ドメイン固有の異常を識別するために、特定のデータセットでカスタムトレーニングすることができます。Ultralytics HUBのようなプラットフォームは、Ultralytics HUB SDKのようなツールを使用して、クラウドでのトレーニング、デプロイメント(モデルデプロイメントオプション)、およびそのようなモデルの効率的な管理のための統合環境を提供します。Scikit-learnのようなライブラリは、外れ値や異常値検出のための様々なアルゴリズムも提供している。
異常検知は、現代のAIとMLにおいて不可欠な機能であり、多くの業界において重大な問題や逸脱を事前に特定することを可能にします。関連概念については、Ultralytics 用語集をご覧ください。