用語集

顔認識

顔認識技術の仕組み、応用例、倫理的課題、Ultralytics がどのようにモデル展開を簡素化するかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

顔認識は、人工知能(AI)とコンピュータ・ビジョン(CV)を使用して、その人固有の顔の特徴に基づいて個人を識別または確認する高度なバイオメトリクス技術です。目と目の間の距離、鼻の形、顎の輪郭などの特徴を分析し、デジタル表現を作成する。この技術は急速に発展し、セキュリティーシステムや家電製品、その他さまざまなアプリケーションに不可欠なものとなっている。一般的な内容によって画像を分類する基本的な画像分類とは異なり、顔認識は特に個人を識別することを目的としている。

顔認識の仕組み

顔認識プロセスには一般的にいくつかの重要なステップがあり、高度なアルゴリズム、特にディープラーニング(DL)モデルによって支えられている:

  1. 顔検出:システムはまず、画像またはビデオフレーム内の人間の顔を見つけ、分離する。このステップでは、多くの場合、次のような強力な物体検出モデルを活用します。 Ultralytics YOLOのような強力な物体検出モデルを利用して、複雑なシーンでも正確に顔を検出します。
  2. 特徴抽出:顔が検出されると、システムはその形状を分析する。主要な顔のランドマークが特定され、多くの場合畳み込みニューラルネットワーク(CNN)に基づくアルゴリズムが、これらの固有の特徴を顔の埋め込みとして知られる数値表現またはベクトルに変換する。
  3. 比較と照合:この顔埋め込みは、既知の埋め込みデータベースと比較されます。あらかじめ定義された類似度のしきい値を満たす一致が見つかった場合、システムはその個人を識別するか(1:Nマッチング)、または主張された身元を検証します(1:1マッチング)。

顔認識の応用

顔認識技術は、さまざまな目的のために多くの分野で採用されている:

顔認識と類似技術の比較

顔認識と関連するCVタスクとを区別することが重要だ:

  • 画像認識必ずしも特定の個人を識別することなく、画像内の物体、シーン、または活動を識別するための広義の用語。
  • オブジェクト検出バウンディングボックスを使用して、画像内のオブジェクト(車、歩行者、顔など)のインスタンスを見つけることに重点を置く。顔検出は顔認識の前提条件だが、物体検出自体は人物を特定するものではない。
  • 姿勢推定身体の部位(キーポイント)の位置と向きを検出し、同一性よりも姿勢を分析する。
  • 感情分析感情を理解することを目的とし、多くの場合テキストや場合によっては表情を分析するが、個人の特定には焦点を当てない。

ツールとテクノロジー

顔認識システムの開発には、さまざまなツールが必要だ:

  • モデル: FaceNetのような特殊な顔認識モデルが特徴抽出とマッチングを処理するのに対して、次のような検出モデルは、顔認識とマッチングを処理します。 YOLOv8YOLOv11のような検出モデルがしばしば最初の顔検出ステップに使用されます。
  • ライブラリ:以下のようなフレームワーク PyTorchTensorFlowのようなフレームワークは、基礎となる深層学習モデルを構築するために一般的だ。OpenCVは、画像処理や基本的なCV操作に不可欠なツールを提供する。
  • プラットフォーム: Amazon Rekognitionのようなサービスは、事前に構築された顔認識APIを提供し、Ultralytics HUBのようなプラットフォームは、カスタムモデルのトレーニングとデプロイメントを管理するのに役立つ。Google Colabのようなツールを使えば、実験が容易になる。

倫理的配慮

顔認識の力はまた、プライバシー、監視、アルゴリズムによる潜在的な偏見、悪用に関する懸念など、倫理的な大きな課題ももたらす。責任ある開発と展開、透明性、規制の遵守を確保することは極めて重要である。バイオメトリクス研究所のような組織は、倫理的ガイドラインに取り組んでいる。AI倫理を理解することは、このテクノロジーを扱う上で不可欠である。

すべて読む