用語集

データの可視化

強力な可視化技術とツールで、複雑なAI/MLデータを実用的な洞察に変換します。詳しくはUltralytics をご覧ください!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

データの可視化とは、複雑な情報や生データを、チャート、グラフ、マップなどの視覚的なコンテキストに変換することです。これにより、基礎となるデータが人間の脳にとって理解しやすくなり、意味のある洞察を引き出すのに役立つ。人工知能(AI)や機械学習(ML)では、データセットを探索し、学習中のモデルの動作を理解し、パフォーマンスを評価し、発見を効果的に伝えるために、データの視覚化が極めて重要です。圧倒的な数値データを直感的な視覚表現に変換し、生の数値やテキストレポートでは不明瞭になりがちなパターン、傾向、異常、関係性を強調します。

コア・コンセプトとテクニック

データ可視化の主な目的は、データを明確に表示し、理解を容易にすることである。これには、以下のようなさまざまなグラフィカルな手法が用いられます:

  • 棒グラフ:異なるカテゴリー間で数量を比較する。
  • 折れ線グラフ:時間または連続的な間隔の傾向を示す。
  • 散布図:2つの数値変数の関係や相関を明らかにする。
  • ヒートマップ:相関行列やニューラルネットワークの活性化の可視化によく使われる。ヒートマップについてはUltralytics ガイドを参照。
  • ヒストグラム:単一の数値変数の分布を示す。
  • 箱ひげ図:四分位数を通してデータの分布を要約する。

適切なビジュアライゼーション手法を選択するかどうかは、データの種類や伝えたい具体的な洞察によって大きく異なります。また、効果的な可視化には、カラーパレット、スケーリング、軸、ラベルなどのデザイン要素を注意深く考慮し、見る人を誤解させることなく正確に表現する必要があります。Matplotlibや Seabornのような人気のあるPython ライブラリは、データサイエンスで一般的に使用される、静的、アニメーション、インタラクティブなビジュアライゼーションを幅広く作成するための強力なツールを提供します。ビジュアル表示の基本原則を守ることは、インパクトのあるデータストーリーテリングの鍵となります。

AIと機械学習における重要性

データの可視化は、AI/MLプロジェクトのライフサイクルを通じて不可欠である:

実際のAI/MLアプリケーション

  1. 医療画像解析:ヘルスケアAIでは、視覚化は複雑な医療スキャンを解釈するのに役立つ。脳腫瘍データセットのようなデータセットでトレーニングされた物体検出モデルは、潜在的な異常を特定するバウンディングボックスを出力することができます。これらのボックスをMRIやCTスキャンに直接重ねて可視化することで、放射線科医はモデルの所見を迅速に評価し、診断に役立てることができる。さらに、画像特徴に基づく患者の転帰クラスタを視覚化することで、疾患のサブタイプを特定するのに役立つ。ヘルスケアにおけるAIは、このような視覚的補助に大きく依存している。国立生体医用画像・生体工学研究所(NIBIB)では、さらなる応用例を探ることができる。
  2. 自律走行車の開発:自動運転車システムは膨大な量のセンサーデータを処理する。開発とテストでは、視覚化が多用されています。エンジニアはLiDARのポイントクラウド、レーダーシグネチャ、カメラフィードを環境の3Dシミュレーションで視覚化します。検出された物体(車、歩行者、自転車)は、次のようなモデルによって識別されます。 YOLOのようなモデルによって識別された物体(車、歩行者、自転車)は、多くの場合、バウンディングボックス、追跡経路、信頼度スコアとともに表示され、開発者はさまざまなシナリオで知覚システムの精度と安全性を検証することができます。車載AIソリューションの例をご覧いただき、Mobileyeのような企業の業界アプローチについて学んでください。

関連用語との区別

  • データ分析:有用な情報を発見し、意思決定をサポートするために、データを検査、クリーニング、変換、モデル化するプロセス全体を含む、より広範な分野である。データ可視化は、データ分析の中で、調査結果の提示やデータの探索に使用されるコンポーネントや ツールですが、分析には、統計モデリング、仮説検証、その他の非可視的手法も含まれます。データアナリティクスの基礎について詳しくはこちらをご覧ください。
  • 画像処理:この分野は、デジタル画像を操作して、その画像を向上させたり、ピクセルデータから直接情報を抽出したりすることに重点を置いている(フィルタリング、エッジ検出、コントラスト調整など)。可視化には画像を表示することも含まれますが、AI/MLにおけるデータ可視化は、画像そのものを変換するのではなく、抽象的なデータ(モデルの性能指標や特徴の関係など)を表現したり、モデルの解釈(検出結果など)を画像に重ね合わせたりすることを扱うことが多いです。この違いについては、Computer Vision vs Image Processingのブログ記事をご覧ください。
  • 探索的データ分析(EDA):EDAとは、データセットを分析し、その主な特徴を理解するプロセスであり、多くの場合、視覚的手法を用いる。データ可視化技術は、パターンを発見し、異常を発見し、仮説を検証し、仮定をチェックするために、EDA中に採用される主要なツールである。注釈付きデータの前処理に関するガイドは、コンピュータ・ビジョンのデータセットに関連するEDAの概念に触れています。
すべて読む