用語集

XML

XMLがAIやMLのデータ注釈、構成、交換をどのように強化するかをご覧ください。XMLの構造、用途、実際のアプリケーションについて学びます!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

XML(Extensible Markup Language)は、ワールド・ワイド・ウェブ・コンソーシアム(W3C)によって作成された汎用性の高いマークアップ言語で、人間が読め、かつ機械が読める方法で文書をエンコードするためのものである。データをどのように表示するかに重点を置くHTMLとは異なり、XMLの主な役割は、データの記述、保存、転送であり、データが何であるかに重点を置いている。その構造化された自己記述フォーマットにより、人工知能(AI)や機械学習(ML)で使用されるものを含め、異なるシステムやアプリケーション間での情報交換に非常に適している。XMLを理解することは、多様なデータセットを扱う人や、MLパイプライン内で異なるツールを統合する人にとって有益である。

XMLの構造を理解する

XML では、角括弧 (< >).これらのタグは、データ構造を表す基本的な構成要素であるエレメントを定義します。要素には、テキスト・データ、入れ子になった他の要素、またはその組み合わせを含めることができ、階層ツリーのような構造を形成します。タグは属性を持つこともでき、属性は要素に関する付加的なメタデータを提供する。例えば、書籍データを記述したXMLファイルは次のようになります。 <book category="fiction"><title>Example Novel</title><author>Jane Doe</author></book>.この明示的な構造は、他のフォーマットよりも冗長な場合もありますが、XSD (XMLスキーマ定義)、データの一貫性を確保する。 データ前処理 のステージがある。

AIとMLにおける関連性

JSONや YAMLのような新しいフォーマットは、その簡潔さゆえに特定のタスクでますます人気が高まっているが、XMLはAIやMLのいくつかの重要な分野では依然として関連している:

XMLと関連フォーマット

XMLを他の一般的なデータ・シリアライゼーション・フォーマットと区別することは有益である:

  • JSON(JavaScript Object Notation):XMLのタグベースの構文に比べ、JSONはJavaScriptオブジェクトから派生した、より軽量なキーと値のペア構造を使用しています。JSONは一般的に冗長でなく、ウェブアプリケーションやAPIが解析しやすい。詳しくはJSONの公式規格を参照。XMLには名前空間とスキーマのサポートが組み込まれていますが、JSONは通常、検証のために外部の規約に依存しています。
  • YAML (YAML Ain't Markup Language): YAMLは人間の読みやすさを優先し、タグや括弧の代わりにインデントを使って構造を表します。YAMLはMLプロジェクト( Ultralytics YOLOモデルを含む)やKubernetesのようなinfrastructure-as-codeツールの設定ファイルによく使われる。詳細については、YAMLの仕様を参照してください。

AI/MLにおけるXMLの実世界応用

  1. PASCAL Visual Object Classes (VOC) データセット:この有力な物体検出データセットは、以下のようなモデルのベンチマークに広く使用されている。 YOLOv8YOLO11のようなモデルのベンチマークに広く使用されている。各XMLファイルは画像に対応し、画像ソース、サイズ、クラスラベル(例:'車'、'人')とバウンディングボックス座標(xmin、ymin、xmax、ymax)を含む各注釈付きオブジェクトの詳細に関する情報を含んでいます。詳細はPASCAL VOCの公式ウェブサイトをご覧ください。また、VOCデータセットのドキュメントで Ultralytics モデルでの使用方法をご覧いただけます。Ultralytics HUBのようなプラットフォームは、カスタムモデルをトレーニングするためにこのようなデータセットを管理するのに役立ちます。
  2. 医用画像メタデータ(DICOM): DICOM(Digital Imaging and Communications in Medicine)標準は、医療画像の保存と伝送のために医療現場で広く使われている。DICOM自体はバイナリ形式ですが、患者情報、撮影パラメータ、診断所見など、画像に関連する広範なメタデータを表現するためにXMLが一般的に使用されています。この構造化されたメタデータは、医用画像解析のタスクに不可欠であり、研究者や臨床医がデータセットをフィルタリングし、診断AIモデル(AI in Radiology)を訓練し、AIヘルスケアアプリケーションでトレーサビリティを確保することを可能にする。

まとめると、必ずしも最も簡潔なフォーマットではないが、XMLの構造化された性質、拡張性、および堅牢な検証機能は、AIおよびMLの特定の分野、特にデータ注釈標準、PMMLのようなモデル交換フォーマット、およびエンタープライズデータ統合において、XMLの継続的な役割を保証する。XMLに精通していることは、現場の多様なデータソースやツールをナビゲートする上で貴重である。

すべて読む