用語集

XML

XMLがAIやMLのデータ注釈、構成、交換をどのように強化するかをご覧ください。XMLの構造、用途、実際のアプリケーションについて学びます!

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

XML(Extensible Markup Language)は、人間が読むことも機械が読むこともできる形式で文書をエンコードするために設計されたマークアップ言語である。ワールド・ワイド・ウェブ・コンソーシアム(W3C)によって定義されたこの言語の主な目的は、データを記述、保存、転送することであり、(HTMLとは異なり)データをどのように表示するかよりも、データが何であるかに重点を置いている。その構造化された自己記述的な性質は、人工知能(AI)や機械学習(ML)を含む異なるシステムやアプリケーション間でのデータ交換に適している。

XMLの構造を理解する

XML では、角括弧 (< >)を使って要素を定義する。要素は、データ構造を表す核となるコンポーネントである。要素にはデータや他の入れ子要素を含めることができ、階層的なツリー構造を作ります。タグには属性を含めることもでき、要素に関する追加のメタデータを提供します。例えば、注釈ファイルには <object><name>person</name><bndbox><xmin>100</xmin><ymin>150</ymin><xmax>200</xmax><ymax>350</ymax></bndbox></object>.この構造は、他のフォーマットよりも冗長であることが多いが、明示的であり、XSD(XML Schema Definition)のようなスキーマを使って厳密に検証することができる。

AIとMLにおける関連性

AIやMLのワークフローにおいて、XMLはいくつかの重要な機能を果たす:

AI/MLにおけるXMLの実世界応用

  1. PASCAL VOCデータセットフォーマット: PASCALのVOC(Visual Object Classes)チャレンジでは、画像のアノテーションにXMLファイルを多用した。各XMLファイルは画像に対応し、存在するすべてのオブジェクト、そのクラスラベル(例:「車」、「人」)、バウンディングボックスの座標を一覧表示します。多くの物体検出データセットは、現在もこの形式を使用またはサポートしており、次のようなモデルの学習に不可欠です。 Ultralytics YOLO.VOCデータセットの統合に関する詳細は、Ultralytics ドキュメントをご覧ください。
  2. 医用画像メタデータ(DICOM):医療で広く使用されているDICOM(Digital Imaging and Communications in Medicine)標準では、医療画像とともにメタデータを保存するために、XMLまたはXMLに似た構造が組み込まれていることが多い。このメタデータには、患者情報、画像パラメータ、時には注釈や医療画像解析による所見が含まれ、Ultralytics HUBのようなプラットフォームを通じて管理される診断AIモデルのトレーニングに不可欠です。

JSONとYAMLとの比較

XMLは強力だが、JSON(JavaScript Object Notation)やYAML(YAML Ain't Markup Language)といった他のフォーマットも、特にウェブ開発やコンフィギュレーション管理で人気を博している。

  • JSON一般により簡潔で、ウェブブラウザやJavaScriptアプリケーションが解析しやすい。APIで広く使われている。
  • YAML人間が読みやすいように設計されており、最小限の構文であるため、設定ファイル(DockerやKubernetesなど)によく使われる。

このような代替手段の台頭にもかかわらず、XMLの厳格な検証能力と、企業システムや標準化されたフォーマットにおける確立された存在感は、特に正式なデータ契約と相互運用性が最も重要な、特定のAIとMLの文脈におけるXMLの継続的な妥当性を保証している。

すべて読む