XML (Extensible Markup Language) ist eine Auszeichnungssprache, mit der Dokumente in einem Format kodiert werden können, das sowohl für Menschen als auch für Maschinen lesbar ist. Sie wurde vom World Wide Web Consortium (W3C) definiert und dient in erster Linie dazu, Daten zu beschreiben, zu speichern und zu transportieren, wobei der Schwerpunkt darauf liegt, was die Daten sind, und nicht, wie sie dargestellt werden sollen (im Gegensatz zu HTML). Durch seine strukturierte und selbstbeschreibende Natur eignet es sich für den Datenaustausch zwischen verschiedenen Systemen und Anwendungen, einschließlich derjenigen in den Bereichen Künstliche Intelligenz (KI) und Maschinelles Lernen (ML).
Die XML-Struktur verstehen
XML verwendet in spitzen Klammern eingeschlossene Tags (< >
), um Elemente zu definieren, die die Kernkomponenten von Datenstrukturen darstellen. Elemente können Daten oder andere verschachtelte Elemente enthalten, die eine hierarchische Baumstruktur bilden. Tags können auch Attribute enthalten, die zusätzliche Metadaten über ein Element liefern. Eine Annotationsdatei kann zum Beispiel enthalten <object><name>person</name><bndbox><xmin>100</xmin><ymin>150</ymin><xmax>200</xmax><ymax>350</ymax></bndbox></object>
. Diese Struktur ist zwar oft ausführlicher als andere Formate, aber sie ist eindeutig und kann mithilfe von Schemata wie XSD (XML Schema Definition) streng validiert werden.
Relevanz in KI und ML
In KI- und ML-Workflows erfüllt XML mehrere wichtige Funktionen:
- Datenkommentare: Sie wird häufig verwendet, um Anmerkungen für Trainingsdaten in Computer Vision (CV) Aufgaben zu speichern. Dazu gehört das Festlegen von Bounding-Box-Koordinaten für die Objekterkennung oder das Umreißen von Polygonen für die Bildsegmentierung.
- Konfigurationsdateien: XML kann verwendet werden, um Software-Tools, ML-Experimente oder Verarbeitungspipelines zu konfigurieren, obwohl Formate wie YAML wegen ihrer Einfachheit heute oft bevorzugt werden.
- Datenaustausch und Interoperabilität: Sein standardisiertes Format erleichtert den Austausch von Datensätzen, Modellergebnissen oder Konfigurationen zwischen verschiedenen Softwaresystemen oder Forschungsgruppen.
- Modelldarstellung: Standards wie Predictive Model Markup Language (PMML) verwenden XML, um statistische und Data-Mining-Modelle zu definieren und ermöglichen den Einsatz der Modelle auf verschiedenen Plattformen.
Reale Anwendungen von XML in KI/ML
- PASCAL VOC Dataset Format: Bei dem einflussreichen PASCAL-Wettbewerb Visual Object Classes (VOC) wurden XML-Dateien für die Beschriftung von Bildern verwendet. Jede XML-Datei entspricht einem Bild und listet alle vorhandenen Objekte, ihre Klassenbezeichnungen (z. B. "Auto", "Person") und die Koordinaten ihrer Bounding Box auf. Viele Objekterkennungsdatensätze verwenden oder unterstützen dieses Format noch immer, so dass es für das Training von Modellen wie Ultralytics YOLO. Einzelheiten zur Integration von VOC-Datensätzen findest du in der Ultralytics .
- Metadaten für medizinische Bilder (DICOM): Der DICOM-Standard (Digital Imaging and Communications in Medicine), der im Gesundheitswesen weit verbreitet ist, enthält oft XML- oder XML-ähnliche Strukturen, um Metadaten zu medizinischen Bildern zu speichern. Diese Metadaten enthalten Patienteninformationen, Bildgebungsparameter und manchmal auch Anmerkungen oder Befunde aus der medizinischen Bildanalyse, die für das Training diagnostischer KI-Modelle, die über Plattformen wie Ultralytics HUB verwaltet werden, unerlässlich sind.
Vergleich mit JSON und YAML
XML ist zwar sehr mächtig, aber andere Formate wie JSON (JavaScript Object Notation) und YAML (YAML Ain't Markup Language) haben an Beliebtheit gewonnen, vor allem in der Webentwicklung und im Konfigurationsmanagement.
- JSON: Generell prägnanter und einfacher für Webbrowser und JavaScript-Anwendungen zu analysieren. Es wird häufig in APIs verwendet.
- YAML: Wurde für die menschliche Lesbarkeit entwickelt und wird aufgrund seiner minimalen Syntax häufig für Konfigurationsdateien (z. B. in Docker oder Kubernetes) verwendet.
Trotz des Aufstiegs dieser Alternativen sorgen die strengen Validierungsfunktionen und die etablierte Präsenz von XML in Unternehmenssystemen und standardisierten Formaten dafür, dass XML in bestimmten KI- und ML-Kontexten weiterhin relevant bleibt, insbesondere dort, wo formale Datenverträge und Interoperabilität von größter Bedeutung sind.