Glossar

XML

Entdecken Sie, wie XML KI und ML mit Datenkommentaren, Konfiguration und Austausch unterstützt. Lernen Sie die Struktur, die Verwendung und die praktischen Anwendungen kennen!

XML (eXtensible Markup Language) ist eine vielseitige und weit verbreitete Auszeichnungssprache zur Kodierung von Dokumenten in einem Format, das sowohl für Menschen als auch für Maschinen lesbar ist. Sie wurde vom World Wide Web Consortium (W3C) entwickelt und dient in erster Linie der Speicherung und dem Transport von Daten, nicht deren Darstellung. Im Gegensatz zu anderen Auszeichnungssprachen wie HTML können Benutzer mit XML ihre eigenen Tags definieren, was es sehr flexibel für die Erstellung selbstbeschreibender Datenstrukturen macht. Diese Erweiterbarkeit macht es zu einer grundlegenden Technologie für den Datenaustausch zwischen verschiedenen Systemen und Plattformen im Bereich des maschinellen Lernens (ML) und anderen datenintensiven Bereichen.

XML in KI und maschinellem Lernen

Im Zusammenhang mit Künstlicher Intelligenz (KI) und Computer Vision (CV) spielt XML eine entscheidende Rolle bei der Darstellung und Konfiguration von Daten. Sein strukturiertes, hierarchisches Format ist ideal für die Definition komplexer Anmerkungen, die zum Trainieren anspruchsvoller Modelle benötigt werden. Während moderne Anwendungen oft einfachere Formate bevorzugen, machen die Robustheit und die strengen Validierungsfunktionen von XML, die oft durch Schemas wie XML Schema Definition (XSD) erzwungen werden, XML für bestimmte standardbasierte Aufgaben unverzichtbar. Zu den wichtigsten Verwendungszwecken zählen Datenkommentare, Modellkonfiguration und Modellaustauschformate wie die Predictive Model Markup Language (PMML), die die Bereitstellung von Modellen auf verschiedenen Plattformen ermöglicht.

Praktische Anwendungen von XML in AI/ML

Die strukturierte Natur von XML macht es zu einer zuverlässigen Wahl für die Erstellung standardisierter Datensätze und Metadaten. Zwei prominente Beispiele hierfür sind:

  1. PASCAL Visual Object Classes (VOC)-Datensatz: Dieser einflussreiche Datensatz zur Objekterkennung, der häufig für das Benchmarking von Modellen wie YOLOv8 und YOLO11 verwendet wird, nutzt XML-Dateien für seine Annotationen. Jede XML-Datei entspricht einem Bild und enthält Informationen über die Bildquelle, die Größe und Details für jedes annotierte Objekt, einschließlich der Klassenbezeichnung (z. B. "Auto", "Person") und der Koordinaten der Bounding Box. Einzelheiten finden Sie auf der offiziellen PASCAL VOC-Website, und in der VOC-Datensatzdokumentation erfahren Sie, wie Sie ihn mit Ultralytics-Modellen verwenden können. Plattformen wie Ultralytics HUB können bei der Verwaltung solcher Datensätze für das Training benutzerdefinierter Modelle helfen.
  2. Metadaten für medizinische Bilder (DICOM): Der DICOM-Standard (Digital Imaging and Communications in Medicine) ist im Gesundheitswesen für die Speicherung und Übermittlung medizinischer Bilder allgegenwärtig. Während DICOM selbst ein binäres Format ist, wird XML üblicherweise verwendet, um die umfangreichen Metadaten zu diesen Bildern darzustellen, wie z. B. Patienteninformationen, Aufnahmeparameter und Diagnoseergebnisse. Diese strukturierten Metadaten sind für Aufgaben in der medizinischen Bildanalyse unerlässlich und ermöglichen es Forschern und Klinikern, Datensätze zu filtern, diagnostische KI-Modelle zu trainieren und die Rückverfolgbarkeit in KI-Anwendungen im Gesundheitswesen sicherzustellen.

XML vs. andere Formate

XML ist zwar leistungsfähig, aber es ist wichtig zu verstehen, wie es im Vergleich zu anderen Formaten der Datenserialisierung aussieht:

  • JSON (JavaScript Object Notation): JSON hat XML in Webanwendungen und APIs aufgrund seiner leichtgewichtigen Syntax und einfachen Analyse weitgehend ersetzt. JSON ist weniger ausführlich als XML, da es keine schließenden Tags verwendet. Während sich XML hervorragend für strukturierte Dokumente eignet, wird JSON häufig für den Datenaustausch in modernen Systemen bevorzugt.
  • YAML (YAML Ain't Markup Language): YAML legt den Schwerpunkt auf die Lesbarkeit für den Menschen und verwendet Einrückungen zur Darstellung der Datenstruktur, was es zu einer beliebten Wahl für Konfigurationsdateien in KI/ML-Projekten macht, auch für Ultralytics YOLO-Modellkonfigurationen. XML ist ausführlicher, aber seine Tag-basierte Struktur kann für komplexe, verschachtelte Daten, die eine strenge Validierung erfordern, eindeutiger sein.

Zusammenfassend lässt sich sagen, dass XML zwar nicht immer das prägnanteste Format ist, aber aufgrund seiner strukturierten Beschaffenheit, seiner Erweiterbarkeit und seiner robusten Validierungsfunktionen auch weiterhin eine wichtige Rolle in bestimmten Bereichen der KI und des ML spielen wird, insbesondere bei Datenkommentaren, Modellaustauschformaten und der Integration von Unternehmensdaten.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert