Glossario

XML

Scopri come l'XML alimenta l'AI e il ML con l'annotazione, la configurazione e lo scambio di dati. Impara la sua struttura, i suoi usi e le sue applicazioni reali!

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'XML, o Extensible Markup Language, è un linguaggio di markup progettato per codificare i documenti in un formato leggibile sia dall'uomo che dalla macchina. Definito dal World Wide Web Consortium (W3C), il suo scopo principale è quello di descrivere, archiviare e trasportare i dati, concentrandosi sui dati stessi piuttosto che sulla loro visualizzazione (a differenza dell'HTML). La sua natura strutturata e autodescrittiva lo rende adatto allo scambio di dati tra diversi sistemi e applicazioni, compresi quelli di Intelligenza Artificiale (AI) e Machine Learning (ML).

Capire la struttura di XML

L'XML utilizza tag racchiusi tra parentesi angolari (< >) per definire gli elementi, che sono i componenti principali che rappresentano le strutture di dati. Gli elementi possono contenere dati o altri elementi annidati, creando una struttura gerarchica ad albero. I tag possono anche includere attributi che forniscono metadati aggiuntivi su un elemento. Ad esempio, un file di annotazione potrebbe contenere <object><name>person</name><bndbox><xmin>100</xmin><ymin>150</ymin><xmax>200</xmax><ymax>350</ymax></bndbox></object>. Questa struttura, anche se spesso è più prolissa rispetto ad altri formati, è esplicita e può essere rigorosamente convalidata utilizzando schemi come XSD (XML Schema Definition).

Rilevanza nell'AI e nel ML

Nei flussi di lavoro AI e ML, l'XML svolge diverse funzioni importanti:

Applicazioni reali di XML nell'AI/ML

  1. Formato del set di dati PASCAL VOC: L'autorevole sfida PASCAL Visual Object Classes (VOC) ha utilizzato ampiamente i file XML per annotare le immagini. Ogni file XML corrisponde a un'immagine ed elenca tutti gli oggetti presenti, le loro etichette di classe (ad esempio, "auto", "persona") e le loro coordinate del rettangolo di gioco. Molti set di dati per il rilevamento di oggetti utilizzano o supportano ancora questo formato, il che lo rende fondamentale per l'addestramento di modelli come Ultralytics YOLO. Puoi trovare i dettagli dell'integrazione del dataset VOC nella documentazione di Ultralytics .
  2. Metadati di immagini mediche (DICOM): Lo standard DICOM (Digital Imaging and Communications in Medicine), ampiamente utilizzato nel settore sanitario, spesso incorpora XML o strutture simili a XML per memorizzare i metadati insieme alle immagini mediche. Questi metadati includono informazioni sul paziente, parametri di imaging e talvolta annotazioni o risultati dell'analisi delle immagini mediche, che sono fondamentali per l'addestramento di modelli di intelligenza artificiale diagnostica gestiti da piattaforme come Ultralytics HUB.

Confronto con JSON e YAML

Sebbene XML sia potente, altri formati come JSON (JavaScript Object Notation) e YAML (YAML Ain't Markup Language) hanno guadagnato popolarità, soprattutto nello sviluppo web e nella gestione della configurazione.

  • JSON: generalmente più conciso e più facile da analizzare per i browser web e le applicazioni JavaScript. È molto utilizzato nelle API.
  • YAML: Progettato per la leggibilità umana, spesso utilizzato per i file di configurazione (ad esempio, in Docker o Kubernetes) grazie alla sua sintassi minimale.

Nonostante l'ascesa di queste alternative, le rigorose capacità di validazione di XML e la sua presenza consolidata nei sistemi aziendali e nei formati standardizzati ne garantiscono la continua rilevanza in contesti specifici di AI e ML, in particolare quando i contratti formali sui dati e l'interoperabilità sono fondamentali.

Leggi tutto