Glosario

XML

Descubre cómo el XML potencia la IA y el ML con la anotación, configuración e intercambio de datos. Aprende su estructura, usos y aplicaciones en el mundo real.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

XML, o Lenguaje de Marcas Extensible, es un lenguaje de marcas diseñado para codificar documentos en un formato legible tanto por humanos como por máquinas. Definido por el Consorcio de la World Wide Web (W3C), su finalidad principal es describir, almacenar y transportar datos, centrándose en lo que son los datos y no en cómo deben mostrarse (a diferencia del HTML). Su naturaleza estructurada y autodescriptiva lo hace adecuado para el intercambio de datos entre distintos sistemas y aplicaciones, incluidos los de Inteligencia Artificial (IA) y Aprendizaje Automático (AM).

Comprender la estructura XML

XML utiliza etiquetas encerradas entre corchetes angulares (< >) para definir elementos, que son los componentes básicos que representan estructuras de datos. Los elementos pueden contener datos u otros elementos anidados, creando una estructura jerárquica de árbol. Las etiquetas también pueden incluir atributos, que proporcionan metadatos adicionales sobre un elemento. Por ejemplo, un archivo de anotación puede contener <object><name>person</name><bndbox><xmin>100</xmin><ymin>150</ymin><xmax>200</xmax><ymax>350</ymax></bndbox></object>. Esta estructura, aunque a menudo más verbosa que otros formatos, es explícita y puede validarse rigurosamente mediante esquemas como XSD (XML Schema Definition).

Relevancia en IA y ML

En los flujos de trabajo de IA y ML, XML cumple varias funciones importantes:

Aplicaciones reales de XML en IA/ML

  1. Formato del conjunto de datos PASCAL VOC: El influyente reto PASCAL Visual Object Classes (VOC) utilizó ampliamente archivos XML para anotar imágenes. Cada archivo XML corresponde a una imagen y enumera todos los objetos presentes, sus etiquetas de clase (por ejemplo, "coche", "persona") y las coordenadas de sus recuadros delimitadores. Muchos conjuntos de datos de detección de objetos aún utilizan o admiten este formato, por lo que es crucial para entrenar modelos como Ultralytics YOLO. Puedes encontrar los detalles de la integración del conjunto de datos VOC en la documentación de Ultralytics .
  2. Metadatos de imágenes médicas (DICOM): El estándar DICOM (Digital Imaging and Communications in Medicine), ampliamente utilizado en la atención sanitaria, suele incorporar estructuras XML o similares a XML para almacenar metadatos junto a las imágenes médicas. Estos metadatos incluyen información sobre el paciente, parámetros de imagen y, a veces, anotaciones o hallazgos del análisis de imágenes médicas, que son vitales para entrenar modelos de IA diagnóstica gestionados a través de plataformas como Ultralytics HUB.

Comparación con JSON y YAML

Aunque XML es potente, otros formatos como JSON (JavaScript Object Notation) y YAML (YAML Ain't Markup Language) han ganado popularidad, especialmente en el desarrollo web y la gestión de la configuración.

  • JSON: Generalmente más conciso y más fácil de analizar para los navegadores web y las aplicaciones JavaScript. Se utiliza mucho en las API.
  • YAML: Diseñado para la legibilidad humana, a menudo se utiliza para archivos de configuración (por ejemplo, en Docker o Kubernetes) debido a su sintaxis mínima.

A pesar del auge de estas alternativas, las estrictas capacidades de validación de XML y su presencia establecida en sistemas empresariales y formatos estandarizados garantizan su relevancia continuada en contextos específicos de IA y ML, especialmente cuando los contratos de datos formales y la interoperabilidad son primordiales.

Leer todo