Glosario

XML

Descubra cómo XML potencia la IA y el ML con la anotación, configuración e intercambio de datos. Conozca su estructura, usos y aplicaciones reales.

XML (eXtensible Markup Language) es un lenguaje de marcado versátil y ampliamente utilizado para codificar documentos en un formato legible tanto por humanos como por máquinas. Desarrollado por el Consorcio World Wide Web (W3C), su finalidad principal es almacenar y transportar datos, no mostrarlos. A diferencia de otros lenguajes de marcado como HTML, XML permite a los usuarios definir sus propias etiquetas, lo que lo hace muy flexible para crear estructuras de datos autodescriptivas. Esta extensibilidad lo convierte en una tecnología fundamental para el intercambio de datos entre distintos sistemas y plataformas en el aprendizaje automático (Machine Learning, ML) y otros campos intensivos en datos.

XML en IA y aprendizaje automático

En el contexto de la Inteligencia Artificial (IA) y la Visión por Computador (CV), XML desempeña un papel crucial en la representación y configuración de datos. Su formato estructurado y jerárquico es ideal para definir anotaciones complejas necesarias para entrenar modelos sofisticados. Aunque las aplicaciones modernas suelen favorecer formatos más ligeros, la robustez de XML y sus estrictas capacidades de validación, a menudo aplicadas mediante esquemas como XML Schema Definition (XSD), lo hacen indispensable para determinadas tareas basadas en estándares. Entre sus principales usos se encuentran la anotación de datos, la configuración de modelos y formatos de intercambio de modelos como el Predictive Model Markup Language (PMML), que permite desplegar modelos en distintas plataformas.

Aplicaciones reales de XML en IA/ML

La naturaleza estructurada de XML lo convierte en una opción fiable para crear conjuntos de datos y metadatos estandarizados. Dos ejemplos destacados son:

  1. Conjunto de datos PASCAL Visual Object Classes (VOC): Este influyente conjunto de datos de detección de objetos, ampliamente utilizado para la evaluación comparativa de modelos como YOLOv8 y YOLO11, utiliza archivos XML para sus anotaciones. Cada archivo XML corresponde a una imagen y contiene información sobre el origen de la imagen, el tamaño y los detalles de cada objeto anotado, incluida su etiqueta de clase (por ejemplo, "coche", "persona") y las coordenadas del cuadro delimitador. Puede encontrar más información en el sitio web oficial de PASCAL VOC y aprender a utilizarlo con los modelos de Ultralytics en la documentación del conjunto de datos VOC. Plataformas como Ultralytics HUB pueden ayudar a gestionar estos conjuntos de datos para el entrenamiento de modelos personalizados.
  2. Metadatos de imágenes médicas (DICOM): El estándar DICOM (Digital Imaging and Communications in Medicine) es omnipresente en la sanidad para almacenar y transmitir imágenes médicas. Aunque DICOM en sí es un formato binario, XML se utiliza habitualmente para representar los extensos metadatos asociados a estas imágenes, como la información del paciente, los parámetros de adquisición y los hallazgos diagnósticos. Estos metadatos estructurados son vitales para las tareas de análisis de imágenes médicas, ya que permiten a investigadores y médicos filtrar conjuntos de datos, entrenar modelos de IA de diagnóstico y garantizar la trazabilidad en las aplicaciones sanitarias de IA.

XML frente a otros formatos

Aunque XML es potente, es importante entender cómo se compara con otros formatos de serialización de datos:

  • JSON (JavaScript Object Notation): JSON ha sustituido en gran medida a XML en las aplicaciones web y las API debido a su sintaxis ligera y su facilidad de análisis sintáctico. JSON es menos verboso que XML porque no utiliza etiquetas de cierre. Aunque XML es excelente para documentos estructurados, a menudo se prefiere JSON para el intercambio de datos en los sistemas modernos.
  • YAML (YAML Ain't Markup Language): YAML da prioridad a la legibilidad humana y utiliza la sangría para representar la estructura de datos, por lo que es una opción popular para los archivos de configuración en proyectos AI/ML, incluyendo para las configuraciones del modelo YOLO de Ultralytics. XML es más verboso, pero su estructura basada en etiquetas puede ser más explícita para datos complejos y anidados en los que se requiere una validación estricta.

En resumen, aunque no siempre es el formato más conciso, la naturaleza estructurada de XML, su extensibilidad y sus sólidas capacidades de validación garantizan su papel continuado en áreas específicas de la IA y el ML, especialmente en la anotación de datos, los formatos de intercambio de modelos y la integración de datos empresariales.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles