Glossário

XML

Descubra como o XML potencia a IA e o ML com anotação, configuração e troca de dados. Conheça a sua estrutura, utilizações e aplicações no mundo real!

A XML (eXtensible Markup Language) é uma linguagem de marcação versátil e amplamente utilizada para codificar documentos num formato legível tanto por humanos como por máquinas. Desenvolvida pelo World Wide Web Consortium (W3C), o seu principal objetivo é armazenar e transportar dados, e não apresentá-los. Ao contrário de outras linguagens de marcação como o HTML, o XML permite que os utilizadores definam as suas próprias etiquetas, o que o torna altamente flexível para a criação de estruturas de dados auto-descritivas. Esta extensibilidade faz com que seja uma tecnologia fundamental para o intercâmbio de dados entre diferentes sistemas e plataformas em Aprendizagem Automática (AM) e noutros domínios de utilização intensiva de dados.

XML em IA e aprendizagem automática

No contexto da Inteligência Artificial (IA) e da Visão por Computador (CV), o XML desempenha um papel crucial na representação e configuração de dados. O seu formato estruturado e hierárquico é ideal para definir anotações complexas necessárias para treinar modelos sofisticados. Embora as aplicações modernas favoreçam frequentemente formatos mais leves, a robustez do XML e as capacidades de validação rigorosas, muitas vezes aplicadas através de esquemas como o XML Schema Definition (XSD), tornam-no indispensável para determinadas tarefas baseadas em normas. As principais utilizações incluem anotação de dados, configuração de modelos e formatos de intercâmbio de modelos, como a Predictive Model Markup Language (PMML), que permite a implementação de modelos em diferentes plataformas.

Aplicações do mundo real da XML em IA/ML

A natureza estruturada do XML torna-o uma escolha fiável para a criação de conjuntos de dados e metadados normalizados. Dois exemplos proeminentes incluem:

  1. Conjunto de dados PASCAL Visual Object Classes (VOC): Este influente conjunto de dados de deteção de objectos, amplamente utilizado para modelos de avaliação comparativa como o YOLOv8 e o YOLO11, utiliza ficheiros XML para as suas anotações. Cada ficheiro XML corresponde a uma imagem e contém informações sobre a origem da imagem, o tamanho e os detalhes de cada objeto anotado, incluindo a sua etiqueta de classe (por exemplo, "carro", "pessoa") e as coordenadas da caixa delimitadora. Pode encontrar mais informações no sítio Web oficial do PASCAL VOC e aprender a utilizá-lo com os modelos Ultralytics na documentação do conjunto de dados VOC. Plataformas como o Ultralytics HUB podem ajudar a gerir esses conjuntos de dados para treinar modelos personalizados.
  2. Metadados de imagens médicas (DICOM): A norma DICOM (Digital Imaging and Communications in Medicine) é omnipresente nos cuidados de saúde para armazenar e transmitir imagens médicas. Embora o DICOM em si seja um formato binário, o XML é normalmente utilizado para representar os extensos metadados associados a estas imagens, tais como informações sobre o doente, parâmetros de aquisição e resultados de diagnósticos. Estes metadados estruturados são vitais para as tarefas de análise de imagens médicas, permitindo aos investigadores e clínicos filtrar conjuntos de dados, treinar modelos de IA de diagnóstico e garantir a rastreabilidade em aplicações de IA nos cuidados de saúde.

XML vs. Outros formatos

Embora o XML seja poderoso, é importante compreender como se compara a outros formatos de serialização de dados:

  • JSON (JavaScript Object Notation): O JSON substituiu largamente o XML em aplicações Web e APIs devido à sua sintaxe leve e facilidade de análise. O JSON é menos prolixo do que o XML porque não utiliza etiquetas de fecho. Embora o XML seja excelente para documentos estruturados, o JSON é frequentemente preferido para o intercâmbio de dados em sistemas modernos.
  • YAML (YAML Ain't Markup Language): A YAML dá prioridade à legibilidade humana e utiliza indentação para representar a estrutura de dados, o que a torna uma escolha popular para ficheiros de configuração em projectos de IA/ML, incluindo para as configurações do modelo Ultralytics YOLO. O XML é mais detalhado, mas sua estrutura baseada em tags pode ser mais explícita para dados complexos e aninhados, nos quais é necessária uma validação rigorosa.

Em suma, embora nem sempre seja o formato mais conciso, a natureza estruturada, a extensibilidade e as capacidades de validação robustas do XML asseguram o seu papel contínuo em áreas específicas da IA e do ML, nomeadamente na anotação de dados, nos formatos de intercâmbio de modelos e na integração de dados empresariais.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência