용어집

XML

XML이 데이터 주석, 구성 및 교환을 통해 어떻게 AI와 ML을 지원하는지 알아보세요. 구조, 용도, 실제 적용 사례에 대해 알아보세요!

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

XML(확장 가능한 마크업 언어)은 사람이 읽을 수 있고 기계가 읽을 수 있는 형식으로 문서를 인코딩하기 위해 고안된 마크업 언어입니다. W3C(월드와이드웹 컨소시엄)에서 정의한 이 언어의 주요 목적은 데이터를 설명, 저장 및 전송하는 것으로, HTML과 달리 데이터를 표시하는 방법보다는 데이터가 무엇인지에 초점을 맞추고 있습니다. 구조적이고 자기 설명적인 특성으로 인해 인공 지능(AI) 및 머신 러닝(ML)을 비롯한 다양한 시스템과 애플리케이션 간의 데이터 교환에 적합합니다.

XML 구조 이해

XML은 꺾쇠 괄호로 묶인 태그(< >)를 사용하여 데이터 구조를 나타내는 핵심 구성 요소인 요소를 정의할 수 있습니다. 요소는 데이터 또는 다른 중첩된 요소를 포함할 수 있으며 계층적 트리 구조를 만듭니다. 태그에는 요소에 대한 추가 메타데이터를 제공하는 속성이 포함될 수도 있습니다. 예를 들어, 주석 파일에는 다음이 포함될 수 있습니다. <object><name>person</name><bndbox><xmin>100</xmin><ymin>150</ymin><xmax>200</xmax><ymax>350</ymax></bndbox></object>. 이 구조는 다른 형식보다 장황한 경우가 많지만, 명시적이며 XSD(XML 스키마 정의)와 같은 스키마를 사용하여 엄격하게 검증할 수 있습니다.

AI와 ML의 관련성

AI 및 ML 워크플로우에서 XML은 몇 가지 중요한 기능을 수행합니다:

  • 데이터 어노테이션: 일반적으로 컴퓨터 비전(CV) 작업에서 학습 데이터에 대한 주석을 저장하는 데 사용됩니다. 여기에는 객체 감지를 위한 경계 상자 좌표 정의 또는 이미지 분할을 위한 폴리곤 윤곽선 정의가 포함됩니다.
  • 구성 파일: XML은 소프트웨어 도구, ML 실험 또는 처리 파이프라인을 구성하는 데 사용할 수 있지만, 현재는 단순성 때문에 YAML과 같은 형식이 선호되는 경우가 많습니다.
  • 데이터 교환 및 상호 운용성: 표준화된 형식으로 서로 다른 소프트웨어 시스템이나 연구 그룹 간에 데이터 세트, 모델 결과 또는 구성을 쉽게 공유할 수 있습니다.
  • 모델 표현: 예측 모델 마크업 언어(PMML) 와 같은 표준은 XML을 사용하여 통계 및 데이터 마이닝 모델을 정의함으로써 다양한 플랫폼에 걸쳐 모델을 배포할 수 있게 해줍니다.

AI/ML에서 XML의 실제 적용 사례

  1. PASCAL VOC 데이터 세트 형식: 영향력 있는 PASCAL 시각 객체 클래스(VOC) 챌린지는 이미지에 주석을 달기 위해 XML 파일을 광범위하게 사용했습니다. 각 XML 파일은 이미지에 해당하며 존재하는 모든 객체, 클래스 레이블(예: '자동차', '사람'), 경계 상자 좌표가 나열되어 있습니다. 많은 객체 감지 데이터 세트가 여전히 이 형식을 사용하거나 지원하므로 다음과 같은 훈련 모델에 매우 중요합니다. Ultralytics YOLO. VOC 데이터 세트 통합에 대한 자세한 내용은 Ultralytics 설명서에서 확인할 수 있습니다.
  2. 의료 영상 메타데이터(DICOM): 의료 분야에서 널리 사용되는 DICOM(디지털 이미징 및 의학 커뮤니케이션) 표준은 종종 의료 이미지와 함께 메타데이터를 저장하기 위해 XML 또는 XML과 유사한 구조를 통합합니다. 이 메타데이터에는 환자 정보, 이미징 매개변수, 때로는 의료 이미지 분석의 주석이나 결과가 포함되며, 이는 Ultralytics HUB와 같은 플랫폼을 통해 관리되는 진단 AI 모델을 훈련하는 데 필수적입니다.

JSON 및 YAML과의 비교

XML도 강력하지만, 특히 웹 개발 및 구성 관리 분야에서 JSON(JavaScript Object Notation ) 및 YAML(YAML Ain't Markup Language) 과 같은 다른 형식이 인기를 얻고 있습니다.

  • JSON: 일반적으로 더 간결하고 웹 브라우저와 JavaScript 애플리케이션이 구문 분석하기 쉽습니다. API에서 널리 사용됩니다.
  • YAML: 사람이 쉽게 읽을 수 있도록 설계되었으며, 최소한의 구문으로 인해 구성 파일(예: Docker 또는 Kubernetes)에 자주 사용됩니다.

이러한 대안이 부상하고 있지만, XML의 엄격한 검증 기능과 엔터프라이즈 시스템 및 표준화된 형식에서 확립된 입지는 특히 공식적인 데이터 계약과 상호 운용성이 가장 중요한 특정 AI 및 ML 상황에서 지속적인 관련성을 보장합니다.

모두 보기