Глоссарий

XML

Открой для себя, как XML питает AI и ML с помощью аннотации, конфигурации и обмена данными. Узнай о его структуре, использовании и реальных применениях!

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

XML, или Extensible Markup Language, - это язык разметки, предназначенный для кодирования документов в формате, который является одновременно человекочитаемым и машиночитаемым. Он широко используется для хранения и транспортировки данных, особенно в конфигурациях и обмене данными между системами. В отличие от HTML, который предназначен для отображения данных, XML предназначен для описания и транспортировки данных, фокусируясь на том, что представляют собой данные, а не на том, как они выглядят. Его гибкость и универсальность сделали его краеугольным камнем во многих технологических областях, включая искусственный интеллект и машинное обучение.

Понимание структуры XML

XML-документы структурируются с помощью тегов, атрибутов и элементов. Теги, заключенные в угловые скобки < >определяют начало и конец элементов. Элементы - это основные строительные блоки XML-документа, представляющие категории данных или структуры. Атрибуты предоставляют дополнительную информацию об элементах и включаются в тег начала. Например, в описании набора данных ты можешь использовать XML для определения полей данных и их свойств. Элемент может быть <image>а атрибут может указывать на его формат, например <image format="JPEG">. Такой структурированный подход позволяет представлять данные в иерархическом виде, что облегчает их разбор и обработку как людьми, так и машинами. Ты можешь найти сходство в структуре с YAMLеще один человекочитаемый язык сериализации данных, но XML отличается многословным синтаксисом, основанным на тегах.

Актуальность в искусственном интеллекте и ML

В контексте ИИ и МЛ XML играет несколько важнейших ролей. Его часто используют для:

  • Хранение аннотаций данных: XML - распространенный формат для хранения аннотаций в наборах данных, особенно в компьютерном зрении. Например, координаты ограничительных рамок для задач обнаружения объектов часто сохраняются в XML-файлах, подробно описывая расположение и класс объектов на изображениях. Эти аннотации необходимы для обучения таких моделей, как Ultralytics YOLO , для решения таких задач, как сегментация изображений или оценка позы.
  • Файлы конфигурации: XML используется для создания конфигурационных файлов для программных приложений, включая ML-фреймворки. Эти файлы могут определять параметры для обучения модели, этапы предварительной обработки данных или настройки развертывания. Хотя новые форматы, такие как JSON или YAML, набирают популярность для создания конфигураций благодаря более простому синтаксису, XML по-прежнему распространен в унаследованных системах и корпоративных средах.
  • Обмен данными: Стандартизированный формат XML облегчает обмен данными между различными системами и платформами. В конвейерных системах искусственного интеллекта может потребоваться передача данных между различными этапами - от сбора и предварительной обработки данных до обучения и развертывания модели. XML обеспечивает согласованный формат для такого обмена данными, гарантируя совместимость и взаимодополняемость.

Реальные применения XML в AI/ML

  1. Анализ медицинских изображений: В анализе медицинских изображений XML часто используется для хранения аннотаций к медицинским снимкам, таким как рентгеновские, компьютерные и магнитно-резонансные. Рентгенологи могут аннотировать интересующие их области, например опухоли или переломы, и сохранять эти аннотации в формате XML вместе с данными изображения. Эти XML-аннотации затем используются для обучения моделей искусственного интеллекта, чтобы автоматически обнаруживать аномалии на медицинских изображениях, помогая в диагностике и планировании лечения.
  2. Конфигурирование роботов: В робототехнике, особенно в системах, использующих компьютерное зрение, XML может конфигурировать датчики робота и конвейеры обработки зрения. Например, XML-файл может определять параметры камеры, алгоритмы обработки изображений и модели обнаружения объектов (например, Ultralytics YOLO модели, развернутые на NVIDIA Jetson), используемые в роботизированной системе для навигации или манипулирования объектами.

Хотя форматы вроде JSON сейчас часто предпочитают для обмена данными в интернете и более легких конфигураций, надежная структура XML и его широкое распространение обеспечивают его постоянную актуальность в различных аспектах ИИ и машинного обучения, особенно там, где необходимо стандартизированное, многословное и структурированное представление данных.

Читать полностью