Sözlük

XML

XML'in veri ek açıklaması, yapılandırması ve değişimi ile yapay zeka ve makine öğrenimini nasıl desteklediğini keşfedin. Yapısını, kullanımlarını ve gerçek dünya uygulamalarını öğrenin!

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

XML veya Genişletilebilir İşaretleme Dili, World Wide Web Konsorsiyumu (W3C) tarafından belgeleri hem insan tarafından okunabilir hem de makine tarafından okunabilir bir şekilde kodlamak için oluşturulan çok yönlü bir işaretleme dilidir. Verilerin nasıl görüntülenmesi gerektiğine odaklanan HTML'den farklı olarak XML'in birincil rolü, verilerin ne olduğunu vurgulayarak verileri tanımlamak, saklamak ve taşımaktır. Yapılandırılmış, kendi kendini tanımlayan formatı, Yapay Zeka (AI) ve Makine Öğreniminde (ML) kullanılanlar da dahil olmak üzere farklı sistemler ve uygulamalar arasında bilgi alışverişi için son derece uygundur. XML'i anlamak, farklı veri kümeleriyle çalışan veya bir makine öğrenimi hattına farklı araçları entegre eden herkes için faydalıdır.

XML Yapısını Anlama

XML, verileri açılı parantezler içine alınmış etiketler (< >). Bu etiketler, veri yapılarını temsil eden temel yapı taşları olan öğeleri tanımlar. Öğeler metin verileri, diğer iç içe geçmiş öğeler veya hiyerarşik ağaç benzeri bir yapı oluşturan bir kombinasyon içerebilir. Etiketler, bir öğe hakkında ek meta veriler sağlayan niteliklere de sahip olabilir. Örneğin, kitap verilerini tanımlayan bir XML dosyası aşağıdaki gibi görünebilir <book category="fiction"><title>Example Novel</title><author>Jane Doe</author></book>. Bu açık yapı, bazen diğer formatlardan daha ayrıntılı olsa da, XSD gibi şemalara karşı titiz doğrulamaya izin verir (XML Şema Tanımı), karmaşık uygulamalarda çok önemli olan veri tutarlılığını sağlar veri ön işleme aşamaları.

Yapay Zeka ve Makine Öğreniminde Uygunluk

JSON ve YAML gibi yeni formatlar, özlü olmaları nedeniyle belirli görevler için giderek daha popüler hale gelse de XML, yapay zeka ve makine öğreniminin birçok önemli alanında geçerliliğini korumaktadır:

  • Veri Açıklaması: XML, bilgisayarla görme (CV) görevlerinde ek açıklamaları depolamak için kullanılan yaygın bir formattır. Nesne algılama için, XML dosyaları genellikle bir görüntüdeki her nesne için sınıf etiketini ve sınırlayıcı kutu koordinatlarını detaylandırır. Benzer şekilde, görüntü segmentasyonunda poligonları tanımlamak için de kullanılabilir. Birçok kıyaslama veri kümesi, temel gerçek verileri için XML'e dayanır. Doğru veri toplama ve açıklama, doğru modellerin eğitilmesinde hayati önem taşıyan adımlardır.
  • Model Yapılandırması: YAML, Ultralytics tarafından yapılandırma dosyaları için sıklıkla tercih edilmesine rağmen, XML bazen model mimarilerini, eğitim parametrelerini veya deney ayarlarını tanımlamak için diğer çerçeveler veya eski sistemler tarafından kullanılır. Yapılandırılmış doğası karmaşık yapılandırmalara izin verir.
  • Model Birlikte Çalışabilirliği: Predictive Model Markup Language (PMML), eğitilmiş istatistiksel ve veri madenciliği modellerini temsil etmek için tasarlanmış XML tabanlı bir standarttır. PMML, bir sistemde (örneğin, Scikit-learn kullanılarak) eğitilen modellerin, kodu yeniden yazmadan başka bir sistemde (örneğin, bir üretim puanlama motoru) konuşlandırılmasına olanak tanıyarak model dağıtımını kolaylaştırır. Bu, MLOps'taki (Makine Öğrenimi Operasyonları) önemli bir zorluğu ele alır.
  • Veri Değişimi: XML, bir YZ sisteminin farklı bileşenleri arasında veya kuruluşlar arasında yapılandırılmış veri alışverişi için sağlam bir format olarak hizmet vermektedir. Platformdan bağımsız yapısı, ölçeklenebilir YZ çözümleri oluşturmak için çok önemli olan verilerin çeşitli yazılım ortamlarında güvenilir bir şekilde ayrıştırılabilmesini sağlar.

XML ve İlgili Formatlar

XML'i diğer yaygın veri serileştirme biçimlerinden ayırmak yararlı olacaktır:

  • JSON (JavaScript Object Notation): XML'in etiket tabanlı sözdizimine kıyasla JSON, JavaScript nesnelerinden türetilen daha hafif bir anahtar-değer çifti yapısı kullanır. Genellikle daha az ayrıntılıdır ve web uygulamaları ve API'ler için ayrıştırılması daha kolaydır. Ayrıntılar için resmi JSON standardına bakın. XML ad alanları ve şemalar için yerleşik desteğe sahipken, JSON genellikle doğrulama için harici kurallara dayanır.
  • YAML (YAML Ain't Markup Language): YAML, etiket veya parantez yerine yapıyı belirtmek için girinti kullanarak insan tarafından okunabilirliğe öncelik verir. ML projelerindeki yapılandırma dosyaları için sıkça kullanılır Ultralytics YOLO modelleri) ve Kubernetes gibi kod olarak altyapı araçları. Daha fazla bilgi için YAML spesifikasyonunu keşfedin.

Yapay Zeka/ML'de XML'in Gerçek Dünya Uygulamaları

  1. PASCAL Görsel Nesne Sınıfları (VOC) Veri Kümesi: gibi modelleri kıyaslamak için yaygın olarak kullanılan bu etkili nesne algılama veri setiYOLOv8 ve YOLO11ek açıklamaları için XML dosyalarını kullanır. Her XML dosyası bir görüntüye karşılık gelir ve görüntü kaynağı, boyutu ve sınıf etiketi (örneğin, 'araba', 'kişi') ve sınırlayıcı kutu koordinatları (xmin, ymin, xmax, ymax) dahil olmak üzere açıklamalı her nesne için ayrıntılar hakkında bilgi içerir. Ayrıntıları resmi PASCAL VOC web sitesinde bulabilir ve VOC veri kümesi belgelerinde Ultralytics modelleriyle nasıl kullanılacağını öğrenebilirsiniz. Ultralytics HUB gibi platformlar, özel modelleri eğitmek için bu tür veri kümelerini yönetmeye yardımcı olabilir.
  2. Tıbbi Görüntüleme Meta Verileri (DICOM): DICOM (Tıpta Dijital Görüntüleme ve İletişim) standardı, tıbbi görüntülerin depolanması ve iletilmesi için sağlık hizmetlerinde her yerde bulunur. DICOM'un kendisi ikili bir format olsa da, XML genellikle hasta bilgileri, çekim parametreleri ve teşhis bulguları gibi bu görüntülerle ilişkili kapsamlı meta verileri temsil etmek için kullanılır. Bu yapılandırılmış meta veriler, tıbbi görüntü analizindeki görevler için hayati önem taşır ve araştırmacıların ve klinisyenlerin veri kümelerini filtrelemesine, tanısal yapay zeka modellerini eğitmesine(Radyolojide Yapay Zeka) ve yapay zeka sağlık uygulamalarında izlenebilirliği sağlamasına olanak tanır.

Özetle, her zaman en özlü format olmasa da XML'in yapılandırılmış yapısı, genişletilebilirliği ve sağlam doğrulama yetenekleri, özellikle veri açıklama standartlarında, PMML gibi model değişim formatlarında ve kurumsal veri entegrasyonunda olmak üzere belirli AI ve ML alanlarında rolünün devam etmesini sağlar. XML'e aşina olmak, sahadaki çeşitli veri kaynakları ve araçlarında gezinmek için değerlidir.

Tümünü okuyun