Sözlük

Karar Ağacı

Sınıflandırma, regresyon ve sağlık ve finans gibi gerçek dünya uygulamaları için makine öğreniminde karar ağaçlarının gücünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Karar Ağacı, denetimli öğrenme kategorisine giren çok yönlü ve yaygın olarak kullanılan bir makine öğrenimi (ML) algoritmasıdır. Kararları ve bunların olası sonuçlarını modellemek için akış şemasına benzer ağaç benzeri bir yapı kullanır. Her iç düğüm bir nitelik (veya özellik) üzerindeki bir testi, her dal testin sonucunu ve her yaprak düğümü bir sınıf etiketini (sınıflandırma görevlerinde) veya sürekli bir değeri (regresyon görevlerinde) temsil eder. Sezgisel yapıları nedeniyle, karar ağaçlarının anlaşılması ve yorumlanması nispeten kolay olduğu bilinmektedir, bu da onları açıklanabilir yapay zeka (XAI) için değerli kılmaktadır.

Karar Ağaçları Nasıl Çalışır?

Temel fikir, veri kümesini girdi özelliklerinin değerlerine göre daha küçük ve daha küçük alt kümelere bölerek bir ağaç yapısı oluşturmaktır. Süreç, tüm veri kümesini temsil eden kök düğümde başlar. Her düğümde algoritma, verileri hedef değişkene göre elde edilen alt kümelerin saflığını veya homojenliğini artıracak şekilde bölmek için en iyi özelliği ve eşiği seçer. En iyi bölünmeyi bulmak için yaygın kriterler arasında, bir kümedeki düzensizliği veya rastgeleliği ölçen Gini safsızlığı ve bilgi kazancı (entropiye dayalı) yer alır. Bu bölme işlemi, maksimum derinliğe ulaşma, bir düğümde minimum sayıda örneğe sahip olma veya saf yaprak düğümlerine (yalnızca bir sınıftan örnekler içeren düğümler) ulaşma gibi bir durdurma kriteri karşılanana kadar özyinelemeli olarak devam eder. Yeni bir veri noktası için tahminde bulunmak amacıyla, özellik testlerinin sonuçlarına göre ağacı kökten bir yaprak düğüme kadar dolaşır ve tahmin, o yapraktaki çoğunluk sınıfı veya ortalama değerdir. Dikkatli veri ön işleme ve özellik mühendisliği, bir karar ağacının performansını önemli ölçüde etkileyebilir.

Karar Ağacı Türleri

Karar ağaçları genel olarak iki ana türe ayrılabilir:

  • Sınıflandırma Ağaçları: Hedef değişken kategorik olduğunda kullanılır (örneğin, 'spam' veya 'spam değil' tahmini). Yaprak düğümler sınıf etiketlerini temsil eder.
  • Regresyon Ağaçları: Hedef değişken sürekli olduğunda kullanılır (örneğin, ev fiyatlarının tahmin edilmesi). Yaprak düğümler, genellikle o yaprağa ulaşan eğitim örneklerinin hedef değerlerinin ortalaması olan tahmin edilen bir sayısal değeri temsil eder.

Avantajlar ve Dezavantajlar

Karar ağaçları çeşitli avantajlar sunar:

  • Yorumlanabilirlik: Grafiksel yapıları görselleştirilmelerini ve anlaşılmalarını kolaylaştırır.
  • Minimal Veri Hazırlama: Genellikle diğer algoritmalara kıyasla daha az veri temizliği gerektirir, örneğin daha az veri normalleştirmesi gerekir.
  • Doğrusal Olmayan Verileri İşler: Özellikler ve hedef değişken arasındaki doğrusal olmayan ilişkileri yakalayabilirler.
  • Özellik Önemi: Doğal olarak, bir özelliğin bölme için ne kadar erken veya sık kullanıldığına bağlı olarak bir özellik önemi ölçüsü sağlarlar.

Bununla birlikte, dezavantajları da vardır:

  • Aşırı uyum: Karar ağaçları kolayca çok karmaşık hale gelebilir ve eğitim verilerindeki gürültüyü yakalayarak görülmeyen test verilerinde zayıf genellemeye yol açabilir. Budama veya ağaç büyümesi üzerinde kısıtlamalar belirleme gibi teknikler aşırı uyumun azaltılmasına yardımcı olur.
  • İstikrarsızlık: Verilerdeki küçük değişiklikler tamamen farklı bir ağacın oluşturulmasına neden olabilir.
  • Önyargı: Veri kümesi dengesizse ağaçlar daha fazla seviyeye sahip özelliklere veya baskın sınıflara doğru önyargılı olabilir.

Gerçek Dünya Uygulamaları

Karar ağaçları çeşitli alanlarda kullanılmaktadır:

  1. Tıbbi Teşhis: Hasta semptomlarına ve test sonuçlarına dayalı teşhisler öneren modeller oluşturarak doktorlara yardımcı olmak. Örneğin, bir ağaç sırayla semptomlar hakkında sorular sorarak tanıya rehberlik edebilir(sağlık uygulamalarında yapay zeka).
  2. Müşteri Kaybı Tahmini: İşletmeler, kullanım modellerine, demografik özelliklere ve etkileşim geçmişine dayalı olarak hizmetlerini kullanmayı bırakması muhtemel müşterileri belirlemek için karar ağaçlarını kullanır ve hedeflenen elde tutma çabalarına olanak tanır(Müşteri Kaybını Tahmin Etme).
  3. Finansal Risk Değerlendirmesi: Gelir, borç ve kredi geçmişi gibi faktörleri analiz ederek kredi itibarını değerlendirme(Finansta bilgisayarla görme modelleri).
  4. Üretim Kalite Kontrolü: Sensör okumalarına veya süreç parametrelerine dayalı olarak ürünlerdeki potansiyel kusurların belirlenmesi(Improving Manufacturing with Computer Vision).

Diğer Modellerle İlişkisi

Karar ağaçları, Random Forests ve Gradient Boosted Trees ( XGBoost veya LightGBM gibi) gibi daha karmaşık topluluk yöntemlerinin temelini oluşturur. Örneğin Rastgele Ormanlar, farklı veri ve özellik alt kümeleri üzerinde birden fazla karar ağacı oluşturur ve tahminlerini bir araya getirerek genellikle tek bir ağaca kıyasla daha iyi doğruluk ve aşırı uyuma karşı sağlamlık sağlar. Birçok tablo veri problemi için güçlü olsa da karar ağaçları, bilgisayarla görmede kullanılan Evrişimli Sinir Ağları (CNN'ler) veya Görüntü Dönüştürücüler (ViT ) gibi modellerden önemli ölçüde farklıdır. Gibi modeller Ultralytics YOLO11 Tek karar ağaçlarının daha az etkili olduğu bir alan olan görüntüler gibi karmaşık, yüksek boyutlu verilerin işlenmesini içeren nesne algılama, görüntü sınıflandırma ve örnek segmentasyonu gibi görevler için optimize edilmiş derin öğrenme mimarilerinden yararlanın. Karar ağaçları gibi temel modelleri anlamak, yapay zeka ve tahmine dayalı modellemenin daha geniş manzarası içinde değerli bir bağlam sağlar. Scikit-learn gibi araçlar karar ağaçları için popüler uygulamalar sağlarken, Ultralytics HUB gibi platformlar gelişmiş görme modellerinin geliştirilmesini ve dağıtımını kolaylaştırır.

Tümünü okuyun