Sözlük

Karar Ağacı

Sınıflandırma, regresyon ve sağlık ve finans gibi gerçek dünya uygulamaları için makine öğreniminde karar ağaçlarının gücünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Karar Ağacı, Makine Öğreniminde (ML) hem sınıflandırma hem de regresyon görevleri için kullanılan çok yönlü ve yorumlanabilir bir modeldir. Her iç düğümün bir öznitelik (özellik) üzerindeki bir testi, her dalın testin sonucunu ve her yaprak düğümünün bir sınıf etiketini (sınıflandırmada) veya sürekli bir değeri (regresyonda) temsil ettiği bir akış şeması gibi işlev görür. Bu yapı, insan karar verme süreçlerini taklit ederek modelin bir tahmine nasıl ulaştığını görselleştirmeyi ve anlamayı kolaylaştırır.

Karar Ağaçları Nasıl Çalışır?

Karar Ağaçları, çeşitli girdi özelliklerine dayalı olarak bir hedef değişkenin değerini tahmin eden bir model oluşturarak verilerden öğrenir. Bu bir Denetimli Öğrenme biçimidir, yani etiketli eğitim verileri gerektirir. Ağaç, verileri hedef değişkeni en iyi ayıran özelliklere göre özyinelemeli olarak bölerek oluşturulur. CART (Sınıflandırma ve Regresyon Ağaçları) ve ID3 gibi yaygın algoritmalar, her düğümde en uygun bölünmeyi belirlemek için Gini safsızlığı veya bilgi kazancı gibi kriterler kullanır. Süreç, maksimum derinliğe ulaşma veya yalnızca bir sınıftan örneklere sahip düğümlere sahip olma gibi bir durdurma kriteri karşılanana kadar devam eder.

Türler ve Varyasyonlar

İki ana tür Sınıflandırma Ağaçları (ayrık sınıf etiketlerini tahmin eden) ve Regresyon Ağaçlarıdır (sürekli sayısal değerleri tahmin eden). Tek karar ağaçları faydalı olsa da, bazen hatalara veya kararsızlığa eğilimli olabilirler. Bunu ele almak için, Rastgele Orman gibi Topluluk yöntemleri, tahmin performansını ve aşırı uyuma karşı sağlamlığı artırmak için birden fazla karar ağacını birleştirir.

Avantajlar ve Dezavantajlar

Karar Ağaçları çeşitli avantajlar sunar:

  • Yorumlanabilirlik: Akış şeması yapılarının görselleştirilmesi ve açıklanması kolaydır.
  • Minimal Veri Hazırlama: Genellikle diğer tekniklere kıyasla daha az veri ön işleme gerektirir, hem sayısal hem de kategorik verileri doğal bir şekilde işler.
  • Özellik Önemi: Karar sürecinde hangi özelliklerin en etkili olduğunu göstererek örtük olarak özellik seçimi yaparlar.

Bununla birlikte, dezavantajları da vardır:

  • Aşırı uyum: Ağaçlar aşırı karmaşık hale gelebilir ve eğitim verilerine çok yakından uyarak yeni verilere iyi genelleme yapamayabilir. Budama gibi teknikler ağacı basitleştirmek ve bununla mücadele etmek için kullanılır.
  • İstikrarsızlık: Verilerdeki küçük değişiklikler önemli ölçüde farklı ağaç yapılarına yol açabilir.
  • Önyargı: Veri kümesinde bazı sınıflar baskınsa ağaçlar önyargılı hale gelebilir.

Gerçek Dünya Uygulamaları

Karar Ağaçları çeşitli alanlarda uygulanmaktadır:

  • Tıbbi Teşhis: Hasta semptomlarına ve geçmişine dayalı olarak hastalıkları tahmin ederek doktorlara yardımcı olmak ve net bir karar yolu sağlamak. Örneğin, klinik verilere dayalı olarak belirli durumlar için risk faktörlerinin belirlenmesine yardımcı olabilirler(sağlık hizmetlerinde örnek uygulama). Bu, Sağlık Hizmetlerinde daha geniş yapay zeka uygulamaları ile uyumludur.
  • Finansal Analiz: Başvuru sahibinin bilgilerine dayanarak kredi başvurusu riskini değerlendirmek için kredi puanlamasında veya borsa hareketlerini tahmin etmede kullanılır.
  • Müşteri Kaybı Tahmini: İşletmeler, kullanım modellerine, demografik özelliklerine ve etkileşim geçmişlerine göre ayrılma olasılığı olan müşterileri belirlemek için karar ağaçlarını kullanarak proaktif elde tutma stratejilerine olanak tanır(Kaggle gibi platformlardaki örneklere bakın).

Diğer Algoritmalarla Karşılaştırma

  • Rastgele Ormanlar: Karar ağaçlarından oluşturulsa da, Rastgele Ormanlar birçok ağaçtaki tahminlerin ortalamasını alır ve genellikle tek bir ağaçtan daha yüksek doğruluk ve daha iyi genelleme sunar.
  • Destek Vektör Makineleri (SVM): DVM 'ler sınıfları ayıran en uygun hiper düzlemi bulmayı amaçlar, genellikle yüksek boyutlu uzaylarda iyi performans gösterir ancak karar ağaçlarının doğrudan yorumlanabilirliğinden yoksundur.
  • Sinir Ağları (NN): Sinir Ağları, özellikle de aşağıdaki gibi modellerde kullanılan derin ağlarUltralytics YOLOBilgisayarlı Görme (CV) için, oldukça karmaşık, doğrusal olmayan ilişkileri modelleyebilir, ancak tipik olarak karar ağaçlarından daha az yorumlanabilir ('kara kutular').

Karar Ağaçları, basitlikleri, yorumlanabilirlikleri ve daha karmaşık modeller için yapı taşları olarak kullanılmaları nedeniyle makine öğreniminde temel bir algoritma olmaya devam etmektedir. Scikit-learn gibi popüler kütüphanelerde yaygın olarak uygulanmaktadırlar.

Tümünü okuyun