Sınıflandırma, regresyon ve sağlık ve finans gibi gerçek dünya uygulamaları için makine öğreniminde karar ağaçlarının gücünü keşfedin.
Karar Ağacı, denetimli öğrenme kategorisine giren çok yönlü ve yaygın olarak kullanılan bir makine öğrenimi (ML) algoritmasıdır. Kararları ve bunların olası sonuçlarını modellemek için akış şemasına benzer ağaç benzeri bir yapı kullanır. Her iç düğüm bir nitelik (veya özellik) üzerindeki bir testi, her dal testin sonucunu ve her yaprak düğümü bir sınıf etiketini (sınıflandırma görevlerinde) veya sürekli bir değeri (regresyon görevlerinde) temsil eder. Sezgisel yapıları nedeniyle, karar ağaçlarının anlaşılması ve yorumlanması nispeten kolay olduğu bilinmektedir, bu da onları açıklanabilir yapay zeka (XAI) için değerli kılmaktadır.
Temel fikir, veri kümesini girdi özelliklerinin değerlerine göre daha küçük ve daha küçük alt kümelere bölerek bir ağaç yapısı oluşturmaktır. Süreç, tüm veri kümesini temsil eden kök düğümde başlar. Her düğümde algoritma, verileri hedef değişkene göre elde edilen alt kümelerin saflığını veya homojenliğini artıracak şekilde bölmek için en iyi özelliği ve eşiği seçer. En iyi bölünmeyi bulmak için yaygın kriterler arasında, bir kümedeki düzensizliği veya rastgeleliği ölçen Gini safsızlığı ve bilgi kazancı (entropiye dayalı) yer alır. Bu bölme işlemi, maksimum derinliğe ulaşma, bir düğümde minimum sayıda örneğe sahip olma veya saf yaprak düğümlerine (yalnızca bir sınıftan örnekler içeren düğümler) ulaşma gibi bir durdurma kriteri karşılanana kadar özyinelemeli olarak devam eder. Yeni bir veri noktası için tahminde bulunmak amacıyla, özellik testlerinin sonuçlarına göre ağacı kökten bir yaprak düğüme kadar dolaşır ve tahmin, o yapraktaki çoğunluk sınıfı veya ortalama değerdir. Dikkatli veri ön işleme ve özellik mühendisliği, bir karar ağacının performansını önemli ölçüde etkileyebilir.
Karar ağaçları genel olarak iki ana türe ayrılabilir:
Karar ağaçları çeşitli avantajlar sunar:
Bununla birlikte, dezavantajları da vardır:
Karar ağaçları çeşitli alanlarda kullanılmaktadır:
Karar ağaçları, Random Forests ve Gradient Boosted Trees ( XGBoost veya LightGBM gibi) gibi daha karmaşık topluluk yöntemlerinin temelini oluşturur. Örneğin Rastgele Ormanlar, farklı veri ve özellik alt kümeleri üzerinde birden fazla karar ağacı oluşturur ve tahminlerini bir araya getirerek genellikle tek bir ağaca kıyasla daha iyi doğruluk ve aşırı uyuma karşı sağlamlık sağlar. Birçok tablo veri problemi için güçlü olsa da karar ağaçları, bilgisayarla görmede kullanılan Evrişimli Sinir Ağları (CNN'ler) veya Görüntü Dönüştürücüler (ViT ) gibi modellerden önemli ölçüde farklıdır. Gibi modeller Ultralytics YOLO11 Tek karar ağaçlarının daha az etkili olduğu bir alan olan görüntüler gibi karmaşık, yüksek boyutlu verilerin işlenmesini içeren nesne algılama, görüntü sınıflandırma ve örnek segmentasyonu gibi görevler için optimize edilmiş derin öğrenme mimarilerinden yararlanın. Karar ağaçları gibi temel modelleri anlamak, yapay zeka ve tahmine dayalı modellemenin daha geniş manzarası içinde değerli bir bağlam sağlar. Scikit-learn gibi araçlar karar ağaçları için popüler uygulamalar sağlarken, Ultralytics HUB gibi platformlar gelişmiş görme modellerinin geliştirilmesini ve dağıtımını kolaylaştırır.