Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

CatBoost

Kategorik veriler için güçlü bir gradyan güçlendirme algoritması olan CatBoost'u keşfedin. AI iş akışları için Ultralytics ile birlikte tahmin modellemesini nasıl geliştirdiğini öğrenin.

CatBoost (Kategorik Güçlendirme), karar ağaçlarında gradyan güçlendirmeye dayanan açık kaynaklı bir makine öğrenimi algoritmasıdır. Yandex tarafından geliştirilen bu algoritma, minimum veri hazırlığıyla yüksek performans sağlamak üzere tasarlanmıştır ve özellikle sayısal değerler yerine farklı grupları veya etiketleri temsil eden kategorik verileri işlemekte üstündür. Geleneksel algoritmalar genellikle kategorileri sayılara dönüştürmek için one-hot encoding gibi karmaşık ön işleme teknikleri gerektirirken, CatBoost bu özellikleri eğitim sırasında doğrudan işleyebilir. Bu özellik, sıralı güçlendirme yoluyla aşırı uyumu azaltma yeteneği ile birleştiğinde, veri biliminde çok çeşitli tahminsel modelleme görevleri için sağlam bir seçim haline getirir.

Temel Avantajlar ve Mekanizma

CatBoost, doğruluk ve kullanım kolaylığını önceliklendiren çeşitli mimari seçimler sayesinde diğer ensemble yöntemlerinden ayrılır. .

  • Yerel Kategorik Destek: Algoritma, eğitim sırasında kategorik değerleri sayılara dönüştürmek için sıralı hedef istatistikleri adı verilen bir teknik kullanır. Bu, standart kodlama yöntemlerinde sıklıkla görülen hedef sızıntısını önleyerek doğrulama sürecinin bütünlüğünü korur.
  • Sıralı Güçlendirme: Standart gradyan güçlendirme yöntemleri, AI'da bir tür önyargı olan tahmin kaymasından muzdarip olabilir. CatBoost, modeli eğitmek için permütasyon odaklı bir yaklaşım kullanarak bu sorunu çözer ve modelin belirli eğitim veri dağılımına aşırı uyum sağlamamasını sağlar.
  • Simetrik Ağaçlar: Derinlik veya yaprak açısından ağaçları büyüten diğer birçok güçlendirme kütüphanesinden farklı olarak, CatBoost simetrik (dengeli) ağaçlar oluşturur. Bu yapı, gerçek zamanlı çıkarım uygulamaları için çok önemli olan son derece hızlı çıkarım hızları sağlar.

CatBoost vs. XGBoost ve LightGBM

CatBoost, diğer popüler güçlendirme kütüphaneleriyle birlikte sıklıkla değerlendirilir. Aynı temel çerçeveyi paylaşsalar da, farklı özelliklere sahiptirler.

  • XGBoost: Veri bilimi yarışmalarındaki performansıyla tanınan, son derece esnek ve yaygın olarak kullanılan bir kütüphanedir. Genellikle, en yüksek performansa ulaşmak için dikkatli bir hiperparametre ayarlaması ve kategorik değişkenlerin manuel kodlaması gerektirir.
  • LightGBM: Bu kütüphane, yaprak bazında büyüme stratejisi kullanır ve bu da onu büyük veri kümeleri üzerinde eğitim için olağanüstü hızlı hale getirir. Ancak, dikkatli bir düzenleme yapılmazsa, CatBoost'un kararlı simetrik ağaçlarına kıyasla daha küçük veri kümelerinde aşırı uyumlanmaya eğilimli olabilir.
  • CatBoost: Varsayılan parametrelerle genellikle en iyi "kullanıma hazır" doğruluğu sağlar. Veri kümeleri önemli sayıda kategorik özellik içerdiğinde genellikle tercih edilen seçimdir ve kapsamlı özellik mühendisliği ihtiyacını azaltır.

Gerçek Dünya Uygulamaları

CatBoost'un sağlamlığı, onu yapılandırılmış verileri işleyen çeşitli sektörlerde çok yönlü bir araç haline getirir.

  1. Finansal Risk Değerlendirmesi: Bankalar ve fintech şirketleri, kredi uygunluğunu değerlendirmek ve kredi temerrütlerini tahmin etmek için CatBoost'u kullanıyor. Model, başvuru sahibinin mesleği (kategorik) ve gelir seviyesi (sayısal) gibi çeşitli veri türlerini sorunsuz bir şekilde entegre ederek doğru risk profilleri oluşturabilir. Bu yetenek, finans alanında modern yapay zekanın temel taşlarından biridir.
  2. E-ticaret Önerileri: Çevrimiçi perakendeciler, CatBoost'u kişiselleştirilmiş öneri sistemlerini güçlendirmek için kullanıyor. Kullanıcı davranış günlüklerini, ürün kategorilerini ve satın alma geçmişini analiz ederek, algoritma bir kullanıcının bir ürüne tıklama veya satın alma olasılığını tahmin ederek, perakende optimizasyonunda AI'ya doğrudan katkıda bulunuyor.

Bilgisayarlı Görme ile Entegrasyon

CatBoost öncelikle tablo verileri için bir araç olsa da, görsel verilerin yapılandırılmış meta verilerle buluştuğu çok modlu model iş akışlarında hayati bir rol oynar. Yaygın bir iş akışı, bilgisayar görme modelini kullanarak görüntülerden özellikleri çıkarmak ve ardından bu özellikleri CatBoost sınıflandırıcısına beslemektir.

Örneğin, bir gayrimenkul değerleme sistemi, Ultralytics kullanarak mülk fotoğraflarında nesne algılama gerçekleştirebilir ve havuz veya güneş panelleri gibi olanakları sayabilir. Bu nesnelerin sayıları, daha sonra konum ve metrekare verileriyle birlikte sayısal özellikler olarak bir CatBoost modeline aktarılır ve evin değeri tahmin edilir. Geliştiriciler, veri kümesi yönetimini ve model dağıtımını basitleştiren Ultralytics kullanarak bu pipeline'ların görsel bileşenini yönetebilirler. .

Aşağıdaki örnek, önceden eğitilmiş bir YOLO yükleyerek bir görüntüden nesne sayılarını nasıl çıkarabileceğinizi gösterir. Bu sayılar, daha sonra CatBoost modeli için girdi özellikleri olarak kullanılabilir.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("path/to/property_image.jpg")

# Extract class counts (e.g., counting 'cars' or 'pools')
# This dictionary can be converted to a feature vector for CatBoost
class_counts = {}
for result in results:
    for cls in result.boxes.cls:
        class_name = model.names[int(cls)]
        class_counts[class_name] = class_counts.get(class_name, 0) + 1

print(f"Features for CatBoost: {class_counts}")

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın