Tablo verileri için önde gelen gradyan güçlendirme kütüphanesi olan XGBoost'u keşfedin. Verimliliği, toplu öğrenme ve Ultralytics ile entegrasyonu hakkında bilgi edinin.
XGBoost veya Extreme Gradient Boosting, Gradient Boosting çerçevesi altında makine öğrenimi algoritmalarını uygulamak için tasarlanmış, yüksek düzeyde optimize edilmiş, dağıtılmış bir yazılım kütüphanesidir. Olağanüstü verimliliği, esnekliği ve taşınabilirliği ile tanınan XGBoost, yapılandırılmış veya tablo biçimindeki verilerle çalışan veri bilimcileri için öncelikli tercih haline gelmiştir. Bu teknik, birden fazla "zayıf" öğrenicinin (genellikle sığ karar ağaçları) tahminlerini birleştirerek öğrenicilerin tahminlerinibirleştirerek tek bir"güçlü" öğrenicioluşturur. Ensemble öğrenme olarak bilinen bu teknik, modelin dizideki önceki ağaçların yaptığı hataları düzeltmesine olanak tanır ve sınıflandırma, regresyon ve sıralama görevlerinde en gelişmiş sonuçları verir.
XGBoost'un gücü, sistem optimizasyonu ve algoritmik geliştirmelerinde yatmaktadır. Ağaçları bağımsız olarak oluşturan Random Forest gibi bagging tekniklerinden farklı olarak, XGBoost ağaçları sıralı olarak oluşturur. Her yeni ağaç, öncekilerin hatalarını (artıkları) en aza indirmeye çalışır. Modelin çok karmaşık hale gelmesini ve Modelin çok karmaşık hale gelmesini ve eğitim verilerindeki gürültüyü ezberlemesini önlemek için XGBoost, hem L1 (Lasso) hem de L2 (Ridge) düzenleme terimlerini hedef fonksiyonuna dahil eder. Aşırı uyuma karşı bu yerleşik koruma, görülmemiş veriler üzerinde sağlam performans sağlayan önemli bir fark yaratır.
Ayrıca, kütüphane hız için tasarlanmıştır. Optimum bölme noktalarını bulmak için ağırlıklı quantile sketch kullanır ve mevcut tüm CPU kullanarak ağaç yapısı sırasında paralel işleme uygular. Ayrıca, seyrek verileri akıllıca işler; bir değer eksikse, algoritma bölme işlemi sırasında örneği göndermek için en iyi yönü öğrenir ve özellik mühendisliği süreçlerini basitleştirir.
XGBoost baskın bir güç olsa da, makine öğrenimi (ML) alanında bulunan diğer güçlendirme kütüphanelerinden nasıl farklı olduğunu anlamak yararlıdır :
XGBoost, kritik iş sorunlarını çözmek için çeşitli sektörlerde yaygın olarak kullanılmaktadır.
XGBoost yapılandırılmış verileri işlerken, modern AI sistemleri genellikle çok modlu bir yaklaşım gerektirir. Örneğin, bir üretim kalite kontrol sistemi, YOLO26 tarafından desteklenen nesne algılama özelliğini görüntülerdeki kusurları tespit etmek için kullanabilir. Bu algılamalardan elde edilen meta veriler (ör. kusur türü, boyutu, konumu) daha sonra sensör okumalarıyla (sıcaklık, basınç) birlikte bir XGBoost modeline aktarılabilir ve makine arızasını tahmin etmek için kullanılabilir. Geliştiriciler, Ultralytics kullanarak veri kümesi açıklamaları ve model dağıtımı dahil olmak üzere bu karmaşık iş akışlarını yönetebilirler. Ultralytics .
Aşağıdaki örnek, XGBoost Python kullanarak bir sınıflandırıcıyı nasıl eğiteceğinizi göstermektedir. Bu kod parçacığı, verilerin önceden işlendiğini varsaymaktadır.
import xgboost as xgb
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
# Load dataset and split into train/test sets
data = load_wine()
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2)
# Initialize and train the XGBoost classifier
model = xgb.XGBClassifier(n_estimators=50, max_depth=4, learning_rate=0.1)
model.fit(X_train, y_train)
# Evaluate the model
print(f"Accuracy: {model.score(X_test, y_test):.4f}")
Parametreler ve gelişmiş yapılandırma hakkında daha fazla bilgi için resmi XGBoost Belgelerine bakın. Modelinizden en iyi performansı elde etmek için hiperparametrelerin doğru şekilde ayarlanması önerilir.