اكتشف LightGBM، وهو إطار عمل عالي الأداء لتعزيز التدرج للبيانات المنظمة. تعرف على كيفية توفيره لتدريب أسرع ودقة أعلى لمهام التعلم الآلي.
آلة تعزيز التدرج الخفيف، المعروفة باسم LightGBM، هي إطار عمل مفتوح المصدر وموزع لتعزيز التدرج تم تطويره بواسطة Microsoft ويستخدم خوارزميات التعلم القائمة على الأشجار . وقد تم تصميمه ليكون موزعًا وفعالًا مع المزايا التالية: سرعة تدريب أسرع و كفاءة أعلى، واستخدام أقل للذاكرة، ودقة أفضل، ودعم GPU المتوازي GPU ، والقدرة على معالجة البيانات على نطاق واسع. في المشهد الأوسع للتعلم الآلي (ML)، يعمل كأداة قوية للتصنيف والتصنيف والعديد من مهام التعلم الآلي الأخرى. يحظى LightGBM بشعبية خاصة في علوم البيانات التنافسية والتطبيقات الصناعية حيث السرعة والأداء على البيانات المنظمة أمر بالغ الأهمية.
في جوهره، LightGBM هو أسلوب تجميع يجمع بين التنبؤات من عدة أشجار قرار لوضع تنبؤ نهائي. على عكس خوارزميات التعزيز التقليدية التي تنمي الأشجار على مستوى المستوى (أفقياً)، يستخدم LightGBM استراتيجية نمو على مستوى الأوراق (عمودياً). وهذا يعني أنه يختار الورقة ذات الحد الأقصى من خسارة دلتا للنمو. يمكن أن يقلل هذا النهج الخسارة بشكل أكبر من الخوارزمية على مستوى المستوى، مما يؤدي إلى دقة أعلى وتقارب أسرع.
للحفاظ على السرعة دون التضحية بالدقة، يستخدم LightGBM تقنيتين جديدتين: التجميع أحادي الجانب القائم على التدرج (GOSS) وتجميع الميزات الحصرية (EFB). يستبعد GOSS نسبة كبيرة من حالات البيانات ذات التدرجات الصغيرة، ويركز التدريب على الأمثلة الأصعب في التعلم. يجمع EFB الميزات المتبادلة الحصرية لتقليل عدد الميزات بشكل فعال. تسمح هذه التحسينات للإطار بمعالجة كميات هائلة من بيانات التدريب بسرعة مع الحفاظ على استهلاك منخفض للذاكرة .
لاختيار الأداة المناسبة، من المفيد مقارنة LightGBM بأطر العمل الشائعة الأخرى في مجال التعلم الآلي .
LightGBM متعدد الاستخدامات ويستخدم في مختلف الصناعات لحل المشكلات التنبؤية المعقدة باستخدام البيانات المنظمة.
يوضح Python التالي Python كيفية تدريب مصنف LightGBM أساسي على بيانات اصطناعية. يفترض هذا أنك قد أجريت معالجة أولية أساسية للبيانات.
import lightgbm as lgb
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# Generate synthetic binary classification data
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# Initialize and train the LightGBM model
model = lgb.LGBMClassifier(learning_rate=0.05, n_estimators=100)
model.fit(X_train, y_train)
# Display the accuracy score
print(f"Test Accuracy: {model.score(X_test, y_test):.4f}")
للتعمق أكثر في المعلمات المحددة وتعليمات التثبيت، يمكنك زيارة الوثائق الرسمية لـ LightGBM. غالبًا ما يتضمن دمج هذه النماذج في خطوط إنتاج أكبر خطوات مثل تقييم النموذج لضمان الموثوقية في بيئات الإنتاج.