مسرد المصطلحات

XGBoost

اكتشف XGBoost، خوارزمية التعلُّم الآلي القوية والسريعة والمتعددة الاستخدامات للتنبؤات الدقيقة في مهام التصنيف والانحدار.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

XGBoost، وهي اختصار لعبارة Extreme Gradient Boosting، هي خوارزمية قوية ومفتوحة المصدر للتعلم الآلي مفتوحة المصدر ومصممة للسرعة والأداء. وهي تنتمي إلى عائلة أطر تعزيز التدرج، وهي عبارة عن أساليب تجميعية تقوم ببناء النماذج بالتتابع، مع نماذج جديدة تصحح أخطاء النماذج السابقة. تعمل XGBoost على تحسين التعزيز التدرجي التقليدي من خلال دمج تقنيات التنظيم المتقدمة لمنع الإفراط في التكييف وتحسين الموارد الحاسوبية من أجل تدريب وتوقع أسرع، مما يجعلها فعالة للغاية في مهام التصنيف والانحدار، خاصةً مع البيانات المنظمة أو المجدولة.

فهم التعزيز التدرجي

يعد XGBoost في جوهره تطبيقًا محسنًا لتقنية تعزيز التدرج، وهي تقنية ابتكرها جيروم فريدمان. يبني تعزيز التدرج مجموعة من المتعلمين الضعفاء، عادةً أشجار القرار، بطريقة مرحلية. تحاول كل شجرة جديدة التنبؤ بالأخطاء المتبقية التي ارتكبتها مجموعة الأشجار السابقة. يعمل XGBoost على تحسين هذه العملية من خلال العديد من الابتكارات الرئيسية التي تحسن بشكل كبير من كفاءة ودقة النموذج.

الميزات والتحسينات الرئيسية

يقدم XGBoost العديد من التحسينات على التعزيز المتدرج القياسي:

  • التنظيم: يتضمن مصطلحي التنظيم L1 (لاسو) و L2 (ريدج) في دالة الهدف، مما يساعد على منع الإفراط في التعميم ويحسن تعميم النموذج.
  • التعامل مع القيم المفقودة: يحتوي XGBoost على إجراءات روتينية مدمجة للتعامل مع البيانات المفقودة بفعالية، وتعلم أفضل اتجاه للذهاب إليه عندما تكون القيمة مفقودة أثناء تقسيمات الشجرة.
  • تشذيب الشجرة: يستخدم طريقة أكثر تطورًا لتشذيب الشجرة (معلمة الحد الأقصى للعمق والتشذيب اللاحق) مقارنةً بالتعزيز التقليدي للتدرج، مما يحسن من تعقيد الشجرة. تعرف على المزيد حول تقنيات تقليم الأشجار.
  • المعالجة المتوازية: يستفيد XGBoost من إمكانات الحوسبة المتوازية أثناء التدريب، مما يسرّع العملية بشكل كبير على وحدات المعالجة المركزية متعددة النواة ووحدات معالجة الرسومات. هذا المفهوم أساسي في الحوسبة الحديثة عالية الأداء.
  • التحقق التبادلي المدمج: يسمح للمستخدمين بإجراء التحقق التبادلي في كل تكرار لعملية التعزيز، مما يسهل العثور على العدد الأمثل لجولات التعزيز.
  • تحسين ذاكرة التخزين المؤقت: تم تصميم XGBoost لتحقيق الاستخدام الأمثل لموارد الأجهزة، بما في ذلك تحسين أنماط الوصول إلى ذاكرة التخزين المؤقت.
  • المرونة: يدعم أهداف التحسين المخصصة ومعايير التقييم، مما يوفر المرونة لمختلف المهام. غالبًا ما يكون الضبط الدقيق للمقياس الفائق مطلوبًا للحصول على أفضل النتائج.

مقارنة مع الخوارزميات الأخرى

في حين أن XGBoost فعّال للغاية في البيانات المجدولة، إلا أنه يختلف عن الخوارزميات الشائعة الأخرى:

  • آلات تعزيز التدرج الأخرى: تقدم خوارزميات مثل LightGBM و CatBoost أشكالًا مختلفة من التعزيز المتدرج. غالبًا ما يتم تدريب LightGBM بشكل أسرع، خاصةً على مجموعات البيانات الكبيرة، باستخدام التقسيمات القائمة على الرسم البياني والنمو على مستوى الأوراق. تتفوق CatBoost في التعامل مع الميزات الفئوية تلقائيًا.
  • نماذج التعلّم العميق: على عكس نماذج مثل Ultralytics YOLOوالتي تعتمد على التعلّم العميق وتتفوق في مجالات مثل الرؤية الحاسوبية لمهام مثل اكتشاف الأجسام، فإن XGBoost مصممة بشكل أساسي للبيانات المنظمة (المجدولة) وتتطلب عمومًا بيانات وموارد حاسوبية أقل لمثل هذه المهام مقارنةً بالشبكات العصبية العميقة.

التطبيقات الواقعية

إن أداء XGBoost ومتانته يجعلانه مناسبًا لمجموعة كبيرة من التطبيقات:

  • إدارة المخاطر المالية: تستخدم البنوك والمؤسسات المالية XGBoost في مهام النمذجة التنبؤية مثل تسجيل الائتمان والكشف عن الاحتيال، وتحليل بيانات معاملات العملاء وملفاتهم الشخصية لتقييم المخاطر. وهذا جزء أساسي من الذكاء الاصطناعي الحديث في مجال التمويل.
  • التنبؤ باضطراب العملاء: توظف شركات الاتصالات وخدمات الاشتراكات XGBoost للتنبؤ بالعملاء الذين من المحتمل أن يتوقفوا عن استخدام خدمتهم (الزبد) بناءً على أنماط الاستخدام والتركيبة السكانية وتاريخ التفاعل، مما يتيح استراتيجيات استباقية للاحتفاظ بالعملاء. إن فهم سلوك العملاء أمر بالغ الأهمية هنا.
  • التنبؤ بالمبيعات: يستخدمه تجار التجزئة للتنبؤ بالمبيعات المستقبلية بناءً على البيانات التاريخية والموسمية والعروض الترويجية والمؤشرات الاقتصادية.
  • اكتشاف الشذوذ: تحديد الأنماط غير المعتادة أو القيم المتطرفة في مجموعات البيانات، مثل اكتشاف المعدات المعيبة من قراءات أجهزة الاستشعار في الذكاء الاصطناعي في التصنيع.

لا يزال XGBoost أداةً فعّالة وفعّالة للغاية في مجال التعلّم الآلي، وهو مفضّل لسرعته ودقته وقدرته على التعامل مع مجموعات البيانات المجدولة المعقدة بفعالية. يستمر تطويره عبر مكتبة XGBoost الرسمية، ويتكامل بشكل جيد مع منصات مثل Scikit-learn وأدوات إدارة المشاريع مثل Ultralytics HUB.

قراءة الكل