مسرد المصطلحات

الغابة العشوائية

اكتشف كيف تتفوق الغابة العشوائية، وهي خوارزمية تعلُّم جماعية قوية، في التصنيف والانحدار وتطبيقات الذكاء الاصطناعي في العالم الحقيقي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

الغابة العشوائية هي خوارزمية متعددة الاستخدامات وقوية للتعلم الآلي (ML) تُستخدم على نطاق واسع في مهام التصنيف والانحدار. وهي تنتمي إلى عائلة أساليب التعلّم التجميعي التي تجمع بين عدة نماذج فردية لتحقيق دقة تنبؤ وقوة أفضل مما يمكن أن يحققه أي نموذج منفرد بمفرده. وقد اقترحها ليو بريمان، وهي تعتمد على مفهوم أشجار القرار من خلال إدخال العشوائية.

كيف تعمل الغابات العشوائية

تعمل الغابة العشوائية في جوهرها من خلال إنشاء العديد من أشجار القرار أثناء مرحلة التدريب. يتم تدريب كل شجرة على مجموعة فرعية عشوائية مختلفة من بيانات التدريب (تقنية تسمى تجميع الأكياس أو تجميع التمهيد) وتستخدم مجموعة فرعية عشوائية من الميزات فقط لتحديد أفضل تقسيم في كل عقدة. تساعد هذه العشوائية المزدوجة على تزيين الأشجار، مما يجعل المجموعة أكثر قوة.

بالنسبة لمشكلة التصنيف، يكون الناتج النهائي للغابة العشوائية هو الفئة المختارة بأغلبية أصوات جميع الأشجار الفردية. بالنسبة لمشكلة الانحدار، عادةً ما يكون التنبؤ هو متوسط تنبؤ الأشجار الفردية. يستفيد هذا النهج من "حكمة الحشد"، حيث تقوم مجموعة متنوعة من النماذج بشكل جماعي بعمل تنبؤات أكثر دقة وتقلل بشكل كبير من خطر الإفراط في التكييف، وهي مشكلة شائعة مع أشجار القرار الفردية.

الخصائص الرئيسية

هناك العديد من الجوانب الرئيسية التي تحدد الغابة العشوائية:

  • طريقة التجميع: تجمع بين تنبؤات من أشجار قرارات متعددة.
  • التجميع: يتم تدريب كل شجرة على عينة مجمعة من مجموعة البيانات الأصلية. تعرف على المزيد حول تجميع التمهيد (تجميع الأكياس).
  • عشوائية الميزات: عند كل تقسيم للعقدة، يتم النظر في مجموعة فرعية عشوائية فقط من الميزات.
  • تقليل التباين: يقلل متوسط التنبؤات عبر العديد من الأشجار المرتبطة بالديكور من التباين الكلي للنموذج.
  • أهمية الميزة: يمكن أن يوفر تقديرات لأهمية الميزة، مما يشير إلى متغيرات الإدخال الأكثر تأثيرًا في التنبؤات.

تطبيقات الغابة العشوائية

يتم تطبيق الغابات العشوائية عبر مجموعة واسعة من المجالات نظرًا لدقتها وقوتها وسهولة استخدامها. فيما يلي بعض الأمثلة الملموسة:

  1. التمويل: يُستخدم على نطاق واسع في مهام مثل تسجيل الائتمان والكشف عن الاحتيال، حيث يكون تحديد الأنماط المعقدة في البيانات المالية أمرًا بالغ الأهمية.
  2. الرعاية الصحية: يُطبَّق في مجالات مثل التنبؤ بالأمراض بناءً على سجلات المرضى وحتى في تحليل الصور الطبية لتحديد الحالات الشاذة، على الرغم من أن التعلم العميق غالبًا ما يهيمن على المهام القائمة على الصور. استكشف حلول الذكاء الاصطناعي في مجال الرعاية الصحية.

التقنيات والأدوات

توفر العديد من مكتبات التعلم الآلي الشائعة تطبيقات لخوارزمية الغابة العشوائية. تقدم مكتبة Scikit-learn، وهي مكتبة Python مستخدمة على نطاق واسع، تطبيقًا شاملاً للغابة العشوائية مع خيارات لضبط المعلمات المفرطة. كما توفر مكتبات أخرى مثل XGBoost و LightGBM تطبيقات فعّالة لطرق التجميع الشجري ذات الصلة، وغالبًا ما يتم تحسينها من أجل السرعة والأداء على مجموعات البيانات الكبيرة.

في حين أن الغابات العشوائية تتفوق مع البيانات المهيكلة أو المجدولة، إلا أنها أقل ملاءمة بشكل عام للمهام التي تتضمن بيانات غير منظمة مثل الصور مقارنةً بنماذج التعلم العميق. بالنسبة لمهام الرؤية الحاسوبية المتطورة مثل اكتشاف الأجسام أو تجزئة الصور، فإن نماذج مثل Ultralytics YOLO عادةً ما تكون مفضلة. ويمكنك تدريب نماذج YOLO ونشرها باستخدام منصات مثل Ultralytics HUB، والتي تبسّط دورة حياة عمليات التشغيل الآلي لمشاريع الذكاء الاصطناعي للرؤية. استكشف حلولUltralytics المتنوعة التي تستخدم نماذج YOLO للتطبيقات الواقعية.

قراءة الكل