Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تجميع النماذج

اكتشف كيف تجمع مجموعات النماذج بين هياكل متعددة مثل Ultralytics لتعزيز الدقة والمتانة. تعرف على التقنيات الأساسية ونصائح التنفيذ.

نموذج المجموعة هو نهج استراتيجي في التعلم الآلي حيث يتم الجمع بين التنبؤات من عدة نماذج فردية لإنتاج ناتج نهائي غالبًا ما يكون أكثر دقة وقوة من أي نموذج فردي يمكن أن يحققه بمفرده. مثل لجنة الخبراء التي تتداول للوصول إلى قرار أفضل من قرار فرد واحد ، يستفيد نموذج المجموعة من نقاط القوة في البنى المتنوعة لتقليل الأخطاء. تُستخدم هذه التقنية على نطاق واسع لتحسين الأداء في المهام المعقدة، وتقليل مخاطر التكيف المفرط، والتعامل مع التوازن بين التحيز والتباين الموجود في النمذجة الإحصائية .

آليات التجميع

المبدأ الأساسي وراء مجموعة النماذج هو "التنوع". من خلال تدريب نماذج متعددة — غالبًا ما يشار إليها باسم "المتعلمون الأساسيون" أو "المتعلمون الضعفاء" — على مجموعات فرعية مختلفة من بيانات التدريب أو باستخدام خوارزميات مختلفة، تضمن المجموعة أن الأخطاء التي يرتكبها أحد النماذج من المرجح أن يتم تصحيحها بواسطة النماذج الأخرى. في سياق التعلم العميق، غالبًا ما يتضمن ذلك تشغيل شبكات عصبية متعددة بالتوازي أثناء الاستدلال.

تشمل الطرق الشائعة لدمج هذه التنبؤات ما يلي:

  • التصويت: يستخدم في تصنيف الصور، حيث تصبح الفئة التي تختارها غالبية النماذج هي التنبؤ النهائي.
  • المتوسط: غالبًا ما يستخدم في مهام الانحدار، حيث يتم حساب متوسط النتائج الرقمية لتخفيف الضوضاء.
  • الدمج المرجح: في الكشف عن الأجسام، تقوم تقنيات مثل الدمج المرجح للمربعات (WBF) بدمج المربعات المحيطة من أجهزة الكشف المختلفة بناءً على درجات الثقة.

تطبيقات واقعية

تعد مجموعات النماذج ضرورية في البيئات عالية المخاطر حيث يكون تحقيق أقصى قدر من الدقة أمرًا بالغ الأهمية وتسمح الموارد الحاسوبية بتشغيل نماذج متعددة.

  1. التشخيص الطبي: في تحليل الصور الطبية، يمكن أن يؤدي إغفال التشخيص إلى عواقب وخيمة. غالبًا ما يستخدم أخصائيو الأشعة مجموعات تجمع بين شبكة عصبية تلافيفية (CNN) قياسية ومحول الرؤية (ViT). تتميز شبكة CNN بتميزها في تحليل النسيج المحلي، بينما يلتقط ViT السياق العام، مما يسمح للنظام detect بحساسية أعلى من أي من البنيتين بمفردهما.
  2. القيادة الذاتية: يجب أن تكون أنظمة الإدراك في المركبات الذاتية القيادة آمنة من الأعطال. غالبًا ما يستخدم المهندسون مجموعة من نماذج الكشف — على سبيل المثال، دمج السرعة في الوقت الفعلي لـ YOLO26 مع الدقة القائمة على المحولات لـ RT-DETR. وهذا يضمن اكتشاف المشاة أو العوائق حتى إذا واجه أحد النماذج صعوبة في ظروف إضاءة معينة، مثل الوهج أو الظلال.

تنفيذ المجموعات باستخدام Python

بينما يمكن بناء استراتيجيات مجموعات معقدة باستخدام مكتبات مثل Scikit-learn، يمكنك إنشاء مجموعة استدلال أساسية للرؤية الحاسوبية ببساطة عن طريق تحميل نماذج متعددة ومعالجة نفس المدخلات. يوضح المثال التالي كيفية تحميل نموذجين متميزين Ultralytics YOLO لتوليد تنبؤات على نفس الصورة.

from ultralytics import YOLO

# Load two different model variants to create a diverse ensemble
model_a = YOLO("yolo26n.pt")  # Nano model (Speed focused)
model_b = YOLO("yolo26s.pt")  # Small model (Higher accuracy)

# Perform inference on an image with both models
# In production, results are typically merged programmatically
results_a = model_a("https://ultralytics.com/images/bus.jpg")
results_b = model_b("https://ultralytics.com/images/bus.jpg")

print(f"Model A detected {len(results_a[0].boxes)} objects.")
print(f"Model B detected {len(results_b[0].boxes)} objects.")

نموذج المجموعة مقابل مزيج الخبراء

من المفيد التمييز بين مجموعة النماذج القياسية و مزيج الخبراء (MoE)، وهو مصطلح شائع الاستخدام في الأبحاث الحديثة حول نماذج اللغة الكبيرة (LLM).

  • مجموعة النماذج: عادةً ما تستعلم عن كل نموذج في المجموعة لكل إدخال وتجمع النتائج. وهذا يزيد من المقاييس مثل متوسط الدقة (mAP) ولكنه يزيد بشكل كبير من زمن الاستدلال و تكلفة الحساب. إنها طريقة قوية لتحقيق الجودة.
  • مزيج من الخبراء: يستخدم "شبكة بوابة" لتوجيه البيانات إلى عدد قليل من النماذج الفرعية "الخبيرة" المحددة التي تناسب المدخلات الحالية بشكل أفضل. وهذا يسمح بقدرة هائلة على التوسع في النماذج الأساسية دون الحاجة إلى تشغيل كل معلمة لكل رمز.

المزايا والاعتبارات

الميزة الرئيسية لاستخدام مجموعة النماذج هي تحسين الأداء. غالبًا ما تهيمن المجموعات على قوائم المتصدرين في تحديات علم البيانات مثل مسابقات Kaggle لأنها تستطيع نمذجة أنماط معقدة تفوت النماذج الفردية. ومع ذلك، فإن هذا يأتي بتكلفة: يتطلب نشر المجموعات المزيد من الذاكرة وقوة الحوسبة.

بالنسبة للفرق التي تسعى إلى إدارة متطلبات الموارد هذه بكفاءة، توفر Ultralytics أدوات لتدريب track ومقارنة بنى النماذج المختلفة. من خلال مقارنة مقاييس الأداء بسهولة، يمكن للمطورين تحديد ما إذا كان تحسن الدقة الناجم عن المجموعة يبرر البنية التحتية الإضافية المطلوبة للنشر في سيناريوهات الذكاء الاصطناعي المتطورة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن