مسرد المصطلحات

التحقق التبادلي

اكتشف قوة التحقق التبادلي في التعلم الآلي لتعزيز دقة النموذج، ومنع الإفراط في التخصيص، وضمان الأداء القوي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التحقق المتقاطع هو طريقة إحصائية تُستخدم لتقييم أداء نماذج التعلّم الآلي (ML) وقدرتها على التعميم. بدلاً من مجرد تقسيم البيانات مرة واحدة إلى مجموعتي تدريب واختبار، تقوم عملية التحقق التبادلي بتقسيم البيانات بشكل منهجي إلى مجموعات فرعية متعددة، أو "طيات". يتم تدريب النموذج على بعض الطيات واختباره على الطيات المتبقية، ويتم تكرار هذه العملية عدة مرات، مع الاحتفاظ بطية مختلفة للاختبار في كل مرة. يوفر هذا النهج تقديرًا أكثر قوة لكيفية أداء النموذج على البيانات غير المرئية مقارنةً بتقسيم التدريب والاختبار مرة واحدة، مما يساعد على منع حدوث مشكلات مثل الإفراط في التهيئة.

كيفية عمل التحقق التبادلي

أكثر أنواع التحقق التبادلي شيوعًا هو التحقق التبادلي K-Fold. فيما يلي تفصيل مبسط للعملية:

  1. خلط مجموعة البيانات: قم بخلط مجموعة البيانات عشوائيًا لضمان توزيع نقاط البيانات دون تحيز متأصل في الترتيب.
  2. التقسيم إلى طيّات: قسّم مجموعة البيانات إلى "K" طيّات متساوية (أو شبه متساوية) الحجم. الخيار الشائع لـ K هو 5 أو 10.
  3. التدريب والتحقق التكراري:
    • حدد طية واحدة كبيانات التحقق من الصحة.
    • تدريب النموذج على الطيات K-1 المتبقية(بيانات التدريب).
    • قم بتقييم أداء النموذج (على سبيل المثال، الدقة) على طية التحقق من الصحة المحتجزة.
    • كرر هذه العملية K مرات، باستخدام كل طية مرة واحدة فقط كمجموعة التحقق من الصحة.
  4. متوسط الأداء: احسب متوسط درجات الأداء التي تم الحصول عليها من كل تكرار. توفر هذه الدرجة المتوسطة تقديراً أكثر موثوقية لأداء تعميم النموذج.

توفر المكتبات الشائعة مثل Scikit-learn تطبيقات فعالة لتقنيات التحقق المتبادل المختلفة.

لماذا استخدام التحقق التبادلي؟

يُعد التحقق المتبادل تقنية أساسية في تقييم النماذج لعدة أسباب:

  • تقدير موثوق للأداء: من خلال حساب متوسط النتائج على تقسيمات متعددة، فإنه يعطي تقديرًا أقل تحيزًا لأداء النموذج على البيانات الجديدة مقارنةً بتقسيم واحد للتدريب/التحقق.
  • استخدام البيانات بكفاءة: يسمح باستخدام جميع البيانات تقريبًا في كل من التدريب والتحقق من الصحة عبر التكرارات المختلفة، وهو أمر مفيد بشكل خاص لمجموعات البيانات الأصغر.
  • اختيار النموذج وضبطه: إنه أمر بالغ الأهمية لمقارنة النماذج المختلفة أو ضبط المعلمات الفائقة، مما يساعد على تحديد التكوين الذي يعمم بشكل أفضل.
  • الكشف عن الإفراط/التقصير في الملاءمة: يساعد في تحديد ما إذا كان النموذج معقدًا للغاية (الإفراط في الملاءمة) أو بسيطًا للغاية(عدم الملاءمة) من خلال ملاحظة اختلافات الأداء عبر طيات مختلفة.

التحقق التبادلي مقابل التقسيم البسيط للتدريب/التحقق البسيط

في حين أن التقسيم البسيط للتدرب/التحقق من الصحة يتضمن تخصيص جزء واحد من البيانات للتحقق من الصحة فقط، فإن التحقق المتقاطع يستخدم البيانات بشكل أكثر فعالية. في التقسيم البسيط، يعتمد مقياس الأداء بشكل كبير على نقاط البيانات المحددة التي ينتهي بها المطاف في مجموعة التحقق من الصحة. تخفف عملية التحقق التبادلي من هذه التبعية من خلال ضمان استخدام كل نقطة بيانات للتحقق من الصحة مرة واحدة فقط، مما يؤدي إلى تقييم أكثر استقرارًا وجدارة بالثقة. تقدم Ultralytics إرشادات حول تنفيذ التحقق المتقاطع K-Fold Cross Validation مع Ultralytics YOLO.

التطبيقات الواقعية

يُستخدم التحقق التبادلي على نطاق واسع في مختلف مجالات الذكاء الاصطناعي والتعلم الآلي:

  1. تحليل الصور الطبية: عند تطوير نموذج للذكاء الاصطناعي للكشف عن الأورام في عمليات المسح باستخدام تقنيات مثل تجزئة الصور، يساعد التحقق المتقاطع على ضمان أداء النموذج بشكل موثوق عبر عمليات المسح من مختلف المرضى والأجهزة، مما يوفر الثقة قبل النشر السريري. يتضمن ذلك التدريب والاختبار على مجموعات فرعية مختلفة من بيانات التصوير الطبي للمرضى.
  2. اكتشاف الأجسام في الأنظمة المستقلة: لـ Ultralytics YOLO المدرّب على اكتشاف الأجسام (على سبيل المثال، تحديد المشاة للمركبات ذاتية القيادة)، يمكن للتدقيق المتقاطع K-Fold Cross-Validation تقييم مدى جودة تعميم النموذج عبر الظروف البيئية المتنوعة (الإضاءة والطقس) الموجودة في مجموعة البيانات قبل نشر النموذج. يمكن لمنصات مثل Ultralytics HUB تسهيل إدارة عمليات التدريب هذه.

من خلال توفير تقييم قوي لتعميم النماذج، تُعد أداة لا غنى عنها لبناء أنظمة ذكاء اصطناعي فعالة ويمكن الاعتماد عليها.

قراءة الكل