مسرد المصطلحات

بيانات التحقق من الصحة

قم بتحسين نماذج التعلم الآلي باستخدام بيانات التحقق من الصحة لمنع الإفراط في الضبط، وضبط المعلمات الفائقة، وضمان أداء قوي وواقعي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تُعد بيانات التحقق من صحة البيانات جزءًا مهمًا من عملية التعلّم الآلي، حيث تُستخدم لضبط أداء النموذج ومنع الإفراط في التكييف. وهي بمثابة فحص أثناء التدريب، مما يضمن تعميم النموذج بشكل جيد على البيانات غير المرئية. من خلال تقييم النموذج على بيانات التحقق، يمكن للممارسين اتخاذ قرارات مستنيرة بشأن بنية النموذج والمعلمات الفائقة، مما يؤدي إلى أنظمة ذكاء اصطناعي أكثر قوة وموثوقية.

ما هي بيانات التحقق من الصحة؟

بيانات التحقق من الصحة هي مجموعة فرعية من مجموعة البيانات الأصلية التي تم وضعها جانبًا أثناء مرحلة تدريب النموذج. تُستخدم لتقييم أداء نموذج التعلّم الآلي أثناء التدريب. على عكس بيانات التدريب التي يتعلم النموذج منها مباشرة، توفر بيانات التحقق من الصحة نقطة تقييم مستقلة. يساعد ذلك في مراقبة قدرة النموذج على التعميم - أي قدرته على الأداء بدقة على البيانات الجديدة غير المرئية. تختلف مجموعة التحقق من الصحة عن بيانات الاختبار، والتي يتم استخدامها فقط في نهاية عملية تطوير النموذج لتوفير تقييم نهائي غير متحيز للنموذج المُدرب.

أهمية بيانات التحقق من الصحة

يتمثل الدور الأساسي لبيانات التحقق من الصحة في ضبط المعلمة الفائقة واختيار النموذج. أثناء التدريب، يمكن تعديل نموذج التعلم الآلي بناءً على أدائه على مجموعة التحقق من الصحة. على سبيل المثال، إذا بدأ أداء النموذج على مجموعة التحقق من الصحة في التدهور بينما يستمر في التحسن على مجموعة التدريب، فهذه علامة على الإفراط في التهيئة. في مثل هذه الحالات، يمكن تطبيق تعديلات مثل التنظيم أو طبقة التسرب وتقييم فعاليتها باستخدام بيانات التحقق من الصحة. يمكن أيضًا استخدام تقنيات مثل التحقق التبادلي K-Fold للاستفادة القصوى من البيانات المحدودة لكل من التدريب والتحقق من الصحة. تساعد مراقبة مقاييس التحقق من الصحة مثل الدقة أو متوسط متوسط الدقة (mAP) في تحديد وقت إيقاف التدريب، وغالبًا ما يتم تنفيذها من خلال التوقف المبكر لمنع الإفراط في التهيئة وتوفير الموارد الحسابية.

بيانات التحقق من الصحة مقابل بيانات التدريب والاختبار

في عمليات سير عمل التعلم الآلي، عادةً ما يتم تقسيم البيانات إلى ثلاث مجموعات: التدريب، والتحقق، والاختبار.

  • بيانات التدريب: هذه هي البيانات التي يتعلم النموذج منها. تُستخدم لضبط النموذج weights and biases لتقليل دالة الخسارة إلى الحد الأدنى.
  • بيانات التحقق من الصحة: تُستخدم أثناء التدريب لتقييم أداء النموذج وضبط المعلمات الفائقة. تساعد على منع الإفراط في التهيئة وتوجيه اختيار النموذج.
  • بيانات الاختبار: تُستخدم فقط بعد تدريب النموذج بشكل كامل لتوفير تقدير نهائي غير متحيز لأداء النموذج على البيانات غير المرئية. وهو يحاكي سيناريوهات العالم الحقيقي ويقيّم قدرة النموذج على التعميم.

الفرق الرئيسي هو استخدامها. فبيانات التدريب مخصصة للتعلم، وبيانات التحقق من الصحة مخصصة للضبط والمراقبة أثناء التدريب، وبيانات الاختبار مخصصة للتقييم النهائي بعد التدريب. يضمن استخدام مجموعات بيانات منفصلة إجراء تقييم غير متحيز للأداء الحقيقي للنموذج. للحصول على فهم أعمق للمعالجة المسبقة للبيانات من أجل التعلّم الآلي، يمكن أن تكون الموارد المتعلقة بالمعالجة المسبقة للبيانات ذات قيمة.

تطبيقات بيانات التحقق من الصحة

تعد بيانات التحقق من الصحة ضرورية في جميع تطبيقات التعلم الآلي، بما في ذلك Ultralytics YOLO النماذج. إليك بعض الأمثلة:

  1. اكتشاف الأجسام في المركبات ذاتية القيادة: عند تدريب نموذج للكشف عن الأجسام مثل Ultralytics YOLO للمركبات ذاتية القيادة، تساعد بيانات التحقق، التي تتكون من صور ومقاطع فيديو غير مستخدمة في التدريب، على ضمان أن النموذج يكتشف بدقة المشاة وإشارات المرور والمركبات الأخرى في ظروف قيادة متنوعة وغير مرئية. من خلال مراقبة الأداء على بيانات التحقق، يمكن للمهندسين ضبط النموذج لتعميمه بشكل جيد على سيناريوهات الطرق الجديدة، وهو أمر بالغ الأهمية للسلامة. على سبيل المثال، أثناء YOLOv8 تدريب النموذج، يتم تتبع مقاييس التحقق من الصحة بشكل مستمر لتحسين المعلمات الفائقة للنموذج.

  2. تحليل الصور الطبية: في تحليل الصور الطبية لتشخيص الأمراض، تُستخدم بيانات التحقق من الصحة للتأكد من أن نماذج الذكاء الاصطناعي تحدد بدقة الحالات الشاذة (مثل الأورام أو الآفات) في عمليات المسح الطبي دون الإفراط في ملاءمة حالات التدريب. على سبيل المثال، عند تدريب نموذج للكشف عن أورام الدماغ باستخدام صور التصوير بالرنين المغناطيسي، تساعد مجموعة منفصلة من فحوصات التصوير بالرنين المغناطيسي في تحسين قدرة النموذج على التعميم على فحوصات المرضى الجدد، مما يعزز موثوقية التشخيص. هذه العملية مهمة للغاية في تطبيقات مثل اكتشاف الأورام، حيث تؤثر دقة النموذج بشكل مباشر على رعاية المرضى.

من خلال استخدام بيانات التحقق من الصحة بشكل صحيح، يمكن لممارسي التعلم الآلي تطوير نماذج لا تتسم بالدقة في بيانات التدريب فحسب، بل تكون قوية وموثوقة في تطبيقات العالم الحقيقي.

قراءة الكل