مسرد المصطلحات

الحقبة الزمنية

تعرّف على الحقب الزمنية في التعلم الآلي - كيف تؤثر على تدريب النموذج، وتمنع الإفراط في التركيب، وتحسّن الأداء باستخدام Ultralytics YOLO .

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

في التعلّم الآلي (ML)، وخاصةً في تدريب نماذج التعلّم العميق (DL )، تمثل الحلقة الزمنية دورة كاملة واحدة من خلال مجموعة بيانات التدريب بأكملها. إنه مفهوم أساسي يشير إلى دورة كاملة حيث يكون النموذج قد شاهد وتعلم من كل مثال تدريبي مرة واحدة. عادةً ما يتضمن التدريب عدة حقبات، مما يسمح للنموذج بتحسين معلماته الداخلية(أوزان النموذج) بشكل متكرر وتحسين أدائه في المهمة التي يتم تدريبه عليها.

كيف تعمل الحقب الزمنية

أثناء تدريب النموذج، عادةً ما تكون مجموعة البيانات كبيرة جدًا بحيث لا يمكن معالجتها دفعة واحدة بسبب قيود الذاكرة. لذلك، يتم تقسيمها إلى أجزاء أصغر تسمى دفعات. يقوم النموذج بمعالجة دفعة واحدة في كل مرة، ويحسب الخطأ (الخسارة)، ويقوم بتحديث أوزانه باستخدام خوارزمية تحسين مثل خوارزمية التدرج. لا تكتمل الحقبة إلا بعد أن يعالج النموذج جميع الدفعات التي تغطي مجموعة بيانات التدريب بأكملها. يسمح تكرار هذه العملية على عدة حقبات للنموذج بتعلم الأنماط والعلاقات المعقدة داخل البيانات بشكل أكثر فعالية.

الفترة الزمنية مقابل التكرار مقابل حجم الدُفعات

من المهم التمييز بين الحقبة الزمنية والمصطلحات ذات الصلة:

  • الفترة الزمنية: دورة واحدة كاملة من خلال مجموعة بيانات التدريب بأكملها.
  • حجم الدفعة: عدد عينات التدريب التي تمت معالجتها قبل تحديث أوزان النموذج.
  • التكرار: تحديث واحد لأوزان النموذج. يتضمن التكرار معالجة دفعة واحدة من البيانات.

العلاقة واضحة ومباشرة: إذا كانت مجموعة بيانات التدريب تحتوي على 10000 عينة وحجم الدفعة 100، فإن الحلقة الواحدة تتكون من 100 تكرار (10000 عينة / 100 عينة لكل دفعة).

أهمية الحقب في التدريب

يعد تدريب النموذج لعدة حقب زمنية أمرًا حاسمًا للتقارب، مما يعني أن النموذج يصل إلى حالة مستقرة حيث يكون أداؤه هو الأمثل أو شبه الأمثل. تمنح كل حلقة تدريبية النموذج فرصة أخرى للتعلم من أنماط البيانات. ومع ذلك، فإن عدد الحقب الزمنية هو معيار مفرط بالغ الأهمية.

  • عدد قليل جدًا من الحقب: قد لا يتعلم النموذج بما فيه الكفاية، مما يؤدي إلى عدم ملاءمته بشكل كافٍ، حيث يكون أداؤه ضعيفًا حتى على بيانات التدريب.
  • الكثير من الحقب: قد يتعلم النموذج بيانات التدريب بشكل جيد للغاية، بما في ذلك الضوضاء والتفاصيل المحددة، مما يؤدي إلى الإفراط في التكييف. يعمل النموذج المُفرط في التجهيز بشكل جيد على بيانات التدريب ولكن أداءه ضعيف على البيانات غير المرئية(بيانات التحقق من الصحة أو أمثلة العالم الحقيقي).

تساعد مراقبة مقاييس الأداء على مجموعة تحقق منفصلة أثناء التدريب على تحديد العدد الأمثل من الحلقات، وغالبًا ما تستخدم تقنيات مثل التوقف المبكر لإيقاف التدريب عندما يتوقف أداء التحقق من الصحة عن التحسن.

أمثلة من العالم الحقيقي

  1. اكتشاف الكائنات باستخدام Ultralytics YOLO: عند تدريب Ultralytics YOLO مثل YOLOv8 أو YOLO11على مجموعة بيانات مثل COCO، يمكنك تحديد التدريب ل 100 حلقة تدريبية. في كل حقبة، يقوم النموذج بمعالجة المجموعة الكاملة من صور تدريب COCO (مقسمة إلى دفعات)، وتعديل أوزانه لتحديد الكائنات وتحديد موقعها بشكل أفضل. وتوفر منصات مثل Ultralytics HUB أدوات لإدارة عملية التدريب هذه ومراقبة التقدم المحرز عبر الحقب الزمنية.
  2. معالجة اللغة الطبيعية (NLP): يتضمن تدريب نموذج مثل نموذج BERT لتحليل المشاعر على مجموعة بيانات من مراجعات العملاء عدة حقب زمنية. على سبيل المثال، يعني التدريب لخمس حقبات أن النموذج يقرأ جميع المراجعات خمس مرات. مع كل تمرين (حقبة)، باستخدام مكتبات مثل Hugging Face Transformers غالبًا عبر أطر مثل PyTorch أو TensorFlowيحسّن النموذج قدرته على تصنيف المراجعات على أنها إيجابية أو سلبية أو محايدة.

تعتبر الحقب الزمنية حجر الزاوية في التعلم التكراري في التعلم الآلي، حيث توازن بين الحاجة إلى التعرض الكافي للبيانات ومخاطر الإفراط في التهيئة. يعد اختيار العدد المناسب من الحقب الزمنية - غالبًا من خلال التجريب والمراقبة الدقيقة - أمرًا أساسيًا لبناء نماذج فعالة. يمكنك العثور على المزيد من التعريفات في مصادر مثل مسرد مصطلحات تعلم الآلة من Google .

قراءة الكل