شيك أخضر
تم نسخ الرابط إلى الحافظة

ما هو الإفراط في التركيب في الرؤية الحاسوبية وكيفية منعه؟

تعرّف على ماهية الإفراط في التركيب في مجال الرؤية الحاسوبية وكيفية منعه باستخدام زيادة البيانات، والتنظيم، والنماذج المدربة مسبقًا.

تم تصميم نماذج الرؤية الحاسوبية للتعرف على الأنماط واكتشاف الأجسام وتحليل الصور. ومع ذلك، فإن أداءها يعتمد على مدى تعميمها على البيانات غير المرئية. التعميم هو قدرة النموذج على العمل بشكل جيد على الصور الجديدة، وليس فقط تلك التي تم تدريبه عليها. إحدى المشاكل الشائعة في تدريب هذه النماذج هي الإفراط في التعميم، حيث يتعلم النموذج الكثير من بيانات التدريب، بما في ذلك الضوضاء غير الضرورية، بدلاً من تحديد الأنماط ذات المغزى.

عندما يحدث هذا، فإن النموذج يعمل بشكل جيد على بيانات التدريب ولكنه يعاني مع الصور الجديدة. على سبيل المثال، قد يفشل نموذج الكشف عن الأجسام الذي تم تدريبه فقط على صور عالية الدقة وجيدة الإضاءة عند تقديم صور ضبابية أو مظللة في ظروف العالم الحقيقي. يحد التكييف المفرط من قدرة النموذج على التكيف، مما يحد من استخدامه في تطبيقات العالم الحقيقي مثل القيادة الذاتية والتصوير الطبي وأنظمة الأمن.

في هذه المقالة، سنستكشف ما هو الإفراط في التركيب، ولماذا يحدث، وكيفية منعه. سننظر أيضًا في كيفية عمل نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 في الحد من الإفراط في التركيب وتحسين التعميم.

ما هو الإفراط في التركيب؟

يحدث الإفراط في التهيئة عندما يحفظ النموذج بيانات التدريب بدلاً من تعلم الأنماط التي تنطبق على نطاق واسع على المدخلات الجديدة. يركز النموذج على بيانات التدريب أكثر من اللازم، لذا فإنه يكافح مع الصور أو المواقف الجديدة التي لم يسبق له أن رآها من قبل.

في رؤية الكمبيوتر، يمكن أن يؤثر الإفراط في التركيب على مهام مختلفة. قد يعاني نموذج التصنيف الذي يتم تدريبه على صور ساطعة وواضحة فقط في ظروف الإضاءة المنخفضة. قد يفشل نموذج اكتشاف الأجسام الذي يتعلم من الصور المثالية في المشاهد المزدحمة أو الفوضوية. وبالمثل، قد يعمل نموذج تجزئة المثيل بشكل جيد في الإعدادات الخاضعة للرقابة ولكن قد يواجه مشكلة مع الظلال أو الأجسام المتداخلة.

ويصبح هذا الأمر مشكلة في تطبيقات الذكاء الاصطناعي في العالم الحقيقي، حيث يجب أن تكون النماذج قادرة على التعميم خارج ظروف التدريب الخاضعة للرقابة. على سبيل المثال، يجب أن تكون السيارات ذاتية القيادة قادرة على اكتشاف المشاة في ظروف الإضاءة والطقس والبيئات المختلفة. لن يكون أداء النموذج الذي يلائم مجموعة التدريب الخاصة به أكثر من اللازم موثوقاً في مثل هذه السيناريوهات غير المتوقعة.

متى ولماذا يحدث الإفراط في الملاءمة؟

يحدث الإفراط في التركيب عادةً بسبب مجموعات البيانات غير المتوازنة، والتعقيد المفرط للنموذج، والإفراط في التدريب. فيما يلي الأسباب الرئيسية:

  • بيانات تدريب محدودة: مجموعات البيانات الصغيرة تجعل النماذج تحفظ الأنماط بدلاً من تعميمها. قد يواجه النموذج المُدرَّب على 50 صورة فقط من صور الطيور صعوبة في اكتشاف أنواع الطيور خارج مجموعة البيانات تلك.

  • نماذج معقدة ذات معلمات كثيرة جداً: تميل الشبكات العميقة ذات الطبقات والخلايا العصبية المفرطة إلى حفظ التفاصيل الدقيقة بدلاً من التركيز على السمات الأساسية.

  • عدم وجود زيادة البيانات: بدون تحويلات مثل الاقتصاص أو التقليب أو التدوير، قد يتعلم النموذج فقط من صور التدريب الخاصة به بالضبط.

  • التدريب المطول: إذا مرّ النموذج ببيانات التدريب عدة مرات، والمعروفة باسم الحقب الزمنية، فإنه يحفظ التفاصيل بدلاً من تعلم الأنماط العامة، مما يجعله أقل قدرة على التكيف.

  • التسميات غير المتسقة أو الضوضاء: تتسبب البيانات المصنفة بشكل غير صحيح في أن يتعلم النموذج الأنماط الخاطئة. وهذا أمر شائع في مجموعات البيانات المصنفة يدويًا.

يضمن اتباع نهج متوازن في تعقيد النموذج وجودة مجموعة البيانات وتقنيات التدريب تعميمًا أفضل.

الإفراط في التركيب مقابل التقصير في التركيب

إن الإفراط في التركيب ونقص التركيب هما مشكلتان قطبيتان تماماً في التعلم العميق.

_w_f_reserved_herit
الشكل 1. مقارنة بين عدم الملاءمة والتعلم الأمثل والإفراط في نماذج الرؤية الحاسوبية.

يحدث الإفراط في التركيب عندما يكون النموذج معقدًا للغاية، مما يجعله يركز بشكل مفرط على بيانات التدريب. بدلاً من تعلم الأنماط العامة، فإنه يحفظ التفاصيل الصغيرة، حتى تلك التي لا صلة لها بالموضوع مثل ضوضاء الخلفية. يؤدي هذا إلى أداء النموذج بشكل جيد على بيانات التدريب ولكنه يعاني مع الصور الجديدة، مما يعني أنه لم يتعلم حقًا كيفية التعرف على الأنماط التي تنطبق على المواقف المختلفة.

يحدث عدم الملاءمة عندما يكون النموذج أساسيًا جدًا، لذا فهو يغفل أنماطًا مهمة في البيانات. يمكن أن يحدث هذا عندما يحتوي النموذج على عدد قليل جدًا من الطبقات، أو عندما لا يكون وقت التدريب كافيًا، أو عندما تكون البيانات محدودة. ونتيجة لذلك، يفشل النموذج في التعرف على الأنماط المهمة ويقوم بتنبؤات غير دقيقة. يؤدي هذا إلى ضعف الأداء في كل من بيانات التدريب والاختبار لأن النموذج لم يتعلم ما يكفي لفهم المهمة بشكل صحيح. 

يجد النموذج المدرب جيدًا التوازن بين التعقيد والتعميم. يجب أن يكون معقدًا بما فيه الكفاية لتعلم الأنماط ذات الصلة ولكن ليس معقدًا لدرجة أنه يحفظ البيانات بدلاً من التعرف على العلاقات الأساسية.

كيفية التعرف على الإفراط في الملاءمة

فيما يلي بعض العلامات التي تشير إلى أن النموذج مفرط في الملاءمة:

  • إذا كانت دقة التدريب أعلى بكثير من دقة التحقق من الصحة، فمن المحتمل أن يكون النموذج مفرطًا في الملاءمة.
  • يعد اتساع الفجوة بين خسارة التدريب وخسارة التحقق من الصحة مؤشرًا قويًا آخر.
  • النموذج واثق للغاية في الإجابات الخاطئة، مما يدل على أنه يحفظ التفاصيل بدلاً من فهم الأنماط.

لضمان تعميم النموذج بشكل جيد، يجب اختباره على مجموعات بيانات متنوعة تعكس ظروف العالم الحقيقي.

كيفية منع الإفراط في التركيب في الرؤية الحاسوبية

الإفراط في التركيب ليس حتمياً ويمكن منعه. باستخدام التقنيات الصحيحة، يمكن لنماذج الرؤية الحاسوبية أن تتعلم الأنماط العامة بدلاً من حفظ بيانات التدريب، مما يجعلها أكثر موثوقية في تطبيقات العالم الحقيقي. 

فيما يلي خمس استراتيجيات رئيسية لمنع الإفراط في التركيب في الرؤية الحاسوبية.

زيادة تنوع البيانات مع زيادة البيانات المعززة والبيانات التركيبية

إن أفضل طريقة لمساعدة النموذج على العمل بشكل جيد على البيانات الجديدة هي توسيع مجموعة البيانات باستخدام زيادة البيانات والبيانات التركيبية. يتم إنشاء البيانات الاصطناعية بواسطة الحاسوب بدلاً من جمعها من صور العالم الحقيقي. وهي تساعد في سد الثغرات عندما لا توجد بيانات حقيقية كافية.

_w_f_reserved_herit
الشكل 2. يقلل الجمع بين بيانات العالم الحقيقي والبيانات الاصطناعية من الإفراط في التركيب ويحسن دقة اكتشاف الأجسام.

تعمل زيادة البيانات على تغيير الصور الحالية بشكل طفيف عن طريق التقليب أو التدوير أو الاقتصاص أو تعديل السطوع، بحيث لا يكتفي النموذج بحفظ التفاصيل فحسب، بل يتعلم التعرف على الأشياء في مواقف مختلفة.

البيانات الاصطناعية مفيدة عندما يصعب الحصول على صور حقيقية. على سبيل المثال، يمكن لنماذج السيارات ذاتية القيادة أن تتدرب على مشاهد الطرق التي تم إنشاؤها بواسطة الكمبيوتر لتتعلم كيفية اكتشاف الأجسام في ظروف الطقس والإضاءة المختلفة. وهذا يجعل النموذج أكثر مرونة وموثوقية دون الحاجة إلى آلاف الصور الواقعية.

تحسين تعقيد النموذج وبنيته

إن الشبكة العصبية العميقة، وهي نوع من نماذج التعلم الآلي التي تحتوي على العديد من الطبقات التي تعالج البيانات بدلاً من طبقة واحدة، ليست دائماً أفضل. عندما يحتوي النموذج على عدد كبير جدًا من الطبقات أو المعلمات، فإنه يحفظ بيانات التدريب بدلاً من التعرف على الأنماط الأوسع نطاقًا. يمكن أن يساعد الحد من التعقيد غير الضروري في منع الإفراط في التركيب.

ولتحقيق ذلك، فإن أحد الأساليب هو التقليم، الذي يزيل الخلايا العصبية والوصلات الزائدة عن الحاجة، مما يجعل النموذج أكثر رشاقة وكفاءة. 

وهناك طريقة أخرى تتمثل في تبسيط البنية من خلال تقليل عدد الطبقات أو الخلايا العصبية. تم تصميم النماذج المدربة مسبقًا مثل YOLO11 لتعميمها بشكل جيد عبر المهام مع عدد أقل من المعلمات، مما يجعلها أكثر مقاومة للإفراط في التكييف من تدريب نموذج عميق من الصفر.

يساعده العثور على التوازن الصحيح بين عمق النموذج وكفاءته على تعلم أنماط مفيدة دون الاكتفاء بحفظ بيانات التدريب.

تطبيق تقنيات التنظيم

تمنع تقنيات التنظيم النماذج من أن تصبح معتمدة بشكل كبير على ميزات محددة في بيانات التدريب. فيما يلي بعض التقنيات الشائعة الاستخدام:

  • يؤدي التسرب إلى إيقاف تشغيل الأجزاء العشوائية من النموذج أثناء التدريب حتى يتعلم التعرف على الأنماط المختلفة بدلاً من الاعتماد بشكل كبير على بعض الميزات.

  • يعمل تضاؤل الوزن (تنظيم L2) على تثبيط قيم الوزن القصوى، مما يحافظ على تعقيد النموذج تحت السيطرة.

  • يساعد تطبيع الدفعات على استقرار التدريب من خلال ضمان أن يكون النموذج أقل حساسية للتغيرات في مجموعة البيانات.

تساعد هذه التقنيات في الحفاظ على مرونة النموذج وقابليته للتكيف، مما يقلل من مخاطر الإفراط في التكييف مع الحفاظ على الدقة.

مراقبة التدريب مع التحقق من الصحة والتوقف المبكر

لمنع الإفراط في التركيب، من المهم تتبع كيفية تعلم النموذج والتأكد من تعميمه بشكل جيد على البيانات الجديدة. إليك بعض التقنيات للمساعدة في ذلك:

  • التوقف المبكر: ينهي التدريب تلقائيًا عندما يتوقف النموذج عن التحسن، بحيث لا يستمر في تعلم تفاصيل غير ضرورية.

  • التحقق المتقاطع: تقسيم البيانات إلى أجزاء وتدريب النموذج على كل جزء منها. يساعده ذلك على تعلم الأنماط بدلاً من حفظ صور محددة.

تساعد هذه التقنيات النموذج على البقاء متوازنًا بحيث يتعلم ما يكفي ليكون دقيقًا دون أن يركز بشكل كبير على بيانات التدريب فقط.

استخدام النماذج المدربة مسبقاً وتحسين تصنيف مجموعة البيانات

بدلاً من التدريب من الصفر، يمكن أن يؤدي استخدام نماذج مُدرّبة مسبقاً مثل YOLO11 إلى تقليل الإفراط في التجهيز. يتم تدريب YOLO11 على مجموعات بيانات واسعة النطاق، مما يسمح له بالتعميم بشكل جيد عبر الظروف المختلفة.

_w_f_reserved_herit
الشكل 3. تعمل نماذج الرؤية الحاسوبية المدربة مسبقًا على تحسين الدقة ومنع الإفراط في التركيب.

يساعد الضبط الدقيق للنموذج المُدرَّب مسبقًا على الاحتفاظ بما يعرفه بالفعل أثناء تعلم مهام جديدة، بحيث لا يكتفي بحفظ بيانات التدريب.

بالإضافة إلى ذلك، من الضروري ضمان وضع علامات عالية الجودة على مجموعة البيانات. يمكن أن تؤدي البيانات غير المسمّاة أو غير المتوازنة إلى تضليل النماذج في تعلم أنماط غير صحيحة. يؤدي تنظيف مجموعات البيانات وإصلاح الصور ذات التسميات الخاطئة وموازنة الفئات إلى تحسين الدقة وتقليل مخاطر الإفراط في التعيين. ومن الأساليب الفعّالة الأخرى هي التدريب العدائي، حيث يتعرض النموذج لأمثلة معدّلة قليلاً أو أكثر صعوبة مصممة لاختبار حدوده.

الوجبات الرئيسية

يعد الإفراط في التركيب مشكلة شائعة في مجال الرؤية الحاسوبية. قد يعمل النموذج بشكل جيد على بيانات التدريب ولكنه قد يواجه صعوبة في التعامل مع صور العالم الحقيقي. لتجنب ذلك، تساعد تقنيات مثل زيادة البيانات، والتنظيم، واستخدام نماذج مُدرّبة مسبقًا مثل YOLO11 على تحسين الدقة والقدرة على التكيف.

من خلال تطبيق هذه الأساليب، يمكن لنماذج الذكاء الاصطناعي أن تظل موثوقة وذات أداء جيد في بيئات مختلفة. مع تحسن التعلم العميق، فإن التأكد من تعميم النماذج بشكل صحيح سيكون مفتاح نجاح الذكاء الاصطناعي في العالم الحقيقي.

انضم إلى مجتمعنا المتنامي! استكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. هل أنت مستعد لبدء مشاريع الرؤية الحاسوبية الخاصة بك؟ اطلع على خيارات الترخيص لدينا. اكتشف الذكاء الاصطناعي البصري في القيادة الذاتية والذكاء الاصطناعي في مجال الرعاية الصحية من خلال زيارة صفحات الحلول الخاصة بنا!

شعار LinkedInشعار تويترشعار الفيسبوكرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي