مسرد المصطلحات

تعزيز البيانات

عزز نماذج التعلم الآلي الخاصة بك من خلال زيادة البيانات. اكتشف تقنيات لتعزيز الدقة وتقليل الإفراط في التركيب وتحسين المتانة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

زيادة البيانات هي تقنية تُستخدم في التعلم الآلي لتوسيع حجم مجموعة بيانات التدريب بشكل مصطنع عن طريق إنشاء نسخ معدلة من البيانات الموجودة. وتتضمن هذه العملية تطبيق تحويلات مختلفة على البيانات الأصلية، مثل تدوير الصور أو قلبها أو تغيير حجمها أو قياسها أو اقتصاصها. من خلال زيادة تنوع بيانات التدريب، تساعد زيادة البيانات على تحسين قدرة نماذج التعلم الآلي على التعميم، مما يجعلها أكثر قوة وأقل عرضة للإفراط في التخصيص. يحدث الإفراط في التعميم عندما يتعلم النموذج بيانات التدريب بشكل جيد للغاية، بما في ذلك الضوضاء والقيم المتطرفة، مما قد يؤدي إلى ضعف الأداء على البيانات الجديدة غير المرئية.

فوائد تعزيز البيانات

توفر زيادة البيانات العديد من الفوائد الرئيسية. أولاً، يساعد على الحد من الإفراط في الملاءمة من خلال تعريض النموذج لمجموعة واسعة من الاختلافات أثناء التدريب. وهذا يجعل النموذج أقل حساسية لخصائص محددة لبيانات التدريب وأكثر قدرة على التعميم على البيانات الجديدة غير المرئية. ثانيًا، يمكنه تحسين دقة النماذج وأدائها، خاصةً عندما تكون مجموعة البيانات الأصلية صغيرة أو تفتقر إلى التنوع. من خلال إنشاء المزيد من الأمثلة التدريبية، توفر زيادة البيانات للنموذج المزيد من الفرص لتعلم الأنماط الأساسية في البيانات. أخيرًا، يمكن أن يعزز متانة النموذج، مما يجعله أكثر مرونة في مواجهة التغييرات في بيانات المدخلات، مثل الاختلافات في الإضاءة أو الاتجاه أو ضوضاء الخلفية.

تقنيات تعزيز البيانات الشائعة

تُستخدم العديد من التقنيات الشائعة لزيادة البيانات، خاصة في مهام الرؤية الحاسوبية:

  • التحويلات الهندسية: وتشمل عمليات مثل التدوير والترجمة والقياس والقص والقص والقلب. على سبيل المثال، يمكن أن يؤدي تدوير صورة ببضع درجات أو قلبها أفقيًا إلى إنشاء أمثلة تدريبية جديدة وصالحة.
  • تحويلات مساحة اللون: يمكن أن يؤدي ضبط السطوع أو التباين أو التشبع أو التدرج اللوني للصورة إلى محاكاة ظروف الإضاءة المختلفة وتحسين قدرة النموذج على التعميم عبر بيئات مختلفة.
  • مرشحات النواة: يمكن أن يساعد تطبيق المرشحات لتوضيح الصور أو تشويشها في مساعدة النموذج على تعلم الميزات الثابتة لهذه التغييرات.
  • المسح العشوائي: يمكن أن يساعد المسح العشوائي لأجزاء من الصورة على أن يصبح النموذج أكثر قوة في مواجهة الانسدادات أو الأجزاء المفقودة من الأجسام.
  • مزج الصور: تتضمن تقنيات مثل MixUp و CutMix مزج الصور والتسميات المقابلة لها لإنشاء أمثلة تدريبية جديدة. على سبيل المثال، تعمل تقنية MixUp على استيفاء الصور وتسمياتها خطيًا.

زيادة البيانات في الرؤية الحاسوبية

في الرؤية الحاسوبية، تعد زيادة البيانات مفيدة بشكل خاص لأنها يمكن أن تحاكي مجموعة واسعة من سيناريوهات العالم الحقيقي التي قد يواجهها النموذج. على سبيل المثال، في مجال اكتشاف الأجسام، يمكن لنموذج Ultralytics YOLO في المرة الأولى YOLO في نموذج الصفحة المدرّب على الصور المعززة أن يتعلم اكتشاف الأجسام بغض النظر عن اتجاهها أو حجمها أو ظروف الإضاءة. وهذا أمر بالغ الأهمية لتطبيقات مثل المركبات ذاتية القيادة، حيث يجب أن يعمل النموذج بشكل موثوق في ظل ظروف متنوعة وغير متوقعة. على سبيل المثال، من خلال تطبيق العديد من التحويلات مثل التدوير والقياس وإضافة الضوضاء إلى صور المشاة والمركبات، يمكن تدريب نظام القيادة الذاتية على اكتشاف هذه الأجسام بدقة في مجموعة متنوعة من سيناريوهات العالم الحقيقي. وبالمثل، في تصنيف الصور، يمكن أن تساعد زيادة الصور بتعديلات لونية مختلفة في تعميم النموذج بشكل أفضل على ظروف الإضاءة المختلفة.

تعزيز البيانات في مجالات أخرى

في حين أن زيادة البيانات تُستخدم على نطاق واسع في الرؤية الحاسوبية، إلا أنها قابلة للتطبيق أيضًا في مجالات أخرى مثل معالجة اللغات الطبيعية (NLP) ومعالجة الصوت. في معالجة اللغات الطبيعية، يمكن أن تؤدي تقنيات مثل استبدال المرادفات والترجمة العكسية والإدراج/الحذف العشوائي للكلمات إلى زيادة البيانات النصية. في معالجة الصوت، يمكن أن تؤدي إضافة ضوضاء في الخلفية أو تغيير درجة الصوت أو تمديد الصوت زمنيًا إلى إنشاء أمثلة تدريبية متنوعة.

التطبيقات الواقعية

  • الرعاية الصحية: في تحليل الصور الطبية، يمكن استخدام زيادة البيانات لتدريب النماذج على عدد محدود من الصور الطبية. على سبيل المثال، من خلال تطبيق عمليات التدوير والقلب والتشوهات الصغيرة على فحوصات التصوير بالرنين المغناطيسي، يمكن للنموذج أن يتعلم كيفية اكتشاف الحالات الشاذة بدقة أكبر عبر مختلف المرضى وظروف التصوير.
  • الزراعة: يمكن أن تساعد زيادة البيانات في تدريب النماذج على اكتشاف الأمراض أو الآفات النباتية من الصور الملتقطة في ظروف مختلفة. من خلال زيادة صور المحاصيل بإضاءة وزوايا ومستويات تكبير وتكبير مختلفة، يمكن للنماذج أن تؤدي أداءً قويًا في الحقل، مما يساعد المزارعين على تحديد المشاكل مبكرًا واتخاذ الإجراءات التصحيحية.

تعزيز البيانات مقابل التقنيات الأخرى

من المهم التمييز بين زيادة البيانات والتقنيات الأخرى ذات الصلة:

  • المعالجة المسبقة للبيانات: في حين أن كلاً من زيادة البيانات والمعالجة المسبقة للبيانات تُعد البيانات لتدريب النموذج، فإن المعالجة المسبقة للبيانات تتضمن عادةً خطوات مثل التطبيع والتوحيد القياسي والتعامل مع القيم المفقودة. هذه الخطوات ضرورية لضمان أن تكون البيانات بتنسيق مناسب للنموذج. من ناحية أخرى، تركز زيادة البيانات على زيادة تنوع بيانات التدريب.
  • توليد البيانات الاصطناعية: تتضمن البيانات الاصطناعية إنشاء نقاط بيانات جديدة تمامًا، وغالبًا ما يتم ذلك باستخدام نماذج توليدية مثل شبكات الخصومة التوليدية (GANs). وهذا يختلف عن زيادة البيانات، التي تعدل البيانات الموجودة. يمكن أن تكون البيانات الاصطناعية مفيدة بشكل خاص عندما تكون البيانات الحقيقية نادرة أو حساسة، كما هو الحال في التطبيقات الطبية أو المالية.

الأدوات والمكتبات

تدعم العديد من الأدوات والمكتبات زيادة البيانات. في Python ، مكتبات مثل OpenCV و TensorFlow مجموعة واسعة من الوظائف لتحويلات الصور. بالإضافة إلى ذلك، توفر مكتبات متخصصة مثل Albumentations خطوط أنابيب زيادة محسّنة ومتنوعة للغاية. Ultralytics يوفر HUB أيضًا أدوات لزيادة البيانات، مما يسهل دمج هذه التقنيات في عملية تدريب النموذج. استكشف تقنيات زيادة البيانات مثل MixUp و Mosaic و Random Perspective لتعزيز تدريب النموذج.

قراءة الكل