عزز نماذج التعلم الآلي الخاصة بك من خلال زيادة البيانات. اكتشف تقنيات لتعزيز الدقة وتقليل الإفراط في التركيب وتحسين المتانة.
زيادة البيانات هي تقنية تُستخدم في التعلم الآلي لتوسيع حجم مجموعة بيانات التدريب بشكل مصطنع عن طريق إنشاء نسخ معدلة من البيانات الموجودة. وتتضمن هذه العملية تطبيق تحويلات مختلفة على البيانات الأصلية، مثل تدوير الصور أو قلبها أو تغيير حجمها أو قياسها أو اقتصاصها. من خلال زيادة تنوع بيانات التدريب، تساعد زيادة البيانات على تحسين قدرة نماذج التعلم الآلي على التعميم، مما يجعلها أكثر قوة وأقل عرضة للإفراط في التخصيص. يحدث الإفراط في التعميم عندما يتعلم النموذج بيانات التدريب بشكل جيد للغاية، بما في ذلك الضوضاء والقيم المتطرفة، مما قد يؤدي إلى ضعف الأداء على البيانات الجديدة غير المرئية.
توفر زيادة البيانات العديد من الفوائد الرئيسية. أولاً، يساعد على الحد من الإفراط في الملاءمة من خلال تعريض النموذج لمجموعة واسعة من الاختلافات أثناء التدريب. وهذا يجعل النموذج أقل حساسية لخصائص محددة لبيانات التدريب وأكثر قدرة على التعميم على البيانات الجديدة غير المرئية. ثانيًا، يمكنه تحسين دقة النماذج وأدائها، خاصةً عندما تكون مجموعة البيانات الأصلية صغيرة أو تفتقر إلى التنوع. من خلال إنشاء المزيد من الأمثلة التدريبية، توفر زيادة البيانات للنموذج المزيد من الفرص لتعلم الأنماط الأساسية في البيانات. أخيرًا، يمكن أن يعزز متانة النموذج، مما يجعله أكثر مرونة في مواجهة التغييرات في بيانات المدخلات، مثل الاختلافات في الإضاءة أو الاتجاه أو ضوضاء الخلفية.
تُستخدم العديد من التقنيات الشائعة لزيادة البيانات، خاصة في مهام الرؤية الحاسوبية:
في الرؤية الحاسوبية، تعد زيادة البيانات مفيدة بشكل خاص لأنها يمكن أن تحاكي مجموعة واسعة من سيناريوهات العالم الحقيقي التي قد يواجهها النموذج. على سبيل المثال، في مجال اكتشاف الأجسام، يمكن لنموذج Ultralytics YOLO في المرة الأولى YOLO في نموذج الصفحة المدرّب على الصور المعززة أن يتعلم اكتشاف الأجسام بغض النظر عن اتجاهها أو حجمها أو ظروف الإضاءة. وهذا أمر بالغ الأهمية لتطبيقات مثل المركبات ذاتية القيادة، حيث يجب أن يعمل النموذج بشكل موثوق في ظل ظروف متنوعة وغير متوقعة. على سبيل المثال، من خلال تطبيق العديد من التحويلات مثل التدوير والقياس وإضافة الضوضاء إلى صور المشاة والمركبات، يمكن تدريب نظام القيادة الذاتية على اكتشاف هذه الأجسام بدقة في مجموعة متنوعة من سيناريوهات العالم الحقيقي. وبالمثل، في تصنيف الصور، يمكن أن تساعد زيادة الصور بتعديلات لونية مختلفة في تعميم النموذج بشكل أفضل على ظروف الإضاءة المختلفة.
في حين أن زيادة البيانات تُستخدم على نطاق واسع في الرؤية الحاسوبية، إلا أنها قابلة للتطبيق أيضًا في مجالات أخرى مثل معالجة اللغات الطبيعية (NLP) ومعالجة الصوت. في معالجة اللغات الطبيعية، يمكن أن تؤدي تقنيات مثل استبدال المرادفات والترجمة العكسية والإدراج/الحذف العشوائي للكلمات إلى زيادة البيانات النصية. في معالجة الصوت، يمكن أن تؤدي إضافة ضوضاء في الخلفية أو تغيير درجة الصوت أو تمديد الصوت زمنيًا إلى إنشاء أمثلة تدريبية متنوعة.
من المهم التمييز بين زيادة البيانات والتقنيات الأخرى ذات الصلة:
تدعم العديد من الأدوات والمكتبات زيادة البيانات. في Python ، مكتبات مثل OpenCV و TensorFlow مجموعة واسعة من الوظائف لتحويلات الصور. بالإضافة إلى ذلك، توفر مكتبات متخصصة مثل Albumentations خطوط أنابيب زيادة محسّنة ومتنوعة للغاية. Ultralytics يوفر HUB أيضًا أدوات لزيادة البيانات، مما يسهل دمج هذه التقنيات في عملية تدريب النموذج. استكشف تقنيات زيادة البيانات مثل MixUp و Mosaic و Random Perspective لتعزيز تدريب النموذج.