تعرف على كيفية منع التكيف المفرط وتحسين تعميم النموذج من خلال تهدئة التسمية. اكتشف كيفية تنفيذ هذه التقنية باستخدام Ultralytics للحصول على نتائج أفضل.
تعد عملية تنعيم التسمية تقنية تنظيمية تستخدم على نطاق واسع في التعلم الآلي لتحسين تعميم النموذج ومنع التكيف المفرط. عند تدريب الشبكات العصبية، يكون الهدف عادةً هو تقليل الخطأ بين التنبؤات والحقيقة الأساسية. ومع ذلك، إذا أصبح النموذج واثقًا جدًا من تنبؤاته — حيث يعطي احتمالية قريبة من 100٪ لفئة واحدة — فغالبًا ما يبدأ في حفظ الضوضاء المحددة في بيانات التدريب بدلاً من تعلم أنماط قوية. هذه الظاهرة، المعروفة باسم الإفراط في الملاءمة، تؤدي إلى تدهور الأداء في الأمثلة الجديدة غير المرئية. يعالج تنعيم التسمية هذه المشكلة عن طريق ثني النموذج عن التنبؤ باليقين المطلق، حيث يخبر الشبكة بشكل أساسي أن هناك دائمًا هامشًا صغيرًا للخطأ.
لفهم كيفية عمل تهدئة التسمية، من المفيد مقارنتها بالأهداف "الصعبة" القياسية. في
التقليدية التعلم الخاضع للإشراف، عادةً ما يتم تمثيل
تصنيف الملصقات عبر ترميز أحادي السخونة. على سبيل المثال،
في مهمة التمييز بين القطط والكلاب، سيكون لمصورة "كلب" متجه هدف
[0, 1]. ولتحقيق التوافق التام مع ذلك، يدفع النموذج درجاته الداخلية، المعروفة باسم
لوجيتس، نحو اللانهاية، مما قد يؤدي
إلى تدرجات غير مستقرة وعدم القدرة على التكيف.
يستبدل تنعيم التسمية هذه الأرقام الصارمة 1 و 0 بأهداف "مرنة". بدلاً من احتمال الهدف
1.0، قد يتم تعيين الفئة الصحيحة 0.9، بينما الكتلة الاحتمالية المتبقية
(0.1) موزعة بالتساوي على الفئات غير الصحيحة. هذا التغيير الطفيف يعدل هدف
ال دالة الخسارة، مثل
الانتروبيا المتقاطعة، مما يمنع
وظيفة التنشيط (عادةً
Softmax) من التشبع. والنتيجة هي نموذج يتعلم
مجموعات أكثر إحكامًا من الفئات في مساحة الميزات وينتج نتائج أفضل
معايرة النموذج، مما يعني أن الاحتمالات المتوقعة
تعكس بدقة أكبر الاحتمال الحقيقي للصحة.
هذه التقنية مهمة بشكل خاص في المجالات التي يكون فيها غموض البيانات متأصلًا أو تكون مجموعات البيانات عرضة لأخطاء في التصنيف .
تسهل أطر العمل الحديثة للتعلم العميق تطبيق هذه التقنية. باستخدام
ultralytics الحزمة، يمكنك بسهولة دمج تنعيم التسمية في خط أنابيب التدريب الخاص بك من أجل
تصنيف الصور أو مهام الكشف.
وغالبًا ما يتم ذلك للحصول على أداء إضافي من النماذج الحديثة مثل
يولو26.
يوضح المثال التالي كيفية تدريب نموذج تصنيف مع تمكين تهدئة التسمية:
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Train with label_smoothing set to 0.1
# The target for the correct class becomes 1.0 - 0.5 * 0.1 = 0.95 (depending on implementation specifics)
model.train(data="mnist", epochs=5, label_smoothing=0.1)
من المفيد التمييز بين تسوية التسمية واستراتيجيات التنظيم الأخرى لفهم متى يتم استخدامها.
من خلال التخفيف من مشكلة التدرج المتلاشي في الطبقات النهائية وتشجيع النموذج على تعلم ميزات أكثر قوة، يظل تهدئة التسمية عنصراً أساسياً في بنى التعلم العميق الحديثة.