Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تنعيم العلامات

تعرف على كيفية منع التكيف المفرط وتحسين تعميم النموذج من خلال تهدئة التسمية. اكتشف كيفية تنفيذ هذه التقنية باستخدام Ultralytics للحصول على نتائج أفضل.

تعد عملية تنعيم التسمية تقنية تنظيمية تستخدم على نطاق واسع في التعلم الآلي لتحسين تعميم النموذج ومنع التكيف المفرط. عند تدريب الشبكات العصبية، يكون الهدف عادةً هو تقليل الخطأ بين التنبؤات والحقيقة الأساسية. ومع ذلك، إذا أصبح النموذج واثقًا جدًا من تنبؤاته — حيث يعطي احتمالية قريبة من 100٪ لفئة واحدة — فغالبًا ما يبدأ في حفظ الضوضاء المحددة في بيانات التدريب بدلاً من تعلم أنماط قوية. هذه الظاهرة، المعروفة باسم الإفراط في الملاءمة، تؤدي إلى تدهور الأداء في الأمثلة الجديدة غير المرئية. يعالج تنعيم التسمية هذه المشكلة عن طريق ثني النموذج عن التنبؤ باليقين المطلق، حيث يخبر الشبكة بشكل أساسي أن هناك دائمًا هامشًا صغيرًا للخطأ.

آليات الأهداف السهلة

لفهم كيفية عمل تهدئة التسمية، من المفيد مقارنتها بالأهداف "الصعبة" القياسية. في التقليدية التعلم الخاضع للإشراف، عادةً ما يتم تمثيل تصنيف الملصقات عبر ترميز أحادي السخونة. على سبيل المثال، في مهمة التمييز بين القطط والكلاب، سيكون لمصورة "كلب" متجه هدف [0, 1]. ولتحقيق التوافق التام مع ذلك، يدفع النموذج درجاته الداخلية، المعروفة باسم لوجيتس، نحو اللانهاية، مما قد يؤدي إلى تدرجات غير مستقرة وعدم القدرة على التكيف.

يستبدل تنعيم التسمية هذه الأرقام الصارمة 1 و 0 بأهداف "مرنة". بدلاً من احتمال الهدف 1.0، قد يتم تعيين الفئة الصحيحة 0.9، بينما الكتلة الاحتمالية المتبقية (0.1) موزعة بالتساوي على الفئات غير الصحيحة. هذا التغيير الطفيف يعدل هدف ال دالة الخسارة، مثل الانتروبيا المتقاطعة، مما يمنع وظيفة التنشيط (عادةً Softmax) من التشبع. والنتيجة هي نموذج يتعلم مجموعات أكثر إحكامًا من الفئات في مساحة الميزات وينتج نتائج أفضل معايرة النموذج، مما يعني أن الاحتمالات المتوقعة تعكس بدقة أكبر الاحتمال الحقيقي للصحة.

تطبيقات واقعية

هذه التقنية مهمة بشكل خاص في المجالات التي يكون فيها غموض البيانات متأصلًا أو تكون مجموعات البيانات عرضة لأخطاء في التصنيف .

  • التشخيص الطبي: في مجال الذكاء الاصطناعي في الرعاية الصحية، نادراً ما تكون البيانات السريرية واضحة ومحددة. على سبيل المثال، في تحليل الصور الطبية، قد يُظهر الفحص سمات تشير بشدة إلى وجود مرض ما ولكنها ليست قاطعة. التدريب باستخدام التسميات الصارمة يجبر النموذج على تجاهل هذا الغموض. من خلال تطبيق تهدئة التسميات، يحتفظ النموذج بدرجة من الشك، وهو أمر حيوي لأنظمة دعم القرار حيث يمكن أن تؤدي الثقة المفرطة إلى تشخيص خاطئ.
  • تصنيف الصور على نطاق واسع: مجموعات البيانات العامة الضخمة مثل ImageNet غالبًا ما تحتوي على صور مصنفة بشكل خاطئ أو صور تحتوي على عدة كائنات صالحة. إذا حاول النموذج ملاءمة هذه الأمثلة المشوشة بثقة 100 ٪، فإنه يتعلم ارتباطات غير صحيحة. يعمل تسوية التسمية كعازل ضد تشويش التسمية، مما يضمن ألا تؤدي بعض نقاط البيانات السيئة إلى تشويه أوزان النموذج النهائية بشكل كبير.

تطبيق تجانس التسمية مع Ultralytics

تسهل أطر العمل الحديثة للتعلم العميق تطبيق هذه التقنية. باستخدام ultralytics الحزمة، يمكنك بسهولة دمج تنعيم التسمية في خط أنابيب التدريب الخاص بك من أجل تصنيف الصور أو مهام الكشف. وغالبًا ما يتم ذلك للحصول على أداء إضافي من النماذج الحديثة مثل يولو26.

يوضح المثال التالي كيفية تدريب نموذج تصنيف مع تمكين تهدئة التسمية:

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Train with label_smoothing set to 0.1
# The target for the correct class becomes 1.0 - 0.5 * 0.1 = 0.95 (depending on implementation specifics)
model.train(data="mnist", epochs=5, label_smoothing=0.1)

مقارنة مع المفاهيم ذات الصلة

من المفيد التمييز بين تسوية التسمية واستراتيجيات التنظيم الأخرى لفهم متى يتم استخدامها.

  • مقابل التسرب: تقوم طبقة التسرب بتعطيل الخلايا العصبية بشكل عشوائي أثناء التدريب لإجبار الشبكة على تعلم التمثيلات الزائدة. في حين أن كلاهما يمنع الإفراط في الملاءمة، فإن التسرب يعدل بنية الشبكة ديناميكيًا، في حين أن تنعيم التسمية يعدل هدف التحسين (التسميات نفسها).
  • مقابل تقطير المعرفة: تتضمن كلتا التقنيتين التدريب على أهداف مرنة. ومع ذلك، في تقطير المعرفة، تأتي الأهداف المرنة من نموذج "المعلم" وتحتوي على معلومات مكتسبة (على سبيل المثال، "هذا يشبه القطة بنسبة 10٪"). في المقابل، يستخدم تسطيح التسمية أهدافًا سهلة "غير مفيدة" مشتقة رياضيًا (على سبيل المثال، "إعطاء احتمالية 10٪ لجميع الفئات الأخرى بالتساوي").
  • مقابل زيادة البيانات: استراتيجيات زيادة البيانات تغير البيانات المدخلة (التدوير، الاقتصاص، التلوين) لزيادة التنوع. تعمل عملية تنعيم التسميات على تغيير توقعات المخرجات. غالبًا ما تجمع عمليات التدريب الشاملة على Ultralytics بين الزيادة، والتسرب، وتنعيم التسميات لتحقيق أقصى دقة ممكنة.

من خلال التخفيف من مشكلة التدرج المتلاشي في الطبقات النهائية وتشجيع النموذج على تعلم ميزات أكثر قوة، يظل تهدئة التسمية عنصراً أساسياً في بنى التعلم العميق الحديثة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن