مسرد المصطلحات

تنعيم الملصق

اكتشف كيف يعمل تجانس التسميات على تحسين نماذج التعلّم الآلي من خلال الحد من الإفراط في التخصيص، وتعزيز التعميم، وزيادة موثوقية التنبؤ.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تجانس التسمية هي تقنية تنظيمية تُستخدم عادةً في تدريب نماذج التعلم الآلي، خاصةً في مهام التصنيف. ويتضمن تعديل التسميات الحقيقية الأرضية لتكون أقل ثقة، واستبدال الترميز الأحادي للتسميات بنسخة سلسة. يقلل هذا التعديل من الثقة المفرطة في تنبؤات النموذج، ويحسن التعميم، ويخفف من الإفراط في التكييف.

كيفية عمل تنعيم الملصق

في مشكلة تصنيف نموذجية، يعيّن الترميز الأحادي الاحتمال 1 للفئة الصحيحة و0 لجميع الفئات الأخرى. تعدل تسوية التسمية هذه الاحتمالات عن طريق إعادة توزيع جزء صغير من الثقة من الفئة الصحيحة إلى جميع الفئات. على سبيل المثال، بدلاً من تمثيل التسمية على أنها [1, 0, 0]، قد يمثل تجانس التسمية على النحو التالي [0.9, 0.05, 0.05] لعامل تنعيم قدره 0.1.

من خلال تخفيف الحقيقة الأرضية، يتجنب النموذج الثقة المفرطة في تنبؤاته. هذا يجعل النموذج أكثر قوة، خاصة في السيناريوهات التي تحتوي فيها البيانات على ضوضاء أو يصعب تصنيفها.

فوائد تنعيم الملصق

  1. تحسين التعميم: من خلال تقليل الثقة المفرطة في التنبؤات، يساعد تجانس التسميات النماذج على التعميم بشكل أفضل على البيانات غير المرئية.
  2. التخفيف من الإفراط في الملاءمة: يعمل بمثابة منظّم، مما يجعل النموذج أقل حساسية للضوضاء في تسميات التدريب.
  3. معايرة محسّنة: غالبًا ما تنتج النماذج المُدرّبة على تجانس التسميات احتمالات مُعايرة بشكل أفضل، والتي تكون أقرب إلى الاحتمال الفعلي للصحة.

تطبيقات تنعيم الملصقات

تصنيف الصور

يُستخدم تجانس التسمية على نطاق واسع في مهام تصنيف الصور لتحسين معايرة النموذج والأداء. على سبيل المثال، غالبًا ما تستخدم النماذج مثل تلك النماذج المُدرّبة على مجموعة بيانات ImageNet لتصنيف الصور عملية تجانس التسمية لتحقيق تعميم أفضل وتقليل التعميم المفرط.

معالجة اللغات الطبيعية (NLP)

في البرمجة اللغوية العصبية، يتم استخدام تجانس التسميات في مهام التسلسل إلى التسلسل مثل الترجمة الآلية. تستفيد النماذج اللغوية واسعة النطاق مثل BERT (تمثيلات التشفير ثنائية الاتجاه من المحولات) والنماذج القائمة على المحولات من تجانس التسميات أثناء التدريب لضمان استقرار التعلم وتجنب الثقة المفرطة في التنبؤات.

أمثلة من العالم الحقيقي

  1. السيارات ذاتية القيادة: في أنظمة المركبات ذاتية القيادة، يتم تطبيق تجانس التسمية على النماذج المدربة على تصنيف الصور ومهام اكتشاف الأجسام. على سبيل المثال، تستفيد مجموعات البيانات مثل COCO للكشف المتقدم عن الأجسام من هذه التقنية لتحسين متانة النماذج مثل Ultralytics YOLO ، والتي تُستخدم على نطاق واسع في الكشف عن الأجسام لأنظمة القيادة الذاتية.

  2. تشخيص الرعاية الصحية: في تطبيقات التصوير الطبي، مثل الكشف عن الأورام باستخدام مجموعة بيانات الكشف عن أورام الدماغ، يعزز تجانس التسمية موثوقية التنبؤات. فهو يقلل من مخاطر ثقة النموذج المفرطة في التصنيفات غير الصحيحة، وهو أمر بالغ الأهمية في المجالات عالية المخاطر مثل الرعاية الصحية.

تجانس التسمية مقابل تجانس التسمية المفاهيم ذات الصلة

  • الإفراط في التركيب: يعمل تجانس التسمية مباشرةً على مكافحة الإفراط في الملاءمة عن طريق تثبيط النموذج من الثقة المفرطة في بيانات التدريب. تعرّف على المزيد حول كيفية اكتشاف ومنع الإفراط في تركيب النماذج في صفحة مسرد مصطلحات الإفراط في التركيب.
  • التنظيم: على الرغم من أن تسوية التسمية هي شكل من أشكال التنظيم، إلا أنها تختلف عن تقنيات مثل تسوية التسمية L2 أو التسرب. تركز هذه الأساليب على معاقبة الأوزان أو تقليل الاعتماد على خلايا عصبية معينة، في حين أن تسوية التسمية تعدل التسميات المستهدفة نفسها. للتعمق أكثر في التنظيم، قم بزيارة صفحة مسرد مصطلحات التنظيم.
  • الخسارة عبر الانتروبيا المتقاطعة: تعدّل تسوية التسمية خسارة الانتروبيا المتقاطعة التقليدية عن طريق إدخال عامل تسوية في حساب دالة الخسارة. لمزيد من استكشاف دوال الخسارة، قم بزيارة صفحة مسرد دالة الخسارة.

تنفيذ تنعيم الملصقات باستخدام Ultralytics HUB

Ultralytics يوفر HUB تكاملاً سلسًا لتدريب نماذج التصنيف مع تجانس التسمية. سواءً كنت تعمل مع مجموعات بيانات مثل CIFAR-10 لتصنيف الصور أو مجموعات بيانات مخصصة، فإن Ultralytics HUB يبسط عملية إعداد المعلمات الفائقة، بما في ذلك عوامل تجانس التسمية، لتحسين أداء نموذجك.

استنتاج

تجانس التسمية هو تقنية بسيطة لكنها قوية تعزز متانة وموثوقية نماذج التعلم الآلي. فمن خلال تليين التسميات المستهدفة، تساعد النماذج على التعميم بشكل أفضل، وتجنب الإفراط في التعيين، وإنتاج تنبؤات جيدة المعايرة. سواءً كنت تعمل على تصنيف الصور أو معالجة اللغات الطبيعية أو اكتشاف الأشياء، فإن تنعيم التسميات هو أداة قيّمة في مجموعة أدوات التعلم الآلي الخاصة بك. لمزيد من الرؤى حول التقنيات والتطبيقات ذات الصلة، استكشف مسرد مصطلحات الذكاء الاصطناعي والرؤية الحاسوبية من خلال Ultralytics.

قراءة الكل