مسرد المصطلحات

تنعيم الملصق

عزز دقة نموذج الذكاء الاصطناعي ومتانته باستخدام تقنية تجانس التسميات - وهي تقنية مثبتة لتحسين التعميم وتقليل الثقة الزائدة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تجانس التسمية هو أسلوب تنظيمي يُستخدم في التعلّم الآلي، خاصةً في مهام التصنيف، لتحسين تعميم النموذج ومعايرته. تعمل هذه التقنية من خلال تعديل التسميات المستهدفة المستخدمة أثناء التدريب، وتخفيف التسميات المشفرة ذات التشفير الصلب من نقطة واحدة لتقليل الثقة المفرطة في التنبؤات وتشجيع النموذج على أن يكون أقل يقينًا بشأن تصنيفاته.

ما هو تنعيم الملصق؟

في مهام التصنيف التقليدية، غالبًا ما يتم تمثيل التسميات المستهدفة باستخدام ترميز أحادي. على سبيل المثال، إذا كانت الصورة تنتمي إلى فئة "قطة"، فإن التسمية ستكون [0, 1, 0, 0] لأربع فئات (كلب، قطة، طائر، طائر، سمكة)، مما يشير إلى الثقة الكاملة (1.0) في فئة "القطة" والثقة الصفرية (0.0) في جميع الفئات الأخرى. يغير تجانس التسمية هذا من خلال توزيع كمية صغيرة من كتلة الاحتمالات من الفئة الصحيحة إلى الفئات غير الصحيحة. بدلاً من هدف [0, 1, 0, 0]، قد يغيرها تنعيم التسمية إلى شيء مثل [0.01, 0.9, 0.03, 0.06]. يشير هذا الهدف المعدل إلى أنه على الرغم من أن الصورة هي بالفعل "قطة"، إلا أن هناك احتمالًا ضئيلًا أن تكون شيئًا آخر.

هذا التعديل الذي يبدو بسيطًا له تأثير كبير على كيفية تعلم النماذج. فمن خلال منع النموذج من أن يصبح واثقًا بشكل مفرط من فئة واحدة أثناء التدريب، تشجع عملية تنعيم التسمية على تعلم ميزات أكثر قوة وقابلة للتعميم. إنه يخبر النموذج بشكل أساسي أنه حتى بيانات التدريب قد تحتوي على بعض عدم اليقين أو الضوضاء، ويجب ألا تتناسب مع بيانات التدريب بشكل مثالي للغاية، مما قد يؤدي إلى الإفراط في التهيئة.

ما أهمية تنعيم الملصق؟

الفائدة الأساسية من تجانس التسمية هي تحسين تعميم النموذج. يمكن أن تصبح النماذج التي تم تدريبها باستخدام الترميز القياسي ذي التشفير الأحادي الثقة المفرطة في تنبؤاتها، خاصةً على بيانات التدريب. يمكن أن تؤدي هذه الثقة المفرطة إلى ضعف الأداء على البيانات غير المرئية لأن النموذج لم يتعلم التعامل مع عدم اليقين أو الاختلافات الطفيفة في المدخلات.

تعمل تسوية التسمية كشكل من أشكال التنظيم من خلال معاقبة التنبؤات المفرطة الثقة. فهو يشجع النموذج على أن يكون أقل تمييزًا وأكثر معايرةً، مما يعني أن احتمالاته المتوقعة تعكس بشكل أكبر الاحتمالية الفعلية لصحة الفئة. غالبًا ما يؤدي ذلك إلى دقة وموثوقية أفضل، خاصةً في تطبيقات العالم الحقيقي حيث تكون البيانات غالبًا ما تكون صاخبة وأقل كمالاً من مجموعات بيانات التدريب.

علاوةً على ذلك، يمكن أن يساعد تجانس التسميات في منع النماذج من حفظ بيانات التدريب وتعلم تمثيلات أكثر وضوحًا بدلاً من ذلك. كما أنه يجعل عملية التدريب أكثر استقرارًا وأقل حساسية للتسميات الصاخبة في مجموعة البيانات.

تطبيقات تنعيم الملصقات

تم تطبيق تجانس التسمية بنجاح في مجالات مختلفة في الذكاء الاصطناعي والتعلم الآلي. فيما يلي بعض الأمثلة:

  1. تصنيف الصور: في تصنيف الصور باستخدام نماذج Ultralytics YOLO ، يمكن استخدام تجانس التسمية لتحسين متانة المصنف. على سبيل المثال، عند تدريب نموذج على ImageNet، يمكن أن يؤدي تطبيق تجانس التسمية إلى زيادة صغيرة ولكن كبيرة في دقة التحقق من الصحة. هذا مفيد بشكل خاص في سيناريوهات مثل تحليل الصور الطبية حيث تكون تقديرات الاحتمالات الدقيقة والمعايرة بشكل جيد أمرًا بالغ الأهمية للتشخيص.

  2. معالجة اللغات الطبيعية (NLP): يُعد تجانس التسمية مفيدًا أيضًا في مهام معالجة اللغات الطبيعية، مثل الترجمة الآلية ونمذجة اللغة. على سبيل المثال، في تدريب النماذج اللغوية الكبيرة مثل GPT-3 أو GPT-4، يمكن أن يعزز تجانس التسمية قدرة النموذج على التعميم على الجمل والسياقات الجديدة. ويمكنه أيضًا تحسين طلاقة وتماسك النص الذي تم إنشاؤه من خلال عدم تشجيع النموذج على أن يكون حتميًا بشكل مفرط في تنبؤاته للكلمات. يمكن لتقنيات مثل الهندسة الفورية الاستفادة بشكل أكبر من المعايرة المحسّنة الناتجة عن تجانس التسمية لإنتاج مخرجات نصية أكثر موثوقية ومراعاة للسياق.

من خلال دمج تجانس التسميات في عملية التدريب، يمكن للمطورين بناء نماذج ذكاء اصطناعي أكثر موثوقية وقوة تؤدي بشكل أفضل في سيناريوهات العالم الحقيقي، خاصةً عند استخدام نماذج قوية مثل Ultralytics YOLOv8 لمهام الرؤية.

قراءة الكل