مسرد المصطلحات

التعلّم شبه الخاضع للإشراف

اكتشف كيف يجمع التعلُّم شبه الخاضع للإشراف بين البيانات المُسمَّاة وغير المُسمَّاة لتحسين نماذج الذكاء الاصطناعي وتقليل تكاليف التسمية وتعزيز الدقة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التعلُّم شبه الخاضع للإشراف هو فرع من فروع التعلُّم الآلي الذي يسد الفجوة بين التعلُّم الخاضع للإشراف والتعلُّم غير الخاضع للإشراف. وهو يستفيد من البيانات المصنفة وغير المصنفة لتدريب النماذج. في العديد من سيناريوهات العالم الحقيقي، قد يكون الحصول على البيانات المصنفة مكلفًا ويستغرق وقتًا طويلاً، مما يتطلب شرحًا يدويًا من قبل الخبراء. من ناحية أخرى، غالبًا ما تكون البيانات غير الموسومة متاحة بسهولة وبكميات كبيرة. تستفيد تقنيات التعلم شبه الخاضع للإشراف من هذه الوفرة من البيانات غير الموسومة لتحسين أداء النماذج، خاصةً عندما تكون البيانات الموسومة نادرة.

كيف يعمل التعلّم شبه الخاضع للإشراف

على عكس التعلّم تحت الإشراف، الذي يعتمد كليًا على البيانات المصنفة والتعلم غير الخاضع للإشراف، الذي يستخدم بيانات غير مصنفة فقط، يجمع التعلم شبه الخاضع للإشراف بين الاثنين معًا. وتكمن الفكرة الأساسية في أن البيانات غير الموسومة تحتوي على معلومات قيّمة حول البنية الأساسية لتوزيع البيانات. ومن خلال دمج هذه المعلومات، يمكن لنماذج التعلّم شبه الخاضع للإشراف أن تحقق دقة وتعميمًا أفضل من النماذج التي يتم تدريبها فقط على بيانات موسومة محدودة.

تندرج العديد من التقنيات تحت مظلة التعلم شبه الخاضع للإشراف، بما في ذلك:

  • التسمية الزائفة: تتضمن هذه الطريقة تدريب نموذج على بيانات موسومة ثم استخدامه لتوقع تسميات للبيانات غير الموسومة. يتم بعد ذلك التعامل مع هذه التسميات المتوقعة أو "التسميات الزائفة" كما لو كانت تسميات حقيقية واستخدامها لإعادة تدريب النموذج، وغالبًا ما يتم ذلك بشكل متكرر.
  • تنظيم الاتساق: يشجّع هذا النهج النموذج على إنتاج تنبؤات مماثلة لنقاط البيانات غير المسماة حتى عندما تكون مضطربة أو معززة قليلاً. غالبًا ما تُستخدم تقنيات مثل زيادة البيانات لإنشاء هذه الاضطرابات.
  • الطرق القائمة على الرسم البياني: تمثل هذه الطرق نقاط البيانات كعقد في رسم بياني، حيث تربط الحواف بين النقاط المتشابهة. ثم تُنشر التسميات من العُقد المسمّاة إلى العُقد غير المسمّاة بناءً على بنية الرسم البياني.
  • التدريب الذاتي: على غرار التسمية الزائفة، يعمل التدريب الذاتي على توسيع مجموعة البيانات المسمّاة بشكل متكرر عن طريق إضافة تنبؤات عالية الثقة على البيانات غير المسمّاة.

تطبيقات التعلم شبه الخاضع للإشراف

يُعتبر التعلّم شبه الخاضع للإشراف ذا قيمة في مختلف المجالات، خاصةً عندما تكون البيانات المصنفة محدودة:

  • تحليل الصور الطبية: في تحليل الصور الطبية، غالبًا ما يتطلب الحصول على صور طبية مصنفة لمهام مثل الكشف عن الأورام أو تصنيف الأمراض وجود خبراء أشعة خبراء في هذا المجال، مما يجعلها مكلفة وتستغرق وقتًا طويلاً. يمكن أن يساعد التعلّم شبه الخاضع للإشراف في تدريب نماذج دقيقة باستخدام مجموعة أصغر من الصور المصنفة إلى جانب مجموعة أكبر من عمليات المسح غير المصنفة. على سبيل المثال، في الكشف عن أورام الدماغ باستخدام Ultralytics YOLO للكشف عن الأجسام، يمكن للتقنيات شبه الخاضعة للإشراف أن تعزز أداء النموذج باستخدام بيانات التصوير بالرنين المغناطيسي المحدودة ذات التسمية.
  • معالجة اللغات الطبيعية (NLP): غالبًا ما تستفيد مهام مثل تحليل المشاعر أو التعرف على الكيانات المسماة (NER) من التعلم شبه الخاضع للإشراف. وتتوفر كميات كبيرة من البيانات النصية بسهولة، ولكن تصنيف النصوص لمهام محددة في مجال معالجة اللغات الطبيعية قد يكون شاقًا. يمكن أن تستفيد الأساليب شبه الخاضعة للإشراف من النص غير المُسمّى لتحسين فهم النموذج للفروق اللغوية والسياق.
  • التعرّف على الكلام: على غرار البرمجة اللغوية العصبية، يمكن أن تستفيد أنظمة التعرف على الكلام من كميات هائلة من البيانات الصوتية غير الموسومة. يساعد التعلم شبه الخاضع للإشراف في بناء نماذج قوية تعمم بشكل جيد حتى مع وجود بيانات كلام موسومة محدودة.
  • تصنيف الصور واكتشاف الأجسام: في مهام الرؤية الحاسوبية مثل تصنيف الصور واكتشاف الأجسام، يمكن استخدام التعلم شبه الخاضع للإشراف لتحسين أداء النماذج مثل Ultralytics YOLOv8 عند تدريبها على مجموعات بيانات حيث يتم شرح جزء بسيط فقط من الصور بمربعات أو تسميات محددة. Ultralytics يمكن استخدام HUB لإدارة مجموعات البيانات وتدريب النماذج، ويمكن دمج التعلّم شبه الخاضع للإشراف لتحسين التدريب باستخدام بيانات محدودة ذات تسميات.

مزايا التعلّم شبه الخاضع للإشراف

  • تحسين الدقة: من خلال استخدام البيانات غير المُسمّاة، غالبًا ما يؤدي التعلّم شبه الخاضع للإشراف إلى نماذج ذات دقة أعلى مقارنةً بالتعلّم الخاضع للإشراف مع بيانات مُسمّاة محدودة.
  • انخفاض تكاليف وضع الملصقات: يقلل بشكل كبير من الحاجة إلى وضع العلامات اليدوية المكثفة للبيانات، مما يوفر الوقت والموارد.
  • تعميم أفضل: يمكن أن يساعد التدريب باستخدام كل من البيانات المصنفة وغير المصنفة النماذج على تعلم تمثيلات أكثر قوة وقابلية للتعميم، مما يؤدي إلى أداء أفضل على البيانات غير المرئية.

يوفر التعلم شبه الخاضع للإشراف نهجاً قوياً للتعلم الآلي، خاصةً في السيناريوهات التي تكون فيها البيانات الموسومة عنق الزجاجة. ومن خلال الاستفادة الفعّالة من ثروة البيانات غير الموسومة المتاحة، فإنه يتيح تطوير أنظمة ذكاء اصطناعي أكثر دقة وكفاءة عبر مجموعة واسعة من التطبيقات.

قراءة الكل