اكتشف كيف يجمع التعلُّم شبه الخاضع للإشراف بين البيانات المُسمَّاة وغير المُسمَّاة لتحسين نماذج الذكاء الاصطناعي وتقليل تكاليف التسمية وتعزيز الدقة.
التعلّم شبه الخاضع للإشراف (SSL) هو تقنية تعلّم آلي (ML) تعمل على سد الفجوة بين التعلّم الخاضع للإشراف والتعلّم غير الخاضع للإشراف. وهو يستفيد من كمية صغيرة من البيانات المصنفة إلى جانب كمية كبيرة من البيانات غير المصنفة لتحسين دقة التعلم. في العديد من سيناريوهات العالم الحقيقي، يكون الحصول على البيانات غير الموسومة غير مكلف، ولكن عملية تصنيف البيانات مكلفة وتستغرق وقتًا طويلاً. تعالج تقنية SSL هذا التحدي من خلال السماح للنماذج بالتعلم من مجموعة كبيرة من الأمثلة غير الموسومة، مسترشدةً بالهيكل والمعلومات التي توفرها المجموعة الأصغر الموسومة. هذا النهج قوي بشكل خاص في التعلم العميق (DL)، حيث تتطلب النماذج مجموعات بيانات هائلة لتحقيق أداء عالٍ.
تتمثل الفكرة الأساسية وراء SSL في استخدام البيانات المصنفة لبناء نموذج أولي، ثم استخدام هذا النموذج لإجراء تنبؤات على البيانات غير المصنفة. يتم بعد ذلك التعامل مع تنبؤات النموذج الأكثر ثقة على أنها "تسميات زائفة" وإضافتها إلى مجموعة التدريب. يتم بعد ذلك إعادة تدريب النموذج على هذه المجموعة من التسميات الأصلية والتسميات الزائفة ذات الثقة العالية. تسمح هذه العملية التكرارية للنموذج بتعلّم البنية الأساسية لمجموعة البيانات بأكملها، وليس فقط الجزء الصغير المُسمّى.
تتضمن تقنيات SSL الشائعة ما يلي:
تعتبر SSL فعالة للغاية في المجالات التي يكون فيها وضع العلامات عنق الزجاجة. ومن الأمثلة البارزة على ذلك:
من المهم التمييز بين SSL ومفاهيم الذكاء الاصطناعي (AI) ذات الصلة:
تقدم العديد من أطر عمل التعلم العميق الحديثة، بما في ذلك PyTorch(الموقع الرسمي PyTorch) و TensorFlow(الموقع الرسمي TensorFlow)، وظائف أو يمكن تكييفها لتنفيذ خوارزميات SSL. توفر مكتبات مثل Scikit-learn بعض أساليب SSL. تعمل منصات مثل Ultralytics HUB على تبسيط العملية من خلال تسهيل إدارة مجموعات البيانات التي قد تحتوي على مزيج من البيانات الموسومة وغير الموسومة، مما يبسط تدريب ونشر النماذج المصممة للاستفادة من هياكل البيانات هذه. يستمر تطور البحث في SSL، وغالبًا ما يتم تقديم المساهمات في مؤتمرات الذكاء الاصطناعي الكبرى مثل NeurIPS والمؤتمر الدولي للذكاء الاصطناعي.