اكتشف كيف يجمع التعلُّم شبه الخاضع للإشراف بين البيانات المُسمَّاة وغير المُسمَّاة لتحسين نماذج الذكاء الاصطناعي وتقليل تكاليف التسمية وتعزيز الدقة.
يمثّل التعلّم شبه الخاضع للإشراف (SSL) حلًا وسطًا قويًا في التعلّم الآلي (ML)، حيث يجمع بين كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة أثناء التدريب. يعتبر هذا النهج ذا قيمة خاصة في السيناريوهات التي يكون فيها الحصول على البيانات الموسومة مكلفًا أو مستهلكًا للوقت أو غير عملي، ولكن البيانات غير الموسومة وفيرة. تهدف تقنية SSL إلى الاستفادة من البنية الأساسية في البيانات غير الموسومة لتحسين أداء النموذج بما يتجاوز ما يمكن تحقيقه باستخدام البيانات الموسومة المحدودة فقط، مما يجعلها تقنية عملية للعديد من مشاكل الذكاء الاصطناعي في العالم الحقيقي.
تعمل خوارزميات SSL من خلال وضع افتراضات معينة حول العلاقة بين البيانات المصنفة وغير المصنفة. تشمل الافتراضات الشائعة "افتراض السلاسة" (من المرجح أن تتشارك النقاط القريبة من بعضها البعض في التسمية) أو "افتراض التسمية العنقودية" (تميل البيانات إلى تشكيل مجموعات متميزة، ومن المرجح أن تتشارك النقاط داخل نفس المجموعة في التسمية). غالبًا ما تتضمن التقنيات تدريب نموذج أولي على البيانات المصنفة ثم استخدامه لتوليد تسميات زائفة للبيانات غير المصنفة بناءً على تنبؤات عالية الثقة. يتم بعد ذلك إعادة تدريب النموذج على كل من البيانات المصنفة الأصلية والبيانات المصنفة الزائفة الجديدة. هناك طريقة أخرى تتمثل في تنظيم الاتساق، حيث يتم تشجيع النموذج على إنتاج نفس المخرجات لمثال غير مُسمّى حتى لو كانت مدخلاته مضطربة قليلاً، وغالبًا ما يتم تحقيق ذلك من خلال زيادة البيانات. تسمح هذه الأساليب للنموذج بالتعلم من الأنماط والتوزيع المتأصل في مجموعة كبيرة من العينات غير المُعلمة. يتم استكشاف المزيد من التقنيات المتقدمة في مصادر مثل منشورات مدونةGoogle للذكاء الاصطناعي على SSL.
يحتل التعلّم شبه الخاضع للإشراف مساحة فريدة بين أنواع التعلّم الأساسية الأخرى:
تعتبر SSL فعالة للغاية في المجالات التي يكون فيها وضع العلامات عنق الزجاجة:
وتتمثل الميزة الأساسية لنموذج SSL في قدرته على تقليل الاعتماد على مجموعات البيانات الكبيرة الموسومة، مما يوفر الوقت والموارد المرتبطة بتوسيم البيانات. وغالبًا ما يؤدي ذلك إلى تعميم أفضل للنماذج مقارنةً بالنماذج الخاضعة للإشراف البحت والمدربة على بيانات محدودة من خلال استغلال المعلومات من العينات غير الموسومة. ومع ذلك، يعتمد نجاح SSL بشكل كبير على صحة الافتراضات الأساسية حول البيانات. إذا لم تكن هذه الافتراضات صحيحة (على سبيل المثال، إذا كان توزيع البيانات غير الموسومة مختلفًا تمامًا عن البيانات الموسومة)، فقد تؤدي أساليب SSL إلى تدهور الأداء. يعد الاختيار والتنفيذ الدقيق لتقنيات SSL أمرًا بالغ الأهمية، وغالبًا ما يتطلب خبرة في ممارسات MLOPS.
العديد من أطر التعلم العميق الحديثة (DL) ، بما في ذلك PyTorchPyTorch موقعPyTorch الرسمي) و TensorFlowTensorFlow )، توفر وظائف أو يمكن تكييفها لتنفيذ خوارزميات SSL. توفر مكتبات مثل Scikit-learn بعض أساليب SSL. تعمل منصات مثل Ultralytics HUB على تبسيط العملية من خلال تسهيل إدارة مجموعات البياناتUltralytics وثائق مجموعات بياناتUltralytics HUB Datasets) التي قد تحتوي على مزيج من البيانات الموسومة وغير الموسومة، وتبسيط التدريبUltralytics HUB Cloud Training) والنشر(دليل خيارات نشر النماذج) للنماذج المصممة للاستفادة من هياكل البيانات هذه. يستمر تطور البحث في SSL، مع تقديم المساهمات في كثير من الأحيان في مؤتمرات الذكاء الاصطناعي الكبرى مثل NeurIPS والمؤتمر الدولي للذكاء الاصطناعي.