اكتشف كيف يجمع التعلُّم شبه الخاضع للإشراف بين البيانات المُسمَّاة وغير المُسمَّاة لتحسين نماذج الذكاء الاصطناعي وتقليل تكاليف التسمية وتعزيز الدقة.
التعلُّم شبه الخاضع للإشراف (SSL) هو نوع من تقنيات التعلُّم الآلي (ML) التي تقع بين التعلُّم الخاضع للإشراف والتعلُّم غير الخاضع للإشراف. وهي تستخدم مزيجًا من كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة لتدريب النماذج. الدافع الأساسي وراء تقنية SSL هو التكلفة العالية والجهد المرتفع المرتبطين غالبًا بتسمية البيانات، خاصة في المجالات المعقدة. ومن خلال الاستفادة من البيانات غير المسمّاة المتاحة بسهولة، تهدف SSL إلى تحسين أداء النموذج وتعميمه بما يتجاوز ما يمكن تحقيقه باستخدام البيانات المسمّاة المحدودة فقط.
يتمثل المبدأ الأساسي للتعلّم شبه الخاضع للإشراف في أن البيانات غير المُسمّاة تحتوي على معلومات قيّمة حول البنية الأساسية للبيانات وتوزيعها على الرغم من افتقارها إلى تسميات واضحة. تحاول خوارزميات التعلّم شبه الخاضع للإشراف استغلال هذه البنية لتعزيز عملية التعلّم. وغالبًا ما تتضمن الأساليب الشائعة وضع افتراضات حول البيانات، مثل "افتراض المجموعة" (من المرجح أن يكون للنقاط في نفس المجموعة نفس التسمية) أو "افتراض المتشعب" (تقع نقاط البيانات على متشعب منخفض الأبعاد).
تتضمن التقنيات المستخدمة في SSL طرقًا مثل التسمية الزائفة، حيث يتم استخدام نموذج مدرّب على البيانات الأولية المصنفة للتنبؤ بالتسميات للبيانات غير المصنفة. ثم يتم التعامل مع التنبؤات ذات الثقة العالية على أنها "تسميات زائفة" وإضافتها إلى مجموعة التدريب. هناك طريقة أخرى تتضمن تنظيم الاتساق، والتي تشجع النموذج على إنتاج مخرجات مماثلة للنسخ المضطربة من نفس المدخلات غير المعنونة، وغالبًا ما يتم تحقيق ذلك من خلال تقنيات مثل زيادة البيانات. تساعد هذه الأساليب النموذج على تعلم ميزات أكثر قوة من خلال الاستفادة من مجموعة البيانات الضخمة غير المُسمّاة. يمكنك العثور على نظرة عامة جيدة عن SSL على نحو علم البيانات.
يعتبر التعلّم شبه الخاضع للإشراف مفيدًا بشكل خاص في السيناريوهات التي يكون فيها الحصول على البيانات المصنفة عنق الزجاجة. تتضمن بعض مجالات التطبيق الرئيسية ما يلي:
من المهم التفريق بين التعلم شبه الخاضع للإشراف ونماذج التعلم الآلي ذات الصلة:
يوفر التعلّم شبه الخاضع للإشراف نهجًا عمليًا وقويًا لبناء أنظمة ذكاء اصطناعي فعالة، خاصةً في مهام الرؤية الحاسوبية مثل اكتشاف الأجسام حيث تتوافر الصور أو مقاطع الفيديو غير الموسومة بكثرة. تعمل منصات مثل Ultralytics HUB على تسهيل إدارة مجموعات البيانات التي قد تتضمن مزيجًا من البيانات الموسومة وغير الموسومة لنماذج التدريب مثل Ultralytics YOLO. يمكن أن يكون استكشاف تقنيات SSL أمرًا حاسمًا للمشاريع التي تواجه قيودًا في توافر البيانات الموسومة، كما هو موضح في موارد مثل منشورات مدونةGoogle للذكاء الاصطناعي حول SSL.