مسرد المصطلحات

التعلّم شبه الخاضع للإشراف

اكتشف كيف يجمع التعلُّم شبه الخاضع للإشراف بين البيانات المُسمَّاة وغير المُسمَّاة لتحسين نماذج الذكاء الاصطناعي وتقليل تكاليف التسمية وتعزيز الدقة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

يمثّل التعلّم شبه الخاضع للإشراف (SSL) حلًا وسطًا قويًا في التعلّم الآلي (ML)، حيث يجمع بين كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة أثناء التدريب. يعتبر هذا النهج ذا قيمة خاصة في السيناريوهات التي يكون فيها الحصول على البيانات الموسومة مكلفًا أو مستهلكًا للوقت أو غير عملي، ولكن البيانات غير الموسومة وفيرة. تهدف تقنية SSL إلى الاستفادة من البنية الأساسية في البيانات غير الموسومة لتحسين أداء النموذج بما يتجاوز ما يمكن تحقيقه باستخدام البيانات الموسومة المحدودة فقط، مما يجعلها تقنية عملية للعديد من مشاكل الذكاء الاصطناعي في العالم الحقيقي.

كيف يعمل التعلّم شبه الخاضع للإشراف

تعمل خوارزميات SSL من خلال وضع افتراضات معينة حول العلاقة بين البيانات المصنفة وغير المصنفة. تشمل الافتراضات الشائعة "افتراض السلاسة" (من المرجح أن تتشارك النقاط القريبة من بعضها البعض في التسمية) أو "افتراض التسمية العنقودية" (تميل البيانات إلى تشكيل مجموعات متميزة، ومن المرجح أن تتشارك النقاط داخل نفس المجموعة في التسمية). غالبًا ما تتضمن التقنيات تدريب نموذج أولي على البيانات المصنفة ثم استخدامه لتوليد تسميات زائفة للبيانات غير المصنفة بناءً على تنبؤات عالية الثقة. يتم بعد ذلك إعادة تدريب النموذج على كل من البيانات المصنفة الأصلية والبيانات المصنفة الزائفة الجديدة. هناك طريقة أخرى تتمثل في تنظيم الاتساق، حيث يتم تشجيع النموذج على إنتاج نفس المخرجات لمثال غير مُسمّى حتى لو كانت مدخلاته مضطربة قليلاً، وغالبًا ما يتم تحقيق ذلك من خلال زيادة البيانات. تسمح هذه الأساليب للنموذج بالتعلم من الأنماط والتوزيع المتأصل في مجموعة كبيرة من العينات غير المُعلمة. يتم استكشاف المزيد من التقنيات المتقدمة في مصادر مثل منشورات مدونةGoogle للذكاء الاصطناعي على SSL.

المقارنة مع نماذج التعلم الأخرى

يحتل التعلّم شبه الخاضع للإشراف مساحة فريدة بين أنواع التعلّم الأساسية الأخرى:

  • التعلّم تحت الإشراف: يعتمد بالكامل على بيانات التدريب المصنفة. يختلف التعلّم الخاضع للإشراف من خلال دمج البيانات غير الموسومة لتحسين الأداء عندما تكون البيانات الموسومة نادرة.
  • التعلّم غير الخاضع للإشراف: يستخدم فقط البيانات غير الموسومة للعثور على أنماط أو هياكل، مثل التجميع أو تقليل الأبعاد. يستخدم التعلّم غير الخاضع للإشراف: يستخدم بيانات غير معلمة ولكنه يوجه عملية التعلّم بمجموعة صغيرة من الأمثلة المسمّاة لأداء مهام مثل التصنيف أو الانحدار.
  • التعلم الخاضع للإشراف الذاتي (SSL): نوع من التعلّم غير الخاضع للإشراف حيث يتم إنشاء التسميات تلقائيًا من بيانات الإدخال نفسها (على سبيل المثال، التنبؤ بجزء مقنّع من الصورة). وعلى الرغم من أنه يستخدم بيانات غير معنونة، إلا أن آليته لتوليد الإشراف تختلف عن الأساليب شبه الخاضعة للإشراف النموذجية التي تجمع بشكل صريح بين البيانات المعلمة مسبقًا والبيانات غير المعلمة.

التطبيقات الواقعية

تعتبر SSL فعالة للغاية في المجالات التي يكون فيها وضع العلامات عنق الزجاجة:

  1. تصنيف صفحات الويب: من الممكن تصنيف عدد قليل من المواقع الإلكترونية يدويًا (مثل "الرياضة" و"الأخبار" و"التكنولوجيا")، ولكن من غير العملي تصنيف المليارات من المواقع الإلكترونية. يمكن لـ SSL استخدام العدد الهائل من المواقع الإلكترونية غير المصنفة لتحسين دقة المصنف وقوته، والتعلم من محتوى النص وبنية الروابط(نظرة عامة على التنقيب عن محتوى الويب).
  2. التعرّف على الكلام: يتطلب تفريغ الصوت جهدًا بشريًا كبيرًا. تسمح تقنية SSL للأنظمة بالتدريب على كمية صغيرة من الصوت المكتوب إلى جانب كميات كبيرة من البيانات الصوتية غير المكتوبة، مما يحسن من التعرف على اللهجات وأنماط التحدث المتنوعة(أبحاث معالجة الكلام).
  3. تحليل الصور الطبية: يُعدّ الشرح التوضيحي للصور الطبية (مثل التصوير بالرنين المغناطيسي أو الأشعة المقطعية للكشف عن الأورام) مكلفاً ويتطلب معرفة متخصصة. يمكن لـ SSL الاستفادة من العديد من عمليات المسح غير الموسومة لتعزيز أداء النماذج التشخيصية المدربة على مجموعة محدودة من الصور المشروحة، مما قد يؤدي إلى حلول أفضل للذكاء الاصطناعي في مجال الرعاية الصحية.
  4. اكتشاف الأجسام في الرؤية الحاسوبية (CV): يتطلب إنشاء مربعات حدية دقيقة للأجسام في آلاف الصور عمالة كثيفة(دليل جمع البيانات والتعليقات التوضيحية). يمكن لتقنيات SSL الاستفادة من الصور أو إطارات الفيديو الوفيرة غير المسماة إلى جانب مجموعة بيانات أصغر موسومة لتحسين أداء الكاشف لنماذج مثل Ultralytics YOLO.

المزايا والتحديات

وتتمثل الميزة الأساسية لنموذج SSL في قدرته على تقليل الاعتماد على مجموعات البيانات الكبيرة الموسومة، مما يوفر الوقت والموارد المرتبطة بتوسيم البيانات. وغالبًا ما يؤدي ذلك إلى تعميم أفضل للنماذج مقارنةً بالنماذج الخاضعة للإشراف البحت والمدربة على بيانات محدودة من خلال استغلال المعلومات من العينات غير الموسومة. ومع ذلك، يعتمد نجاح SSL بشكل كبير على صحة الافتراضات الأساسية حول البيانات. إذا لم تكن هذه الافتراضات صحيحة (على سبيل المثال، إذا كان توزيع البيانات غير الموسومة مختلفًا تمامًا عن البيانات الموسومة)، فقد تؤدي أساليب SSL إلى تدهور الأداء. يعد الاختيار والتنفيذ الدقيق لتقنيات SSL أمرًا بالغ الأهمية، وغالبًا ما يتطلب خبرة في ممارسات MLOPS.

الأدوات والتدريب

العديد من أطر التعلم العميق الحديثة (DL) ، بما في ذلك PyTorchPyTorch موقعPyTorch الرسمي) و TensorFlowTensorFlow )، توفر وظائف أو يمكن تكييفها لتنفيذ خوارزميات SSL. توفر مكتبات مثل Scikit-learn بعض أساليب SSL. تعمل منصات مثل Ultralytics HUB على تبسيط العملية من خلال تسهيل إدارة مجموعات البياناتUltralytics وثائق مجموعات بياناتUltralytics HUB Datasets) التي قد تحتوي على مزيج من البيانات الموسومة وغير الموسومة، وتبسيط التدريبUltralytics HUB Cloud Training) والنشر(دليل خيارات نشر النماذج) للنماذج المصممة للاستفادة من هياكل البيانات هذه. يستمر تطور البحث في SSL، مع تقديم المساهمات في كثير من الأحيان في مؤتمرات الذكاء الاصطناعي الكبرى مثل NeurIPS والمؤتمر الدولي للذكاء الاصطناعي.

قراءة الكل