مسرد المصطلحات

التعلّم النشط

اكتشف التعلُّم النشط، وهو طريقة تعلُّم آلي فعّالة من حيث التكلفة تعزز الدقة بعدد أقل من التسميات. تعرّف على كيفية تحويل تدريب الذكاء الاصطناعي!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التعلم النشط هو مجال فرعي متخصص ضمن التعلم الآلي (ML) حيث يتم تمكين خوارزمية التعلم من الاستعلام التفاعلي من مستخدم، وغالبًا ما يشار إليه باسم "أوراكل" أو المُعلِّق البشري، لطلب تسميات لنقاط البيانات الجديدة. على عكس التعلّم التقليدي الخاضع للإشراف الذي يعتمد على مجموعة بيانات كبيرة مُسمّاة مسبقًا، يهدف التعلّم النشط إلى تحقيق أداء عالٍ للنموذج بأقل جهد ممكن في وضع العلامات من خلال الاختيار الاستراتيجي لأكثر الحالات غير المُسمّاة إفادةً من أجل التعليق التوضيحي. يعتبر هذا النهج ذا قيمة خاصة في المجالات التي يكون فيها الحصول على البيانات المصنفة مكلفًا أو يستغرق وقتًا طويلاً أو يتطلب معرفة متخصصة.

كيف يعمل التعلّم النشط

تتبع عملية التعلم النشط عادةً دورة تكرارية:

  1. التدريب الأولي: نموذج، مثل Ultralytics YOLOلاكتشاف الأجسام، يتم تدريبه على مجموعة بيانات صغيرة موسومة مبدئيًا.
  2. الاستعلام: يحلل النموذج المُدرَّب حاليًا مجموعة من البيانات غير المُسمَّاة ويستخدم استراتيجية استعلام محددة لاختيار نقاط البيانات التي يعتبرها الأكثر إفادة أو غير مؤكدة.
  3. الشرح: يتم تقديم نقاط البيانات المختارة هذه إلى شارح بشري (أوراكل) لوضع العلامات. تعتبر ممارسات جمع البيانات والتعليقات التوضيحية الفعالة أمرًا بالغ الأهمية هنا.
  4. إعادة التدريب: تتم إضافة المثيلات المصنفة حديثًا إلى مجموعة التدريب.
  5. التكرار: يُعاد تدريب النموذج باستخدام مجموعة البيانات الموسّعة الموسّعة الموسومة وتتكرر الدورة (الخطوات 2-5) حتى يتم استيفاء معيار التوقف، مثل الوصول إلى مستوى الدقة المطلوب أو استنفاد ميزانية التسمية أو ملاحظة تناقص العائدات في تحسين الأداء.

استراتيجيات الاستعلام

يكمن جوهر التعلّم النشط في استراتيجية الاستعلام، وهي الطريقة المستخدمة لتحديد نقاط البيانات غير المسمّاة التي سيتم الاستعلام عنها بعد ذلك. تتضمن الاستراتيجيات الشائعة ما يلي:

  • أخذ عينات عدم اليقين: اختيار الحالات التي يكون فيها النموذج أقل ثقة في تنبؤاته. ربما تكون هذه هي الاستراتيجية الأكثر شيوعًا. يمكن العثور على مزيد من التفاصيل في الدراسات الاستقصائية الأكاديمية مثل هذه الدراسة التي أعدها بور سيتليس.
  • الاستعلام حسب اللجنة (QBC): تدريب نماذج متعددة (لجنة) واختيار الحالات التي يختلف فيها أعضاء اللجنة أكثر من غيرها على التنبؤ.
  • تغيير النموذج المتوقع: اختيار الحالات التي من شأنها أن تسبب أكبر تغيير في معلمات النموذج إذا كانت تسمياتها معروفة.

الملاءمة والفوائد

يقلل التعلّم النشط بشكل كبير من عبء وضع العلامات على البيانات، والذي غالبًا ما يكون عنق الزجاجة الرئيسي في تطوير نماذج التعلم الآلي. ومن خلال تركيز جهود التعليق التوضيحي على نقاط البيانات الأكثر تأثيرًا، فإنه يسمح للفرق بما يلي:

  • تحقيق أداء نموذج مماثل أو حتى أفضل مع عدد أقل بكثير من التسميات.
  • تقليل التكاليف المرتبطة بشرح الخبراء.
  • تسريع دورة حياة تطوير النموذج.
  • بناء نماذج أكثر قوة من خلال التركيز على الأمثلة الصعبة أو الغامضة.

التطبيقات الواقعية

يجد التعلم النشط تطبيقات في مختلف المجالات:

  1. تحليل الصور الطبية: في مهام مثل الكشف عن الأورام في التصوير الطبي، يمكن لنظام التعلم النشط أن يقدم لأخصائيي الأشعة أكثر صور الأشعة السينية أو التصوير بالرنين المغناطيسي غموضاً، مما يزيد من قيمة وقت الخبراء ويسرع من تطوير الذكاء الاصطناعي التشخيصي. وهذا أمر بالغ الأهمية لتحسين حلول الذكاء الاصطناعي في مجال الرعاية الصحية.
  2. معالجة اللغة الطبيعية (NLP): بالنسبة لمهام مثل تحليل المشاعر أو التعرف على الكيانات المسماة، يمكن للتعلم النشط اختيار مقتطفات نصية غير مؤكدة (على سبيل المثال، منشورات وسائل التواصل الاجتماعي ومراجعات العملاء) للمراجعة البشرية، مما يحسن أداء النموذج بسرعة مع تقليل التسمية اليدوية مقارنةً بأخذ عينات عشوائية من البيانات.

التعلّم النشط مقابل المفاهيم ذات الصلة

  • التعلّم تحت الإشراف: يعتمد كليًا على مجموعة بيانات موجودة مسبقًا وموسومة بالكامل. لا يختار البيانات بشكل تفاعلي لوضع العلامات أثناء التدريب.
  • التعلّم شبه الخاضع للإشراف: يستخدم أيضًا البيانات الموسومة وغير الموسومة على حد سواء، ولكنه عادةً ما يستفيد من البيانات غير الموسومة تلقائيًا استنادًا إلى افتراضات حول بنية البيانات (على سبيل المثال، التجميع، والافتراضات المتعددة)، بدلاً من الاستعلام النشط عن تسميات محددة. راجع مدخل المسرد الخاص بنا حول التعلم شبه الخاضع للإشراف لمزيد من التفاصيل.
  • التعلم المعزز: يتعلم من خلال تفاعلات التجربة والخطأ مع البيئة، وتلقي المكافآت أو العقوبات. يركز على تعلم الإجراءات المثلى، وليس على وضع العلامات الفعالة للبيانات مثل التعلم النشط. استكشف التعلم المعزز بشكل أكبر في مسرد المصطلحات الخاص بنا.

الأدوات والتنفيذ

غالبًا ما يتضمن تطبيق التعلّم النشط دمج نماذج التعلّم الآلي مع أدوات التعليق التوضيحي وإدارة سير عمل البيانات. منصات مثل DagsHub أدوات لبناء خطوط أنابيب التعلّم النشط، كما نوقش في حديثهم عن YOLO VISION 2023. يمكن دمج برامج التعليقات التوضيحية مثل Label Studio في خطوط الأنابيب هذه. تعد إدارة مجموعات البيانات والنماذج المدربة بفعالية أمرًا بالغ الأهمية، وتوفر منصات مثل Ultralytics HUB بنية تحتية لتنظيم مجموعات البيانات والنماذج طوال دورة التطوير.

قراءة الكل