التعلّم النشط
اكتشف التعلُّم النشط، وهو طريقة تعلُّم آلي فعّالة من حيث التكلفة تعزز الدقة بعدد أقل من التسميات. تعرّف على كيفية تحويل تدريب الذكاء الاصطناعي!
التعلم النشط هو منهجية تدريب متخصصة في التعلم الآلي (ML) حيث يمكن لخوارزمية التعلم أن تستعلم بشكل تفاعلي من مستخدم أو مصدر معلومات آخر ("أوراكل") لتسمية نقاط بيانات جديدة. وتكمن الفكرة الأساسية في أنه إذا كان بإمكان النموذج اختيار البيانات التي يتعلم منها، فيمكنه تحقيق دقة أعلى مع بيانات تدريب أقل بكثير. وهذا أمر ذو قيمة خاصة في المجالات التي يكون فيها تصنيف البيانات مكلفًا أو يستغرق وقتًا طويلاً أو يتطلب معرفة متخصصة. بدلاً من تصنيف مجموعة بيانات كاملة دفعة واحدة، يعطي التعلّم النشط الأولوية للعينات الأكثر "إفادة" لوضع العلامات، مما يجعل عملية تدريب النموذج أكثر كفاءة بكثير.
كيف يعمل التعلّم النشط
عملية التعلم النشط هي عملية دورية وغالبًا ما توصف بأنها سير عمل الإنسان في الحلقة. وهي تتبع عادةً الخطوات التالية:
- التدريب الأولي للنموذج: يتم أولاً تدريب نموذج، مثل كاشف Ultralytics YOLO11، على مجموعة بيانات صغيرة موسومة مبدئيًا.
- الاستعلام عن البيانات غير المسمّاة: يُستخدم النموذج المدرّب جزئيًا بعد ذلك لإجراء تنبؤات على مجموعة كبيرة من البيانات غير المُسمّاة. وبناءً على هذه التنبؤات، يختار النموذج مجموعة فرعية من العينات التي يكون "غير متأكد" منها.
- الشرح البشري: تُقدَّم هذه العينات غير المؤكدة إلى خبير بشري (أوراكل)، والذي يقدم التسميات الصحيحة.
- زيادة مجموعة البيانات: تتم إضافة العينات المصنفة حديثًا إلى مجموعة التدريب.
- إعادة التدريب: يُعاد تدريب النموذج على مجموعة البيانات المحدّثة الأكبر حجمًا. تتكرر هذه الدورة إلى أن يصل أداء النموذج إلى الحد المطلوب أو إلى استنفاد ميزانية التسمية.
يكمن مفتاح هذه العملية في استراتيجية الاستعلام. تتضمن الاستراتيجيات الشائعة أخذ عينات عدم اليقين (اختيار الحالات التي يكون النموذج أقل ثقة بشأنها)، أو الاستعلام حسب اللجنة (باستخدام نماذج متعددة واختيار الحالات التي لا تتفق عليها)، أو تقدير التغيير المتوقع في النموذج. يمكن العثور على نظرة عامة جيدة على هذه الاستراتيجيات في استبيان التعلم النشط هذا.
التطبيقات الواقعية
يعد التعلم النشط فعالاً للغاية في المجالات المتخصصة التي يكون فيها الشرح المتخصص عنق الزجاجة.
- تحليل الصور الطبية: عند تدريب الذكاء الاصطناعي للكشف عن أمراض مثل السرطان من الفحوصات الطبية، قد يكون هناك ملايين الصور المتاحة ولكن قد يكون وقت أخصائي الأشعة محدوداً. وبدلاً من جعلهم يصنفون الصور العشوائية، يمكن لنظام التعلم النشط تحديد الحالات الأكثر غموضاً أو النادرة لمراجعتها. وهذا يركز جهد الخبير حيث تكون هناك حاجة ماسة إليه، مما يسرع من تطوير نموذج عالي الدقة لمهام مثل الكشف عن أورام الدماغ. تُظهر الأبحاث في هذا المجال تخفيضات كبيرة في جهد وضع العلامات، كما هو مفصل في دراسات مثل هذه الدراسة حول تجزئة الصور الطبية الحيوية.
- القيادة الذاتية: يجب تدريب أنظمة الإدراك في المركبات ذاتية القيادة على مجموعات بيانات واسعة ومتنوعة تغطي سيناريوهات قيادة لا حصر لها. يمكن للتعلّم النشط تحديد "الحالات الحادة" من بيانات القيادة المجمّعة - مثل المشاة المخفيين جزئياً بواسطة عائق أو ظروف الطقس غير العادية - التي يواجه نموذج اكتشاف الأجسام الحالي صعوبة في التعامل معها. من خلال إعطاء الأولوية لهذه المشاهد الصعبة للتعليق التوضيحي، يمكن للمطورين تحسين متانة النموذج وسلامته بشكل أكثر فعالية.
التعلّم النشط مقابل المفاهيم ذات الصلة
من المهم التمييز بين التعلّم النشط ونماذج التعلّم الأخرى التي تستخدم أيضًا بيانات غير مُسمّاة:
- التعلم شبه الخاضع للإشراف: يستخدم كلاً من البيانات المصنفة وغير المصنفة في وقت واحد أثناء التدريب. وعلى عكس التعلّم النشط، فإنه عادةً ما يستخدم جميع البيانات المتاحة غير المسمّاة بشكل سلبي، بدلاً من الاستعلام بشكل انتقائي عن حالات محددة للتسميات.
- التعلم الذاتي الخاضع للإشراف الذاتي: يتعلّم التمثيلات من البيانات غير المسمّاة من خلال إنشاء مهام ما قبل التسمية (على سبيل المثال، التنبؤ بجزء مقنّع من الصورة). وهو لا يتطلب شرحًا بشريًا خلال مرحلة ما قبل التدريب، في حين يعتمد التعلم النشط على أوراكل للتسميات. وقد استكشف DeepMind هذا المجال على نطاق واسع.
- التعلّم المعزز: يتعلم عن طريق التجربة والخطأ من خلال التفاعلات مع البيئة، وتلقي المكافآت أو العقوبات على الأفعال. لا يتضمن الاستعلام عن التسميات الصريحة مثل التعلم النشط.
- التعلّم الاتحادي: يركّز على نماذج التدريب عبر الأجهزة اللامركزية مع الحفاظ على البيانات محليًا، ويعالج في المقام الأول مخاوف خصوصية البيانات. التعلم النشط: يركز على الحصول على التسمية الفعالة. يمكن الجمع بين هذه التقنيات في بعض الأحيان.
الأدوات والتنفيذ
غالبًا ما يتضمن تنفيذ التعلم النشط دمج نماذج التعلم الآلي مع أدوات التعليق التوضيحي وإدارة سير عمل البيانات. تقدم أطر مثل scikit-learn بعض الوظائف، بينما توجد مكتبات متخصصة لمهام محددة. يمكن دمج برامج التعليقات التوضيحية مثل Label Studio في خطوط أنابيب التعلّم النشط، مما يسمح للمشرحين بتوفير تسميات للعينات المستفسر عنها. تعد الإدارة الفعالة لمجموعات البيانات المتطورة والنماذج المدربة أمرًا بالغ الأهمية، وتوفر منصات مثل Ultralytics HUB بنية تحتية لتنظيم هذه الأصول طوال دورة حياة التطوير. استكشف مستودع Ultralytics GitHub للحصول على مزيد من المعلومات حول تنفيذ تقنيات التعلم الآلي المتقدمة.