التعلّم النشط هو نهج متخصص في التعلّم الآلي حيث تستعلم الخوارزمية بشكل تفاعلي عن مصدر بيانات للحصول على المخرجات المطلوبة لنقاط البيانات الجديدة. تُعد هذه الطريقة مفيدة بشكل خاص عند التعامل مع مجموعات البيانات الكبيرة غير المسماة حيث يكون التسمية اليدوية غير عملية أو مكلفة. من خلال الاختيار الاستراتيجي لنقاط البيانات التي يجب تصنيفها، يهدف التعلّم النشط إلى تحقيق دقة عالية للنموذج مع عدد أقل من الأمثلة المصنفة مقارنةً بأساليب التعلّم التقليدية الخاضعة للإشراف. يساعد في تقليل تكاليف التسمية ويعزز الدقة من خلال التركيز على نقاط البيانات الرئيسية.
المفاهيم الأساسية والمنهجية
في التعلّم النشط، يبدأ النموذج بمجموعة صغيرة من البيانات المصنفة ويختار بشكل متكرر نقاط البيانات الأكثر إفادةً لوضع العلامات عليها من قبل أوراكل (مثل المُعلّق البشري). ثم يقوم النموذج بعد ذلك بإعادة التدريب على البيانات المصنفة حديثًا، وتحسين أدائه مع كل تكرار. تستمر هذه العملية حتى الوصول إلى المستوى المطلوب من الدقة أو استنفاد ميزانية التسمية.
يكمن مفتاح التعلم النشط الفعال في الاستراتيجية المستخدمة لاختيار نقاط البيانات لوضع العلامات. وتشمل الاستراتيجيات الشائعة ما يلي:
- أخذ عينات عدم اليقين: يختار النموذج نقاط البيانات حيث يكون أقل ثقة في تنبؤاته. على سبيل المثال، في مهمة التصنيف، قد يختار النموذج نقاط البيانات ذات الاحتمالات القريبة من حدود القرار.
- الاستعلام حسب اللجنة: يتم تدريب لجنة من النماذج المتنوعة على البيانات الموسومة، ويتم اختيار نقاط البيانات التي يختلف فيها أعضاء اللجنة أكثر من غيرها لوضع العلامات عليها. يهدف هذا النهج إلى تقليل التباين في النموذج من خلال التركيز على المناطق التي تتسم بدرجة عالية من عدم اليقين.
- التغيير المتوقع في النموذج: يختار النموذج نقاط البيانات التي من المتوقع أن تسبب أكبر تغيير في معلمات النموذج إذا كانت تسمياتها معروفة. تهدف هذه الاستراتيجية إلى تحقيق أقصى قدر من المعلومات المكتسبة من كل مثال مُسمّى.
- تقليل الخطأ المتوقع: يختار النموذج نقاط البيانات التي من المتوقع أن تقلل من خطأ التنبؤ الكلي أكثر من غيرها. يستهدف هذا النهج مباشرةً تحسين أداء النموذج على البيانات غير المرئية.
- تقليل التباين: تركز هذه الطريقة على تقليل التباين في تنبؤات النموذج من خلال اختيار نقاط البيانات التي تمثل توزيع البيانات الأساسية.
التعلّم النشط مقابل نماذج التعلّم الأخرى
يختلف التعلم النشط بشكل كبير عن مناهج التعلم الآلي الأخرى مثل التعلم تحت الإشراف والتعلم غير الخاضع للإشراف والتعلم شبه الخاضع للإشراف. في التعلّم الخاضع للإشراف، يتم تدريب النموذج على مجموعة ثابتة من البيانات الموسومة، بينما في التعلّم غير الخاضع للإشراف، يتعلم النموذج من بيانات غير موسومة. يستخدم التعلّم شبه الخاضع للإشراف مزيجًا من البيانات المسمّاة وغير المسمّاة، ولكن على عكس التعلّم النشط، لا يستعلم النموذج بشكل نشط عن التسميات.
يكون التعلّم النشط مفيدًا بشكل خاص عندما تكون البيانات المصنفة نادرة أو مكلفة في الحصول عليها، حيث يسمح للنموذج بتحقيق دقة عالية مع عدد أقل من الأمثلة المصنفة. وهذا يجعلها تقنية قيّمة في السيناريوهات التي يكون فيها تصنيف البيانات عنق الزجاجة.
التطبيقات الواقعية
وجد التعلم النشط تطبيقات في مجالات مختلفة، بما في ذلك:
- تصنيف الصور والفيديو: يمكن استخدام التعلم النشط لتدريب النماذج بكفاءة على مهام تصنيف الصور والفيديو. على سبيل المثال، في سيناريو التصوير الطبي، يمكن لنظام التعلّم النشط أن يختار الصور الطبية الأكثر إفادة لأخصائي الأشعة لتصنيفها، مما يقلل من عبء التصنيف مع تحسين دقة التشخيص. تعرف على المزيد حول الذكاء الاصطناعي البصري في مجال الرعاية الصحية على الموقع الإلكتروني Ultralytics .
- معالجة اللغات الطبيعية: يمكن تطبيق التعلم النشط على مهام مثل تصنيف النصوص، والتعرف على الكيانات المسماة، وتحليل المشاعر. ومن خلال وضع علامات انتقائية على عينات النصوص الأكثر إفادة، يمكن للتعلم النشط تحسين أداء نماذج معالجة اللغات الطبيعية باستخدام بيانات أقل في التصنيف. لمزيد من التفاصيل، استكشف معالجة اللغة الطبيعية (NLP).
- التعرّف على الكلام: يمكن استخدام التعلّم النشط لتدريب نماذج التعرّف على الكلام من خلال اختيار العينات الصوتية الأكثر صعوبة للنسخ. يمكن لهذا النهج تحسين متانة النموذج في مواجهة الاختلافات في اللهجات والضوضاء وأساليب التحدث.
أمثلة لحالات الاستخدام
- القيادة الذاتية: في تطوير السيارات ذاتية القيادة، يمكن استخدام التعلّم النشط لتدريب نماذج الكشف عن الأجسام التي تحدد المشاة والمركبات والأشياء الأخرى في تدفقات الفيديو في الوقت الفعلي. يمكن لنظام التعلّم النشط اختيار الإطارات الأكثر غموضاً أو تحدياً للتعليق التوضيحي اليدوي، مما يضمن أداء النموذج بشكل جيد في المواقف المتنوعة والحرجة المتعلقة بالسلامة.
- مراقبة جودة التصنيع: يمكن استخدام التعلم النشط لتدريب النماذج التي تكتشف العيوب في المنتجات المصنعة. من خلال وضع علامات انتقائية على صور المنتجات ذات العيوب المحتملة، يمكن لنظام التعلم النشط أن يساعد في بناء نموذج عالي الدقة للكشف عن العيوب بأقل جهد ممكن في وضع العلامات، مما يقلل من تكاليف الفحص ويحسن جودة المنتج. تعرف على المزيد حول الذكاء الاصطناعي في التصنيع.
الأدوات وأطر العمل
تتوفر العديد من الأدوات وأطر العمل لتنفيذ التعلم النشط، بما في ذلك:
- modAL: إطار عمل للتعلم النشط ل Python3، مصمم ليكون معياريًا وقابلًا للتوسيع. يدعم العديد من استراتيجيات التعلم النشط ويمكن دمجه بسهولة مع نماذج scikit-learn.
- libact: مكتبة Python للتعلم النشط التي تدعم سيناريوهات التعلم النشط القائم على التجمع. توفر استراتيجيات استعلام مختلفة وتسمح للمستخدمين بتحديد استراتيجيات مخصصة أيضًا.
- ALiPy: صندوق أدوات Python للتعلم النشط الذي يقدم مجموعة واسعة من الاستراتيجيات ويدعم كلاً من التعلم النشط القائم على التجميع والتدفق.
استنتاج
التعلّم النشط هو أسلوب قوي لتدريب نماذج التعلّم الآلي باستخدام بيانات موسومة محدودة. من خلال الاختيار الاستراتيجي لنقاط البيانات الأكثر إفادة لوضع العلامات، يمكن للتعلم النشط تحقيق دقة عالية مع تقليل التكلفة والجهد المرتبطين بوضع العلامات على البيانات. وقد وجد هذا النهج تطبيقات في مجالات مختلفة، بما في ذلك الرؤية الحاسوبية ومعالجة اللغات الطبيعية والتعرف على الكلام. ومع استمرار تزايد حجم البيانات غير الموسومة في النمو، سيلعب التعلم النشط دورًا متزايد الأهمية في تمكين التعلم الآلي الفعال والكفء. استكشف مدونةUltralytics لمزيد من الأفكار حول حلول الذكاء الاصطناعي المتطورة. يمكنك البدء في تدريب النماذج باستخدام Ultralytics HUB، وهي منصة بدون تعليمات برمجية لتدريب نماذج Ultralytics YOLO المخصصة.