التعلّم من الصفر

اكتشف التعلُّم من الصفر: نهج متطور للذكاء الاصطناعي يُمكِّن النماذج من تصنيف البيانات غير المرئية، مما يُحدث ثورة في اكتشاف الأشياء، ومعالجة اللغات الطبيعية وغيرها.

التعلّم الصفري (ZSL) هو قدرة رائعة في التعلّم الآلي (ML) حيث يمكن للنموذج التعرّف على الأشياء وتصنيفها من الفئات التي لم يسبق له رؤيتها خلال مرحلة بيانات التدريب. وعلى عكس التعلّم التقليدي الخاضع للإشراف، والذي يتطلب أمثلة صريحة لكل فئة محتملة، يُمكّن التعلم الصفري من تعميم معرفته على فئات جديدة غير مرئية. ويتحقق ذلك من خلال الربط بين الفئات المرصودة وغير المرصودة من خلال أوصاف دلالية عالية المستوى، مثل السمات أو تضمينات النص. يتيح ذلك لنموذج الذكاء الاصطناعي أن يكون أكثر مرونة وقابلية للتطوير، خاصةً في سيناريوهات العالم الحقيقي حيث يكون جمع البيانات الشاملة الموسومة غير عملي.

كيف تعمل؟

الفكرة الأساسية وراء ZSL هي إنشاء مساحة تضمين مشتركة حيث يمكن تمثيل كل من السمات المرئية من الصور والمعلومات الدلالية من النص. أثناء التدريب، يتعلّم النموذج تعيين صور الفئات المرئية إلى المتجهات الدلالية المقابلة لها (السمات أو تضمينات الكلمات). على سبيل المثال، يتعلم النموذج السمات المرئية لـ "الحصان" ويربطها بوصف دلالي مثل "له أربع أرجل" و"هو حيوان ثديي" و"يمكن ركوبه".

عند تقديم صورة لفئة غير مرئية، مثل "الحمار الوحشي"، يستخرج النموذج سماته البصرية. في نفس الوقت، يستخدم النموذج الوصف الدلالي ل "الحمار الوحشي" - على سبيل المثال، "يشبه الحصان"، "له خطوط" - لتحديد موقعه في فضاء التضمين. من خلال العثور على أقرب وصف دلالي للسمات البصرية المستخرجة، يمكن للنموذج تصنيف الصورة على أنها "حمار وحشي" بشكل صحيح، حتى بدون صورة واحدة للتدريب على صورة حمار وحشي. تعتمد هذه العملية غالبًا على نماذج قوية متعددة الوسائط مدربة مسبقًا مثل نموذج CLIP من OpenAI، والتي تتفوق في الربط بين الرؤية واللغة.

التعلّم من الصفر مقابل التعلّم من اللقطة الصفرية النماذج الأخرى

من المهم التمييز بين ZSL وتقنيات التعلم ذات الصلة:

التعلُّم عن بعد (FSL): في تعلم اللقطات القليلة (FSL)، يتم تدريب النموذج باستخدام عدد قليل جدًا من الأمثلة المصنفة (على سبيل المثال، من 1 إلى 5) لكل فئة جديدة. ويختلف هذا عن ZSL، الذي يعمل بدون أمثلة للفئة المستهدفة.
التعلم دفعة واحدة (OSL): نوع فرعي من التعلم بلقطة واحدة حيث يتلقى النموذج مثالاً واحداً فقط لفئة جديدة. وهو أكثر تقييدًا للبيانات من التعلم بلقطة واحدة من التعلم المنفرد، لكنه لا يزال يتطلب عينة واحدة على الأقل، على عكس التعلم المنفرد.
نقل التعلم: يعد ZSL شكلاً من أشكال التعلّم المنقول، ولكنه فريد من نوعه. فبينما يتضمن التعلّم التحوّلي القياسي عادةً ضبط نموذج مُدرّب مسبقًا على مجموعة بيانات جديدة (أصغر) موسومة، فإن التعلّم التحوّلي ينقل المعرفة إلى فئات جديدة باستخدام معلومات دلالية مساعدة فقط، متجاوزًا الحاجة إلى أي أمثلة موسومة لتلك الفئات.

التطبيقات الواقعية

تتمتع ZSL بالعديد من التطبيقات العملية، مما يجعل أنظمة الرؤية الحاسوبية أكثر ديناميكية وقابلية للتكيف.

الكشف عن الكائنات ذات المفردات المفتوحة: تستفيد النماذج مثل YOLO-World من ZSL لاكتشاف أي كائن موصوف بالنص. يمكن للمستخدم توفير مطالبات نصية مثل "شخص يرتدي قميصًا أزرق" أو "أنبوب مسرب"، ويمكن للنموذج تحديد موقع هذه الأشياء في صورة أو دفق فيديو دون أن يتم تدريبه صراحةً على تلك الفئات المحددة. وتعد هذه خطوة مهمة نحو إنشاء أنظمة رؤية ذات أغراض عامة حقاً.
تحديد الأنواع المستقلة: في مجال الذكاء الاصطناعي للحفاظ على الحياة البرية، يمكن لـ ZSL تحديد الأنواع النادرة أو المكتشفة حديثاً. يمكن للنموذج المدرّب على الحيوانات الشائعة استخدام السمات الوصفية (على سبيل المثال، "له عنق طويل"، "مرقط"، "من آكلات الأعشاب") من قاعدة معرفية مثل ويكيبيديا لتحديد الزرافة، حتى لو لم تكن هناك صور زرافة في مجموعة التدريب الأصلية.

التحديات والتوجهات المستقبلية

على الرغم من إمكانياتها، تواجه ZSL تحديات مثل مشكلة المحورية (حيث تصبح بعض النقاط في الفضاء الدلالي أقرب جيران للعديد من النقاط) وتحول المجال (حيث تختلف العلاقات بين السمات والسمات بين الفئات المرئية وغير المرئية). ولمعالجة هذه المشاكل، يقوم الباحثون بتطوير تقنيات أكثر قوة مثل التعلّم الصفري المعمم (GZSL)، حيث يجب أن يتعرف النموذج على كل من الفئات المرئية وغير المرئية أثناء الاستدلال. سيؤدي تطور النماذج الأساسية والمنصات مثل Ultralytics HUB إلى زيادة تبسيط دمج ونشر التعلم الصفري المعمم (ZSL)، مما يجعل أنظمة الذكاء الاصطناعي أقل اعتمادًا على وضع علامات واسعة النطاق على البيانات وأكثر توافقًا مع التفكير الشبيه بالإنسان.

التعلّم من الصفر

حل الترخيص المرن للمؤسسات لتعزيز ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ مع Ultralytics YOLO

تدريب نماذج YOLO ببساطة باستخدام Ultralytics HUB

كيف تعمل؟

التعلّم من الصفر مقابل التعلّم من اللقطة الصفرية النماذج الأخرى

التطبيقات الواقعية

التحديات والتوجهات المستقبلية

اقرأ المزيد في هذه الفئة

يستخدم Google AlphaEarth من Google AlphaEarth بيانات الرصد لرسم الخرائط العالمية

FastVLM: Apple تطرح نموذجها الجديد للغة الرؤية السريعة

شرح التعلم الآلي البشري داخل الحلقة (HITL)

انضم إلى مجتمع Ultralytics