مسرد المصطلحات

تقطير المعرفة

اكتشف كيف تعمل تقنية تقطير المعرفة على ضغط نماذج الذكاء الاصطناعي من أجل استدلال أسرع ودقة محسّنة وكفاءة نشر الأجهزة المتطورة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تقطير المعرفة هي تقنية ضغط النماذج المستخدمة في التعلم الآلي لنقل المعرفة من نموذج كبير ومعقد ("المعلم") إلى نموذج أصغر وأبسط ("الطالب"). الهدف هو تدريب نموذج الطالب لتحقيق أداء مماثل لنموذج المعلم، على الرغم من أن الطالب لديه عدد أقل من المعلمات وأقل تكلفة من الناحية الحسابية. هذا مفيد بشكل خاص لنشر النماذج على الأجهزة ذات الموارد المحدودة أو في التطبيقات التي تتطلب أوقات استنتاج سريعة.

كيف يعمل تقطير المعرفة

تتمثل الفكرة الأساسية وراء عملية تقطير المعرفة في استخدام المخرجات الناعمة (الاحتمالات) لنموذج المعلم كأهداف تدريبية لنموذج الطالب، بالإضافة إلى التسميات الثابتة (الحقيقة الأساسية) أو بدلاً منها. يمكن لنماذج المعلم، التي غالبًا ما يتم تدريبها مسبقًا على مجموعات بيانات واسعة، أن تلتقط العلاقات المعقدة في البيانات وتعميمها بشكل جيد. من خلال التعلم من هذه الأهداف الناعمة، يمكن لنموذج الطالب أن يتعلم معلومات أكثر ثراءً مما قد يتعلمه بمجرد التعلم من التسميات الثابتة وحدها. تتضمن هذه العملية في كثير من الأحيان استخدام "درجة حرارة" أعلى في دالة softmax أثناء استدلال المعلم لتخفيف توزيع الاحتمالات، مما يوفر معلومات أكثر دقة للطالب.

الفوائد والتطبيقات

يوفر تقطير المعرفة العديد من المزايا، مما يجعلها تقنية قيّمة في مختلف تطبيقات الذكاء الاصطناعي:

  • ضغط النماذج: يسمح بإنشاء نماذج أصغر حجماً وأكثر كفاءة ومناسبة للنشر على الأجهزة المتطورة ذات الموارد الحاسوبية المحدودة، مثل الهواتف المحمولة أو الأنظمة المدمجة. وهذا أمر بالغ الأهمية لتطبيقات مثل اكتشاف الأجسام في الوقت الحقيقي على أجهزة مثل Raspberry Pi أو NVIDIA Jetson.
  • تعميم محسّن: غالبًا ما تُظهر نماذج الطلاب المدربة باستخدام تقطير المعرفة أداءً أفضل في التعميم من النماذج المدربة فقط على التسميات الثابتة. يمكنهم التعلم من التمثيلات التي تعلمها المعلم، مما يؤدي إلى تحسين الدقة والمتانة.
  • استدلال أسرع: تؤدي النماذج الأصغر حجمًا بطبيعة الحال إلى أوقات استدلال أسرع، وهو أمر ضروري لتطبيقات الوقت الحقيقي مثل القيادة الذاتية وأتمتة العمليات الروبوتية (RPA) وأنظمة الأمان.

تنتشر تطبيقات تقطير المعرفة في العالم الحقيقي على نطاق واسع:

  • معالجة اللغات الطبيعية (NLP): في معالجة اللغات الطبيعية، يمكن استخدام تقطير المعرفة في معالجة اللغات الطبيعية لضغط النماذج اللغوية الكبيرة مثل GPT-3 أو BERT إلى نماذج أصغر وأكثر كفاءة للنشر على الأجهزة المحمولة أو الحافة. على سبيل المثال، يمكن للنموذج المقطّر أن يدعم تحليل المشاعر على الأجهزة المحمولة دون الحاجة إلى الاتصال السحابي.
  • الرؤية الحاسوبية: Ultralytics YOLOv8 أو يمكن تقطير نماذج الكشف عن الأجسام المشابهة لنشرها في تطبيقات الوقت الحقيقي على الأجهزة الطرفية. على سبيل المثال، في المدن الذكية، يمكن استخدام النماذج المقطرة في مراقبة حركة المرور وإدارتها بكفاءة، وتشغيلها مباشرة على أجهزة الحوسبة المتطورة عند التقاطعات المرورية. وهناك تطبيق آخر في تحليل الصور الطبية، حيث يمكن أن توفر النماذج المقطرة تشخيصات أولية أسرع في نقطة الرعاية.

التقطير المعرفي مقابل تشذيب النماذج وتكميمها

في حين أن تقطير المعرفة هو أسلوب ضغط النموذج، إلا أنه يختلف عن الأساليب الأخرى مثل تشذيب النموذج وتكميم النموذج. يقلل تشذيب النماذج من حجم النموذج عن طريق إزالة الروابط (الأوزان) الأقل أهمية، بينما يقلل التقطير الكمي للنموذج من دقة أوزان النموذج لاستخدام ذاكرة وحساب أقل. من ناحية أخرى، تقوم عملية تقطير المعرفة بتدريب نموذج جديد أصغر من الصفر باستخدام معرفة نموذج أكبر. يمكن أيضًا الجمع بين هذه التقنيات؛ على سبيل المثال، يمكن تشذيب النموذج المقطّر أو تكميمه لتحقيق قدر أكبر من الضغط والكفاءة. يمكن استخدام أدوات مثل مجموعة أدوات ضغط النماذج من سوني (MCT) و OpenVINO يمكن استخدامها لتحسين النماذج بشكل أكبر بعد التقطير للنشر على الحافة.

قراءة الكل