تحسين أداء الذكاء الاصطناعي باستخدام التكميم الكمي للنموذج. تقليل الحجم، وزيادة السرعة، وتحسين كفاءة الطاقة لعمليات النشر في العالم الحقيقي.
تكميم النموذج هو تقنية تحسين حاسمة تُستخدم في التعلم الآلي لتقليل التكاليف الحسابية وتكاليف الذاكرة لنشر نماذج الذكاء الاصطناعي. وهي تعمل عن طريق تحويل أوزان وتفعيلات الشبكة العصبية من أرقام عائمة عالية الدقة (مثل الأعداد العائمة 32 بت) إلى تنسيقات أقل دقة، مثل الأعداد الصحيحة 8 بت. تقلل هذه العملية بشكل كبير من حجم النموذج وتسرع من سرعة الاستدلال، مما يجعلها مثالية للنشر على الأجهزة محدودة الموارد.
الفكرة الأساسية وراء تكميم النموذج هي تمثيل القيم العددية في النموذج بعدد أقل من البتات. يتم تدريب معظم نماذج التعلّم العميق وتشغيلها باستخدام أرقام الفاصلة العائمة، والتي توفر دقة عالية ولكنها تتطلب قوة حسابية وذاكرة كبيرة. يقلل التحويل الكمي من هذا الطلب عن طريق تعيين النطاق المستمر لقيم الفاصلة العائمة إلى مجموعة أصغر من القيم الصحيحة المنفصلة. ويمكن تشبيه ذلك بتقليل لوحة الألوان في الصورة؛ فبينما قد يتم فقدان بعض التفاصيل، تبقى المعلومات الأساسية باقية، ويصبح حجم الملف أصغر بكثير.
هناك عدة تقنيات لتكميم النموذج. يتم تطبيق التكميم الكمي بعد التدريب بعد تدريب النموذج بالكامل، حيث يتم تحويل أوزانه وتفعيلاته إلى دقة أقل دون مزيد من التدريب. هذه طريقة مباشرة ولكنها قد تؤدي أحيانًا إلى انخفاض طفيف في الدقة. من ناحية أخرى، يدمج التدريب المدرك للتحويل الكمي (QAT) عملية التحويل الكمي في مرحلة التدريب نفسها. وهذا يسمح للنموذج بالتعلم والتكيف مع قيود الدقة المنخفضة، مما يؤدي في كثير من الأحيان إلى دقة أفضل مقارنةً بالتدريب الكمي بعد التدريب. يمكن أيضًا استخدام تقنيات مثل التدريب المختلط الدقة لتحقيق التوازن بين الدقة والكفاءة أثناء عملية التدريب.
يوفر التكميم الكمي للنموذج العديد من المزايا الرئيسية، خاصةً لنشر نماذج الذكاء الاصطناعي في تطبيقات العالم الحقيقي:
يعد تكميم النماذج أمرًا ضروريًا لنشر نماذج الذكاء الاصطناعي في مجموعة واسعة من التطبيقات، لا سيما عندما تكون الموارد محدودة أو السرعة أمرًا بالغ الأهمية. فيما يلي بعض الأمثلة:
في حين أن كلاً من تكميم النماذج وتشذيب النماذج هما تقنيتان لتحسين النماذج تهدفان إلى تقليل حجم النموذج وتحسين الكفاءة، إلا أنهما تعملان بشكل مختلف. يقلل التكميم من دقة التمثيلات العددية، بينما يقلل التقليم من عدد المعلمات في النموذج عن طريق إزالة الوصلات أو الخلايا العصبية الأقل أهمية. يمكن استخدام كلتا التقنيتين بشكل مستقل أو مجتمعتين لتحقيق الأداء والحجم الأمثل للنموذج. أدوات مثل TensorRT و OpenVINO غالبًا ما تدمج التكميم والتشذيب كجزء من خطوط أنابيب التحسين الخاصة بها.
باختصار، يُعد التكميم الكمي للنموذج تقنية قوية تجعل الذكاء الاصطناعي أكثر سهولة وقابلية للنشر عبر مجموعة واسعة من الأجهزة والتطبيقات من خلال تحسين الكفاءة دون خسارة كبيرة في الدقة.