تحسين الذكاء الاصطناعي بدقة مختلطة للحصول على تعلُّم عميق أسرع وفعال. تقليل الذاكرة، وزيادة السرعة، وتوفير الطاقة دون التضحية بالدقة.
الدقة المختلطة هي تقنية في التعلم الآلي تستخدم كلاً من أنواع الفاصلة العائمة 16 بت و32 بت في العمليات الحسابية لتحسين كفاءة تدريب نماذج التعلم العميق. من خلال الاستفادة من نقاط القوة في كل نوع من أنواع الدقة، تسمح الدقة المختلطة بحساب أسرع واستخدام أقل للذاكرة دون التضحية بدقة النموذج بشكل كبير.
الدافع الأساسي لاستخدام الدقة المختلطة هو تحقيق عمليات تدريب واستدلال أسرع. تتطلب نماذج التعلم العميق، خاصةً الشبكات العصبية الكبيرة، موارد حاسوبية واسعة النطاق. يمكن للدقة المختلطة أن:
تقليل استخدام الذاكرة: يتطلب تخزين البيانات على شكل عوامات 16 بت نصف المساحة مقارنةً بالعوامات 32 بت. هذا يمكن أن يقلل بشكل كبير من مساحة الذاكرة، مما يسمح بتدريب أحجام دفعات أكبر أو نماذج أكثر تعقيدًا على نفس الأجهزة.
تسريع الحوسبة: يتم تحسين العديد من وحدات معالجة الرسومات الحديثة، مثل NVIDIA' Tensor Cores، لعمليات 16 بت. وبالتالي يمكن أن تحقق الدقة المختلطة عمليات حسابية أسرع من خلال الاستفادة من هذا التحسين للأجهزة.
كفاءة الطاقة: يمكن أن يؤدي استخدام الدقة المختلطة أيضًا إلى تقليل استهلاك الطاقة، وهو أمر مفيد لأسباب بيئية وطول عمر الجهاز.
في الممارسة العملية، تتضمن الدقة المختلطة الحفاظ على أوزان النموذج بدقة 32 بت كاملة للحفاظ على دقة النموذج مع تحويل بعض الجوانب الحسابية، مثل التنشيطات والتدرجات، إلى دقة 16 بت. يُستخدم قياس الخسارة عادةً لمنع حدوث تدفقات ناقصة يمكن أن تحدث بسبب الدقة المنخفضة.
تعد الدقة المختلطة ذات أهمية كبيرة في مختلف المجالات التي تتضمن نماذج ومجموعات بيانات كبيرة، مثل معالجة اللغة الطبيعية والرؤية الحاسوبية. على سبيل المثال:
معالجة اللغة الطبيعية (NLP): يمكن أن تستفيد النماذج اللغوية الكبيرة مثل معماريات GPT-3 وبنى المحولات بشكل كبير من الدقة المختلطة، مما يتيح تدريبًا أكثر كفاءة دون المساس بالدقة العالية المطلوبة لفهم اللغة وتوليدها.
الرؤية الحاسوبية: في تطبيقات مثل اكتشاف الأجسام باستخدام Ultralytics YOLO، يمكن للدقة المختلطة تسريع مرحلة الاستدلال، وهو أمر بالغ الأهمية في سيناريوهات المعالجة في الوقت الحقيقي، مثل المركبات ذاتية القيادة أو أنظمة المراقبة.
وغالبًا ما تظهر الدقة المختلطة جنبًا إلى جنب مع مصطلحات مثل تكميم الن ماذج وتشذيب النماذج. في حين أن جميع هذه المصطلحات الثلاثة تهدف إلى تحسين النماذج، إلا أنها تختلف في الأساليب:
التحويل الكمي للنموذج: يحول أوزان النموذج وحساباته إلى تمثيلات ذات عرض بت أقل (على سبيل المثال، 8 بت) لتقليل الذاكرة والحساب، وعادةً ما يكون لذلك بعض التأثير على الدقة.
تشذيب النموذج: يتضمن إزالة الأجزاء الزائدة عن الحاجة من الشبكة العصبية لتقليل حجمها وتحسين سرعتها، وغالبًا ما يتطلب ذلك إعادة التدريب لاستعادة الدقة.
المركبات ذاتية القيادة: في المركبات ذاتية القيادة، تتيح الدقة المختلطة إجراء عمليات حسابية أسرع في التطبيقات القائمة على الرؤية. على سبيل المثال، يستفيد الذكاء الاصطناعي في القيادة الذاتية من الدقة المختلطة للتعامل مع التصورات البيئية المعقدة بكفاءة، وبالتالي تعزيز عمليات السلامة واتخاذ القرار.
تجزئة الصور في الرعاية الصحية: تُستخدم الدقة المختلطة أيضًا في تطبيقات الذكاء الاصطناعي في مجال الرعاية الصحية لمهام التصوير الطبي مثل الأشعة المقطعية والتصوير بالرنين المغناطيسي. فهو يسمح بمعالجة مجموعات البيانات الكبيرة بسرعة، مما يساعد في التشخيص والتخطيط للعلاج في الوقت الفعلي.
يتطلب تنفيذ الدقة المختلطة تغييرات في سير عمل تدريب النماذج، وغالباً ما يكون ذلك باستخدام مكتبات وأدوات مصممة لذلك. أطر عمل مثل TensorFlow و PyTorch توفر دعمًا مدمجًا للدقة المختلطة، مما يسهل دمجها في المشاريع الحالية.
للاطلاع على دليل عملي حول نشر النماذج ذات التحسينات مثل الدقة المختلطة، راجع Ultralytics HUB للحصول على الأدوات والموارد المصممة خصيصًا لتطوير النماذج بسلاسة.