مسرد المصطلحات

الضبط الفعال للبارامترات (PEFT)

اكتشف الضبط الدقيق الفعال للمعلمات (PEFT) لتكييف نماذج الذكاء الاصطناعي الكبيرة بأقل قدر من الموارد. وفِّر التكاليف، وتجنب الإفراط في الضبط، وحسِّن النشر!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

الضبط الدقيق الفعال للمعلمات (PEFT) هو مجموعة من التقنيات في التعلم الآلي المصممة لتكييف النماذج المدربة مسبقًا بكفاءة مع مهام نهائية محددة، مع ضبط عدد قليل من معلمات النموذج فقط. ويكتسب هذا النهج أهمية خاصة في عصر النماذج اللغوية الكبيرة (LLMs) وغيرها من نماذج الذكاء الاصطناعي واسعة النطاق، حيث يمكن أن يكون الضبط الدقيق الكامل مكلفًا من الناحية الحسابية وكثيف الموارد. تُقلل أساليب التحويل إلى نموذج (PEFT) بشكل كبير من التكاليف الحسابية والتخزين، مما يجعل من الممكن تخصيص هذه النماذج الضخمة لمجموعة واسعة من التطبيقات ونشرها في بيئات محدودة الموارد.

الملاءمة والتطبيقات

تنبع أهمية الضبط الدقيق الفعال للمعلمات من قدرته على إضفاء الطابع الديمقراطي على الوصول إلى نماذج قوية مدربة مسبقًا. فبدلاً من تدريب نموذج كبير من الصفر أو ضبط جميع معلماته بدقة لكل مهمة جديدة، يسمح نظام الضبط الدقيق الفعال للمعلمات للمطورين والباحثين بتحقيق أداء مماثل من خلال تعديل جزء بسيط من المعلمات الأصلية فقط. ولهذه الكفاءة العديد من الفوائد والتطبيقات الرئيسية:

  • انخفاض التكلفة الحسابية: يتطلب الضبط الدقيق التقليدي للنماذج الكبيرة موارد حاسوبية كبيرة ووقتاً طويلاً. وتقلل تقنيات التدريب السحابي الفعال بشكل كبير من هذه المتطلبات، مما يتيح إجراء التجارب والنشر بشكل أسرع، ويجعل الذكاء الاصطناعي في متناول الأفراد والمؤسسات ذات الموارد المحدودة. هذا الأمر مفيد بشكل خاص عند استخدام منصات مثل Ultralytics HUB Cloud Training، حيث يُترجم التدريب الفعال مباشرةً إلى توفير في التكاليف ودورات تكرار أسرع.
  • متطلبات تخزين أقل: يؤدي الضبط الدقيق لجميع معلمات نموذج كبير إلى نسخ متعددة بالحجم الكامل لكل مهمة. تؤدي طرق PEFT، من خلال تعديل مجموعة فرعية صغيرة فقط من المعلمات، إلى نماذج أصغر بكثير من النماذج المضبوطة بدقة. وهذا أمر بالغ الأهمية لنشر النماذج على أجهزة الحافة أو في السيناريوهات التي يكون فيها التخزين محدوداً.
  • منع الإفراط في التكييف: عند الضبط الدقيق للنماذج الكبيرة على مجموعات بيانات صغيرة، هناك خطر الإفراط في التكيّف، حيث يتعلم النموذج الأداء الجيد على بيانات التدريب ولكنه يعمم بشكل سيء على البيانات الجديدة غير المرئية. يمكن أن تعمل طرق PEFT كشكل من أشكال التنظيم، حيث إنها تقيد تكيف النموذج، مما قد يؤدي إلى تعميم أفضل.

تتنوع تطبيقات العالم الحقيقي لنماذج PEFT وتتوسع بسرعة. على سبيل المثال، في معالجة اللغات الطبيعية (NLP)، يتم استخدام PEFT لتكييف النماذج الأساسية مثل GPT-3 أو GPT-4 لمهام محددة مثل تحليل المشاعر أو تلخيص النصوص أو الإجابة عن الأسئلة. في الرؤية الحاسوبية، يمكن تطبيق PEFT على نماذج الصور المدربة مسبقًا لتكييفها لمهام مثل تحليل الصور الطبية أو الكشف عن الأشياء في مجالات محددة، مثل الكشف عن العيوب في التصنيع أو تحديد الأنواع المختلفة في الحفاظ على الحياة البرية.

المفاهيم الرئيسية

يعتمد برنامج PEFT على مبادئ نقل التعلم والضبط الدقيق. يتضمن نقل التعلم الاستفادة من المعرفة المكتسبة من حل مشكلة واحدة لتطبيقها على مشكلة مختلفة ولكنها ذات صلة. والضبط الدقيق، في هذا السياق، هو عملية أخذ نموذج تم تدريبه مسبقًا وتدريبه على مجموعة بيانات جديدة خاصة بمهمة محددة.

ومع ذلك، غالبًا ما ينطوي الضبط الدقيق التقليدي على تحديث كل أو جزء كبير من معلمات النموذج المدرب مسبقًا. ويميز برنامج PEFT نفسه من خلال تقديم تقنيات لا تعدل سوى جزء صغير من هذه المعلمات. وتتضمن تقنيات التحويل المعزز الشائعة ما يلي:

  • وحدات المحولات: إضافة طبقات صغيرة وجديدة (محولات) إلى النموذج المُدرَّب مسبقًا وتدريب طبقات المحولات هذه فقط، مع الحفاظ على أوزان النموذج الأصلي مجمدة.
  • ضبط البادئة: إضافة بادئات قابلة للتدريب إلى مدخلات النموذج، والتي توجه سلوك النموذج للمهمة الجديدة.
  • التكيف منخفض الرتبة (LoRA): تفكيك مصفوفات الوزن إلى مصفوفات منخفضة الرتبة وتدريب هذه المصفوفات الأصغر منخفضة الرتبة فقط.

تتناقض هذه الطرق مع الضبط الدقيق الكامل، الذي يقوم بتحديث جميع معلمات النموذج، وتشذيب النموذج، الذي يقلل من حجم النموذج عن طريق إزالة الاتصالات الأقل أهمية. تركز PEFT على التكيف الفعال بدلاً من تقليل الحجم أو إعادة التدريب الكامل.

باختصار، يعد الضبط الدقيق الفعال للمعلمات تقدمًا حاسمًا في جعل نماذج الذكاء الاصطناعي الكبيرة أكثر عملية وسهولة في الوصول إليها. من خلال تقليل النفقات الحسابية والتخزينية بشكل كبير مع الحفاظ على الأداء العالي، يمكّن الضبط الدقيق للبارامترات من تمكين مجتمع أوسع من الاستفادة من قوة الذكاء الاصطناعي المتطور لتطبيقات متنوعة ومتخصصة، بما في ذلك تلك التي يمكن تحقيقها مع نماذج مثل Ultralytics YOLO11.

قراءة الكل