أتقن فن الهندسة السريعة لتوجيه نماذج الذكاء الاصطناعي مثل LLMs للحصول على مخرجات دقيقة وعالية الجودة في المحتوى وخدمة العملاء وغير ذلك.
هندسة الموجهات هي فن وعلم صياغة مدخلات (مطالبات) فعالة لتوجيه نماذج الذكاء الاصطناعي، وخاصة نماذج اللغات الكبيرة (LLMs)، نحو توليد المخرجات المطلوبة. ويتضمن ذلك فهم كيفية تفسير هذه النماذج للتعليمات والتصميم التكراري للمطالبات الواضحة والمحددة والتي توفر سياقًا كافيًا لاستنباط استجابات دقيقة وملائمة ومفيدة. نظرًا لأن نماذج الذكاء الاصطناعي أصبحت أكثر تكاملاً في مختلف الأدوات وسير العمل، فإن إتقان هندسة المطالبات أمر بالغ الأهمية لتحقيق أقصى قدر من إمكاناتها وضمان أداء موثوق به في مهام تتراوح بين الإجابة البسيطة عن الأسئلة وتوليد النصوص الإبداعية المعقدة.
غالبًا ما تكون الهندسة السريعة الفعالة عملية تكرارية. فهي تبدأ بتحليل متطلبات المهمة وفهم قدرات وقيود نموذج الذكاء الاصطناعي المستهدف. ثم يقوم المهندس بعد ذلك بتصميم موجه أولي واختباره وتقييم المخرجات وتنقيح الموجه بناءً على النتائج. قد يتضمن هذا التنقيح إضافة تعليمات أكثر تحديدًا، أو تقديم أمثلة(التعلم من خلال لقطات قليلة)، أو تحديد تنسيق الإخراج المطلوب (مثل JSON)، أو وضع قيود، أو تعديل النبرة. غالبًا ما تعتمد التقنيات الرئيسية على مبادئ من معالجة اللغة الطبيعية (NLP) وتتطلب دراسة متأنية لكيفية تأثير الصياغة على سلوك النموذج، متأثرة ببيانات التدريب وبنيته، مثل نموذج المحول الموصوف في ورقة "الانتباه هو كل ما تحتاجه" الشهيرة.
يتم استخدام العديد من الاستراتيجيات بشكل شائع في الهندسة السريعة:
الهندسة السريعة أمر أساسي للنشر الناجح للعديد من تطبيقات الذكاء الاصطناعي:
وتتضمن التطبيقات الأخرى تشغيل محركات البحث الدلالي، وقيادة الأدوات التعليمية التفاعلية، وتمكين تحليل البيانات المتطورة من خلال واجهات اللغة الطبيعية.
من المفيد التفريق بين الهندسة السريعة والمصطلحات ذات الصلة:
وعلى الرغم من اختلاف هذه التقنيات، إلا أنها يمكن أن تكون مكملة لبعضها البعض. على سبيل المثال، قد يتم إثراء المطالبة الأساسية المصممة جيدًا بالبيانات المسترجعة تلقائيًا قبل معالجتها بواسطة نموذج مضبوط بدقة. غالبًا ما تدمج أطر مثل LangChain هذه الأساليب المختلفة.
تقليديًا أقل بروزًا في مجال الرؤية الحاسوبية (CV) مقارنةً بالبرمجة اللغوية العصبية، أصبحت هندسة المطالبة ذات أهمية متزايدة مع ظهور نماذج متعددة الوسائط وأنظمة الرؤية القابلة للمطالبة. يمكن أن تؤدي نماذج مثل CLIP أو YOLO أو YOLOE مهام مثل اكتشاف الأجسام أو تجزئة الصور بناءً على أوصاف نصية. تُعد صياغة مطالبات نصية فعالة (على سبيل المثال، "اكتشاف جميع 'السيارات الحمراء' وتجاهل 'الشاحنات'") شكلاً من أشكال هندسة المطالبات الحاسمة لتوجيه نماذج لغة الرؤية هذه. تعمل منصات مثل Ultralytics HUB على تسهيل التفاعل مع النماذج المختلفة، بما في ذلك Ultralytics YOLO مثل نماذج مثل YOLOv8 و YOLO11حيث يمكن أن يستفيد تحديد المهام من خلال الواجهات من المبادئ الهندسية السريعة، خاصةً مع اكتساب النماذج المزيد من القدرات التفاعلية.