إتقان هندسة المطالبات السريعة للذكاء الاصطناعي والرؤية الحاسوبية. تعلم كيفية تحسين المدخلات لنماذج LLMs والنماذج متعددة الوسائط مثل Ultralytics لتحقيق نتائج فائقة.
الهندسة السريعة هي العملية الاستراتيجية لتصميم النص المدخل وتحسينه وتحسينه لتوجيه نماذج الذكاء الاصطناعي (AI) نحو إنتاج مخرجات دقيقة وذات صلة وعالية الجودة. اكتسبت شهرة في البداية مع ظهور نماذج اللغة الكبيرة (LLMs) مثل GPT-4، تطورت هذه التخصص إلى مهارة أساسية للتفاعل مع أنظمة الذكاء الاصطناعي التوليدي عبر طرق مختلفة، بما في ذلك النص والصورة والفيديو. بدلاً من تغيير أوزان النموذج الأساسية من خلال إعادة التدريب، تستفيد هندسة المطالبات من المعرفة الحالية للنموذج من خلال صياغة المهمة بطريقة يمكن للنظام فهمها على أفضل وجه، مما يسد الفجوة بين نية الإنسان وتنفيذ الآلة.
يعتمد الهندسة السريعة في جوهرها على فهم كيفية معالجة النماذج الأساسية للسياق والتعليمات. تقلل المطالبة المصممة جيدًا من الغموض من خلال توفير قيود واضحة وتنسيقات الإخراج المطلوبة (مثل JSON أو Markdown) والمعلومات الأساسية ذات الصلة . يستخدم الممارسون المتقدمون تقنيات مثل التعلم السريع، حيث يقدم المستخدم بعض الأمثلة على أزواج الإدخال والإخراج داخل المطالبة لإظهار النمط المطلوب.
هناك استراتيجية أخرى فعالة وهي تحفيز سلسلة الأفكار، والتي تشجع النموذج على تقسيم مهام الاستدلال المعقدة إلى خطوات وسيطة. وهذا يحسن بشكل كبير الأداء في الاستفسارات التي تتطلب الكثير من المنطق. علاوة على ذلك، فإن تحسين استخدام نافذة السياق— الحد الأقصى لكمية النص الذي يمكن للنموذج معالجته في المرة الواحدة — أمر بالغ الأهمية للحفاظ على التماسك في التفاعلات الطويلة. تؤكد الموارد الخارجية، مثل دليل OpenAI حول تصميم المطالبات، على أهمية التحسين المتكرر للتعامل مع الحالات الاستثنائية بفعالية.
على الرغم من ارتباطه غالبًا بالنصوص، إلا أن هندسة المطالبات أصبحت ذات أهمية متزايدة في الرؤية الحاسوبية (CV). تتيح النماذج الحديثة متعددة الوسائط وأجهزة الكشف ذات المفردات المفتوحة، مثل YOLO للمستخدمين تحديد أهداف الكشف باستخدام معالجة اللغة الطبيعية (NLP) بدلاً من معرّفات الفئات الرقمية المحددة مسبقًا.
في هذا السياق، "الموجه" هو وصف نصي للكائن (على سبيل المثال، "شخص يرتدي خوذة حمراء "). هذه القدرة، المعروفة باسم التعلم بدون تدريب، تمكن الأنظمة من detect الكائنات التي لم يتم تدريبها عليها بشكل صريح من خلال الاستفادة من الارتباطات المكتسبة بين السمات البصرية والتضمينات الدلالية . بالنسبة لبيئات الإنتاج عالية السرعة حيث تكون الفئات ثابتة، قد ينتقل المطورون في النهاية من النماذج الموجهة إلى نماذج فعالة ومُعاد تدريبها مثل YOLO26، ولكن هندسة الموجهات تظل هي المفتاح إلى النماذج الأولية السريعة والمرونة.
تساهم الهندسة السريعة في زيادة القيمة في مختلف الصناعات من خلال تمكين الأتمتة المرنة والذكية:
يوضح المثال التالي كيف يتم تطبيق الهندسة السريعة برمجيًا باستخدام
ultralytics الحزمة. هنا، نستخدم نموذج YOLO الذي يقبل المطالبات النصية لتحديد الكائنات التي يجب
البحث عنها ديناميكيًا، على عكس النماذج القياسية مثل
يولو26 التي تستخدم قوائم فصول ثابتة.
from ultralytics import YOLO
# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolov8s-world.pt")
# Apply prompt engineering to define custom classes dynamically
# The model maps these text descriptions to visual features
model.set_classes(["person in safety vest", "forklift", "blue hardhat"])
# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Show results - the model only detects objects matching the prompts
results[0].show()
من أجل نشر حلول الذكاء الاصطناعي بفعالية عبر Ultralytics من المهم التمييز بين الهندسة السريعة وتقنيات التحسين المماثلة: