Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

هندسة الموجه

إتقان هندسة المطالبات السريعة للذكاء الاصطناعي والرؤية الحاسوبية. تعلم كيفية تحسين المدخلات لنماذج LLMs والنماذج متعددة الوسائط مثل Ultralytics لتحقيق نتائج فائقة.

الهندسة السريعة هي العملية الاستراتيجية لتصميم النص المدخل وتحسينه وتحسينه لتوجيه نماذج الذكاء الاصطناعي (AI) نحو إنتاج مخرجات دقيقة وذات صلة وعالية الجودة. اكتسبت شهرة في البداية مع ظهور نماذج اللغة الكبيرة (LLMs) مثل GPT-4، تطورت هذه التخصص إلى مهارة أساسية للتفاعل مع أنظمة الذكاء الاصطناعي التوليدي عبر طرق مختلفة، بما في ذلك النص والصورة والفيديو. بدلاً من تغيير أوزان النموذج الأساسية من خلال إعادة التدريب، تستفيد هندسة المطالبات من المعرفة الحالية للنموذج من خلال صياغة المهمة بطريقة يمكن للنظام فهمها على أفضل وجه، مما يسد الفجوة بين نية الإنسان وتنفيذ الآلة.

آليات التوجيه الفعال

يعتمد الهندسة السريعة في جوهرها على فهم كيفية معالجة النماذج الأساسية للسياق والتعليمات. تقلل المطالبة المصممة جيدًا من الغموض من خلال توفير قيود واضحة وتنسيقات الإخراج المطلوبة (مثل JSON أو Markdown) والمعلومات الأساسية ذات الصلة . يستخدم الممارسون المتقدمون تقنيات مثل التعلم السريع، حيث يقدم المستخدم بعض الأمثلة على أزواج الإدخال والإخراج داخل المطالبة لإظهار النمط المطلوب.

هناك استراتيجية أخرى فعالة وهي تحفيز سلسلة الأفكار، والتي تشجع النموذج على تقسيم مهام الاستدلال المعقدة إلى خطوات وسيطة. وهذا يحسن بشكل كبير الأداء في الاستفسارات التي تتطلب الكثير من المنطق. علاوة على ذلك، فإن تحسين استخدام نافذة السياق— الحد الأقصى لكمية النص الذي يمكن للنموذج معالجته في المرة الواحدة — أمر بالغ الأهمية للحفاظ على التماسك في التفاعلات الطويلة. تؤكد الموارد الخارجية، مثل دليل OpenAI حول تصميم المطالبات، على أهمية التحسين المتكرر للتعامل مع الحالات الاستثنائية بفعالية.

الأهمية في رؤية الكمبيوتر

على الرغم من ارتباطه غالبًا بالنصوص، إلا أن هندسة المطالبات أصبحت ذات أهمية متزايدة في الرؤية الحاسوبية (CV). تتيح النماذج الحديثة متعددة الوسائط وأجهزة الكشف ذات المفردات المفتوحة، مثل YOLO للمستخدمين تحديد أهداف الكشف باستخدام معالجة اللغة الطبيعية (NLP) بدلاً من معرّفات الفئات الرقمية المحددة مسبقًا.

في هذا السياق، "الموجه" هو وصف نصي للكائن (على سبيل المثال، "شخص يرتدي خوذة حمراء "). هذه القدرة، المعروفة باسم التعلم بدون تدريب، تمكن الأنظمة من detect الكائنات التي لم يتم تدريبها عليها بشكل صريح من خلال الاستفادة من الارتباطات المكتسبة بين السمات البصرية والتضمينات الدلالية . بالنسبة لبيئات الإنتاج عالية السرعة حيث تكون الفئات ثابتة، قد ينتقل المطورون في النهاية من النماذج الموجهة إلى نماذج فعالة ومُعاد تدريبها مثل YOLO26، ولكن هندسة الموجهات تظل هي المفتاح إلى النماذج الأولية السريعة والمرونة.

تطبيقات واقعية

تساهم الهندسة السريعة في زيادة القيمة في مختلف الصناعات من خلال تمكين الأتمتة المرنة والذكية:

  • التحليلات المرئية الدين track يكية: في الذكاء الاصطناعي في مجال البيع بالتجزئة، يستخدم مديرو المتاجر نماذج رؤية قائمة على المطالبات للبحث عن عناصر محددة دون تدخل تقني. يمكن مطالبة النظام بتتبع "الرفوف الفارغة" في يوم ما و"المنتجات الموضوعة في غير مكانها" في اليوم التالي. تتيح هذه المرونة للشركات تكييف أنظمة الكشف عن الأشياء لديها مع الاتجاهات الموسمية على الفور.
  • إنشاء المحتوى الآلي: تعتمد فرق التسويق على توجيهات مفصلة لتوجيه مولدات النص إلى الصورة مثل Stable Diffusion أو Midjourney. من خلال هندسة التوجيهات التي تحدد الإضاءة والأسلوب الفني والتكوين، يمكن للمصممين إنشاء أصول بصرية بسرعة.
  • الاسترجاع الذكي للمعرفة: في مجال دعم العملاء، يصمم المهندسون "مطالبات النظام" التي توجه روبوتات الدردشة للرد على الاستفسارات باستخدام بيانات الشركة التي تم التحقق منها فقط. هذا هو أحد المكونات الرئيسية لـ الاسترجاع المعزز بالتوليد (RAG)، مما يضمن أن تحافظ الذكاء الاصطناعي على شخصية مفيدة مع تجنب الهلوسة في نماذج اللغة الكبيرة (LLMs).

التنفيذ باستخدام Ultralytics

يوضح المثال التالي كيف يتم تطبيق الهندسة السريعة برمجيًا باستخدام ultralytics الحزمة. هنا، نستخدم نموذج YOLO الذي يقبل المطالبات النصية لتحديد الكائنات التي يجب البحث عنها ديناميكيًا، على عكس النماذج القياسية مثل يولو26 التي تستخدم قوائم فصول ثابتة.

from ultralytics import YOLO

# Load a YOLO-World model capable of interpreting text prompts
model = YOLO("yolov8s-world.pt")

# Apply prompt engineering to define custom classes dynamically
# The model maps these text descriptions to visual features
model.set_classes(["person in safety vest", "forklift", "blue hardhat"])

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results - the model only detects objects matching the prompts
results[0].show()

التمييز بين المفاهيم ذات الصلة

من أجل نشر حلول الذكاء الاصطناعي بفعالية عبر Ultralytics من المهم التمييز بين الهندسة السريعة وتقنيات التحسين المماثلة:

  • هندسة المطالبات مقابل ضبط المطالبات: تتضمن هندسة المطالبات صياغة مدخلات اللغة الطبيعية يدويًا. في المقابل، ضبط المطالبات هو طريقة ضبط دقيق فعال من حيث المعلمات (PEFT) تتعلم "المطالبات الناعمة" (تضمينات متجهة مستمرة) خلال مرحلة التدريب. هذه المطالبات الناعمة هي تحسينات رياضية غير مرئية للمستخدم البشري.
  • الهندسة السريعة مقابل الضبط الدقيق: يعمل الضبط الدقيق على تحديث أوزان النموذج بشكل دائم باستخدام مجموعة بيانات تدريب محددة لتخصيصه لمهمة معينة. لا تغير الهندسة السريعة النموذج نفسه؛ بل تعمل فقط على تحسين المدخلات أثناء الاستدلال في الوقت الفعلي.
  • الهندسة السريعة مقابل الحقن السريع: في حين أن الهندسة بناءة، فإن الحقن السريع هو ثغرة أمنية حيث تتلاعب المدخلات الخبيثة بالنموذج لتجاهل قيود الأمان الخاصة به. يتطلب ضمان سلامة الذكاء الاصطناعي دفاعًا قويًا ضد مثل هذه المطالبات العدائية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن