Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

إثراء الموجه

تعرف على كيفية قيام الإثراء الفوري بأتمتة زيادة المدخلات لتحسين دقة الذكاء الاصطناعي. اكتشف كيفية استخدام هذه التقنية مع Ultralytics للقيام بمهام رؤية أكثر ذكاءً.

الإثراء الفوري هو عملية آلية لتعزيز المدخلات الأولية للمستخدم بالسياق ذي الصلة أو التعليمات المحددة أو البيانات التكميلية قبل إرسالها إلى نموذج الذكاء الاصطناعي (AI). تعمل هذه التقنية كطبقة برمجية وسيطة ذكية تعمل على تحسين التفاعل بين البشر والآلات، مما يضمن تلقي نماذج اللغة الكبيرة (LLMs) وأنظمة الرؤية الحاسوبية استفسارات شاملة. من خلال إدخال التفاصيل التي قد يغفلها المستخدم — مثل التفضيلات التاريخية أو بيانات الموقع أو القيود التقنية — يعمل الإثراء الفوري على تحسين دقة وتخصيص مخرجات النموذج بشكل كبير دون الحاجة إلى أن يكون المستخدم خبيرًا في صياغة تعليمات مفصلة.

آلية التخصيب

تتمثل الوظيفة الأساسية للإثراء الفوري في سد الفجوة بين النية البشرية الغامضة والمدخلات الدقيقة والغنية بالبيانات التي تتطلبها النماذج لتحقيق الأداء الأمثل. عند تلقي استعلام، يقوم النظام بتحليله واسترداد المعلومات الأساسية الضرورية من رسم بياني معرفي أو قاعدة بيانات منظمة. يتم تنسيق البيانات المستردة برمجياً وإلحاقها بالاستعلام الأصلي.

على سبيل المثال، في عمليات معالجة اللغة الطبيعية (NLP) ، فإن سؤالًا بسيطًا مثل "ما هو الوضع؟" غير كافٍ من الناحية السياقية. يقوم نظام الإثراء بتحديد الجلسة النشطة، واسترداد أحدث رقم طلب من قاعدة بيانات المعاملات، وإعادة كتابة المطالبة إلى: "يسأل المستخدم عن الطلب رقم 998، الذي هو قيد النقل حاليًا. قدم تحديثًا للشحن بناءً على هذه الحالة." غالبًا ما تستخدم هذه العملية قواعد بيانات متجهة للعثور بسرعة على سياق ذي صلة من الناحية الدلالية لإدراجه.

تطبيقات واقعية

يعد الإثراء الفوري ضروريًا لنشر تطبيقات الذكاء الاصطناعي التوليدي القوية في مختلف الصناعات، وتعزيز الأنظمة القائمة على النصوص والرؤية:

  1. دعم العملاء المراعي للسياق: في مكاتب المساعدة الآلية، يستخدم روبوت الدردشة التخصيب للوصول إلى سجل مشتريات العميل وبيئته التقنية. بدلاً من سؤال المستخدم عن إصدار جهازه، يسترد النظام هذه المعلومات من بيانات التعريف الخاصة بالحساب ويضيفها إلى المطالبة. وهذا يسمح لوكيل الذكاء الاصطناعي بتقديم خطوات فورية لحل المشكلات الخاصة بالجهاز ، مما يحسن بشكل كبير تجربة العميل.
  2. تكوين الرؤية الحاسوبية الديناميكية: في عمليات الأمان، قد يقوم المستخدم ببساطة بتبديل إعداد "الوضع الليلي". وراء الكواليس، يقوم التخصيب الفوري بترجمة هذا القصد عالي المستوى إلى فئات كائنات محددة لمكشاف ذو مفردات مفتوحة مثل YOLO. يقوم النظام بتخصيص الموجه للبحث بشكل محدد عن "مصباح يدوي" أو "حركة مشبوهة" أو "شخص غير مصرح له"، مما يمكّن النموذج من تكييف تركيزه على اكتشاف الكائنات ديناميكيًا.

مثال: إثراء الفصل الديناميكي

ما يلي Python يوضح المثال مفهوم الإثراء الفوري باستخدام ال ultralytics الحزمة. هنا، يتم إثراء النية عالية المستوى للمستخدم برمجياً في قائمة من الفئات الوصفية المحددة التي يبحث عنها النموذج.

from ultralytics import YOLO


def run_enriched_inference(user_mode):
    """Enriches a simple user mode into specific detection prompts."""
    # Load a YOLO-World model capable of open-vocabulary detection
    model = YOLO("yolov8s-world.pt")

    # Enrichment Logic: Map simple user intent to detailed class prompts
    context_map = {
        "site_safety": ["hard hat", "safety vest", "gloves"],
        "traffic": ["car", "bus", "traffic light", "pedestrian"],
    }

    # Inject the enriched context into the model
    enriched_classes = context_map.get(user_mode, ["object"])
    model.set_classes(enriched_classes)

    # The model now looks for the specific enriched terms
    print(f"Mode: {user_mode} -> Enriched Prompt: {enriched_classes}")


run_enriched_inference("site_safety")

إثراء المطالبات مقابل المفاهيم ذات الصلة

لتنفيذ عمليات التعلم الآلي (MLOps)، من المفيد التمييز بين الإثراء الفوري والمصطلحات المشابهة:

  • الاسترجاع المعزز بالتوليد (RAG): RAG هي طريقة محددة للتخصيب. وهي تشير بشكل صارم إلى آلية جلب المستندات ذات الصلة من مجموعة خارجية لتأسيس استجابة النموذج. التخصيب هو مفهوم أوسع يشمل RAG ولكنه يغطي أيضًا إدخال بيانات الجلسة الثابتة أو بيانات تعريف المستخدم أو وقت النظام دون الحاجة إلى إجراء بحث دلالي معقد .
  • هندسة الموجه: هذه هي الحرفة اليدوية لتصميم موجهات فعالة. التخصيب هو عملية آلية تطبق مبادئ هندسة الموجهات مبادئ هندسة الموجهات ديناميكيًا في وقت التشغيل.
  • الضبط الفوري: هذا هو ضبط دقيق فعال للمعلمات (PEFT) حيث يتم تحسين "الموجهات اللينة" (الموتر القابل للتعلم) أثناء التدريب. التخصيب الموجه يحدث بالكامل أثناء الاستدلال في الوقت الحقيقي ولا يغير أوزان النموذج.
  • التعلّم من اللقطات القليلة: يتضمن ذلك يتضمن تقديم أمثلة ضمن المطالبة لتعليم النموذج مهمة ما. غالبًا ما تقوم أنظمة الإثراء بحقن هذه الأمثلة ذات اللقطات القليلة هذه بشكل ديناميكي بناءً على نوع المهمة، مما يجمع بين كلا المفهومين بشكل فعال.

الملاءمة في أنظمة الذكاء الاصطناعي الحديثة

مع زيادة قدرة نماذج مثل Ultralytics و GPT-4 ، غالبًا ما ينتقل العائق إلى جودة المدخلات. يقلل الإثراء الفوري من الهلوسة في نماذج اللغة الكبيرة (LLM) من خلال تأسيس النموذج على بيانات واقعية ومقدمة. في الرؤية الحاسوبية (CV)، تتيح هذه الميزة أنظمة كشف مرنة للتعلم بدون تدريب يمكنها التكيف مع البيئات الجديدة على الفور دون الحاجة إلى إعادة التدريب، وذلك ببساطة عن طريق تعديل المطالبات النصية التي يتم إدخالها في النظام. هذه المرونة ضرورية لبناء حلول ذكاء اصطناعي قابلة للتطوير ومتعددة الوسائط يمكنها التفكير في كل من النصوص والصور. غالبًا ما يعتمد المستخدمون الذين يسعون إلى إدارة مجموعات البيانات المستخدمة لتأسيس هذه الأنظمة على أدوات مثل Ultralytics لتنظيم معلوماتهم وتوضيحها بشكل فعال.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن