مسرد المصطلحات

نموذج اللغة الكبيرة (LLM)

اكتشف كيف تعمل نماذج اللغات الكبيرة (LLMs) على إحداث ثورة في الذكاء الاصطناعي من خلال البرمجة اللغوية العصبية المتقدمة، وتشغيل روبوتات الدردشة الآلية، وإنشاء المحتوى، وغير ذلك الكثير. تعلّم المفاهيم الأساسية!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تمثل النماذج اللغوية الكبيرة (LLMs) تقدمًا كبيرًا في مجال الذكاء الاصطناعي، لا سيما في مجال معالجة اللغات الطبيعية (NLP). وتتميز هذه النماذج بحجمها الهائل، وغالبًا ما تحتوي على مليارات المعلمات، ويتم تدريبها على مجموعات بيانات ضخمة تضم نصوصًا ورموزًا. ويتيح هذا التدريب المكثف لنماذج التعلم العميق للغة الطبيعية فهم السياق، وتوليد نصوص متماسكة وشبيهة بالبشر، وترجمة اللغات، والإجابة على الأسئلة، وأداء مجموعة واسعة من المهام اللغوية بإتقان ملحوظ. إنها نوع محدد من نماذج التعلُّم العميق (DL) ، وهي تقود الابتكار في العديد من التطبيقات.

التعريف

النموذج اللغوي الكبير هو في الأساس شبكة عصبية متطورة (NN)، تعتمد عادةً على بنية المحول. تشير كلمة "كبير" في نموذج اللغة الكبيرة إلى العدد الضخم من المتغيرات - المتغيرات التي يتم تعديلها أثناء التدريب - والتي يمكن أن تتراوح بين المليارات والتريليونات. يسمح المزيد من المعلمات عمومًا للنموذج بتعلم أنماط أكثر تعقيدًا من البيانات. تتعلم نماذج LLM هذه الأنماط من خلال التعلّم غير الخاضع للإشراف على مجموعات نصية ضخمة تم جمعها من الإنترنت والكتب ومصادر أخرى. تساعدهم هذه العملية على فهم القواعد والحقائق والقدرات المنطقية وحتى التحيزات الموجودة في البيانات. وتشمل القدرات الأساسية التنبؤ بالكلمات اللاحقة في الجملة، والتي تشكل الأساس لمهام مثل توليد النصوص والإجابة على الأسئلة. وتشمل الأمثلة المعروفة سلسلة GPT من OpenAI مثل GPT-4، ونماذج لاما من Meta AI مثل لاما 3، وجيميني من Google DeepMind، وكلود من Anthropic.

التطبيقات

إن تعدد استخدامات الآليات متعددة الاستخدامات يسمح بتطبيقها في مجالات متنوعة. وفيما يلي مثالان ملموسان:

  • الذكاء الاصطناعي التحادثي: تشغل روبوتات الدردشة الآلية المتطورة والمساعدات الافتراضية مثل ChatGPT ومساعد Google مما يتيح تفاعلات أكثر طبيعية ومراعية للسياق مقارنةً بالأنظمة القديمة القائمة على القواعد. ويمكنها التعامل مع استفسارات خدمة العملاء وتقديم المعلومات والدخول في حوارات معقدة.
  • إنشاء المحتوى وتلخيصه: تستخدم الشركات والأفراد أدوات LLMs لإنشاء نسخ تسويقية، وكتابة المقالات، وإنشاء مقتطفات التعليمات البرمجية، وتلخيص المستندات المطولة(تلخيص النص). أدوات مثل Microsoft Copilot تدمج أدوات مثل Microsoft Copilot في أدوات LLMs لمساعدة المستخدمين في مختلف مهام الكتابة والترميز.

المفاهيم الرئيسية

ينطوي فهم آليات إدارة الأراضي المنخفضة والمتوسطة على الإلمام بالعديد من المفاهيم ذات الصلة:

  • نماذج التأسيس: تُعتبر نماذج LLMs نوعًا من النماذج التأسيسية، بمعنى أنها نماذج كبيرة تم تدريبها على بيانات واسعة يمكن تكييفها(ضبطها) لمختلف المهام النهائية.
  • آليات الانتباه: من الأمور الحاسمة في بنية المحولات، يسمح الانتباه للنموذج بتقييم أهمية الكلمات المختلفة في تسلسل المدخلات عند توليد المخرجات، مما يتيح التعامل بشكل أفضل مع التبعيات بعيدة المدى والسياق. الورقة البحثية الأساسية التي تقدم ذلك هي"الانتباه هو كل ما تحتاجه".
  • هندسة موجه: هي ممارسة تصميم مدخلات (موجهات) فعالة لتوجيه النموذج نحو توليد المخرجات المطلوبة. تؤثر جودة الموجه بشكل كبير على استجابة النموذج.
  • الترميز: تعالج الآلات ذات المحاكاة القابلة للتحويل إلى رموز (كلمات أو كلمات فرعية أو أحرف). تؤثر طريقة ترميز النص على أداء النموذج والتكلفة الحسابية.

بينما تتفوق النماذج اللغوية اللغوية متعددة الوسائط في المهام اللغوية، إلا أنها تختلف عن النماذج المصممة أساساً للرؤية الحاسوبية، مثل نماذج Ultralytics YOLO المستخدمة في اكتشاف الأجسام. ومع ذلك، فإن ظهور النماذج متعددة الوسائط ونماذج لغة الرؤية يعمل على سد هذه الفجوة، ويجمع بين فهم اللغة والمعالجة البصرية. تعمل منصات مثل Ultralytics HUB على تسهيل تدريب ونشر نماذج الذكاء الاصطناعي المختلفة، بما في ذلك تلك الخاصة بمهام الرؤية.

قراءة الكل