مسرد المصطلحات

نمذجة اللغة

اكتشف كيف تعمل نمذجة اللغة على تشغيل تطبيقات البرمجة اللغوية العصبية والذكاء الاصطناعي مثل توليد النصوص والترجمة الآلية والتعرف على الكلام باستخدام تقنيات متقدمة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

النمذجة اللغوية هي مهمة أساسية في معالجة اللغة الطبيعية (NLP) والذكاء الاصطناعي (AI) تركز على التنبؤ باحتمالية حدوث تسلسل من الكلمات في لغة معينة. وهي تنطوي بشكل أساسي على بناء نماذج تفهم الأنماط الإحصائية والتراكيب النحوية للغة البشرية، مما يمكّن الآلات من معالجة وفهم وتوليد نص يشبه التواصل البشري. تتعلم هذه النماذج من كميات هائلة من البيانات النصية لالتقاط العلاقات بين الكلمات وأنماط استخدامها النموذجية.

كيف تعمل النمذجة اللغوية

يقوم نموذج اللغة في جوهره بتعيين احتمال لتسلسل من الكلمات. اعتمدت المقاربات المبكرة على أساليب إحصائية مثل ن-غرام، والتي تحسب احتمال كلمة ما بناءً على الكلمات "ن-1" السابقة. وعلى الرغم من بساطة هذه النماذج، إلا أنها تعاني في التقاط التبعيات بعيدة المدى في النص. تستخدم النمذجة اللغوية الحديثة بشكل كبير الشبكات العصبية (NN)، خاصةً البنى مثل الشبكات العصبية المتكررة (RNNs) ، ومؤخرًا المحولات. تستخدم المحولات، التي تم تقديمها في ورقة "الانتباه هو كل ما تحتاجه" ، آليات مثل الانتباه الذاتي لتقييم أهمية الكلمات المختلفة في تسلسل ما، بغض النظر عن المسافة بينها، مما يسمح بفهم أفضل بكثير للسياق. يتضمن تدريب هذه النماذج معالجة مجموعة كبيرة من النصوص، وتقسيم النص عن طريق الترميز، وتعلم التمثيلات(التضمينات) لهذه الرموز.

الملاءمة والتطبيقات

النمذجة اللغوية هي تقنية أساسية تدعم العديد من تطبيقات الذكاء الاصطناعي التي تتفاعل مع اللغة البشرية. كما أن قدرتها على التنبؤ بتسلسل الكلمات وفهمها تجعلها لا تقدر بثمن في مختلف المجالات.

تشمل التطبيقات الواقعية ما يلي:

  • النص التنبؤي والإكمال التلقائي: اقتراح الكلمة التالية أو إكمال الجمل في محركات البحث وعملاء البريد الإلكتروني ولوحات مفاتيح الهواتف الذكية.
  • الترجمة الآلية: تمكين خدمات مثل Google Translate من ترجمة النصوص بين اللغات المختلفة من خلال التنبؤ بالتسلسل الأكثر احتمالاً للكلمات في اللغة الهدف.
  • التعرف على الكلام: المساعدة في تحويل اللغة المنطوقة إلى نص من خلال التنبؤ بتسلسل الكلمات المحتمل بناءً على الإشارات الصوتية.
  • توليد النص: تشكيل الأساس لأدوات الكتابة الإبداعية، والتلخيص، وأنظمة الحوار، وروبوتات الدردشة مثل ChatGPT من OpenAI.
  • تحليل المشاعر: المساعدة في فهم المشاعر الأساسية (الإيجابية والسلبية والمحايدة) للنص من خلال تحليل اختيار الكلمات والسياق.
  • التصحيح النحوي: تحديد واقتراح تصحيحات للأخطاء النحوية في النص.

المفاهيم ذات الصلة

يتضمن فهم النمذجة اللغوية الإلمام بالمصطلحات ذات الصلة:

  • معالجة اللغة الطبيعية (NLP): النمذجة اللغوية هي مجال فرعي من مجال البرمجة اللغوية العصبية الأوسع نطاقًا، والذي يشمل مهام مختلفة مثل التعرف على الكيانات المسماة (NER)، ووضع علامات على أجزاء الكلام، والإجابة على الأسئلة. تستفيد العديد من مهام البرمجة اللغوية العصبية من نماذج اللغة.
  • نماذج اللغات الكبيرة (LLMs): وهي نماذج لغوية متطورة للغاية، مثل GPT-4، تتميز بحجمها الضخم (مليارات المعلمات) والتدريب على مجموعات بيانات هائلة(بيانات ضخمة). تُظهر نماذج LLMs قدرات ملحوظة في فهم وتوليد نصوص شبيهة بالنصوص البشرية للمهام المعقدة. تتوفر العديد من برمجيات LLMs المدربة مسبقًا عبر منصات مثل Hugging Face.
  • توليد النصوص: على الرغم من ارتباطه الوثيق، فإن توليد النص هو تطبيق لنمذجة اللغة. يوفر نموذج اللغة الاحتمالات لتسلسل الكلمات، وتستخدم عملية التوليد هذه الاحتمالات (غالبًا مع استراتيجيات أخذ العينات) لإنتاج نص جديد.
  • النماذج متعددة الوسائط: تدمج هذه النماذج فهم اللغة مع أنواع البيانات الأخرى، مثل الصور في الرؤية الحاسوبية. تتعلم النماذج مثل CLIP التمثيلات المشتركة للنصوص والصور، مما يتيح مهام مثل التعليق على الصور أو الإجابة على الأسئلة المرئية. استكشف منصةUltralytics HUB للحصول على أدوات لإدارة نماذج الذكاء الاصطناعي المختلفة ونشرها، بما في ذلك تلك التي يحتمل أن تدمج القدرات اللغوية.
قراءة الكل