اكتشف كيف تعمل نماذج اللغات الكبيرة (LLMs) على إحداث ثورة في الذكاء الاصطناعي من خلال البرمجة اللغوية العصبية المتقدمة، وتشغيل روبوتات الدردشة الآلية، وإنشاء المحتوى، وغير ذلك الكثير. تعلّم المفاهيم الأساسية!
تمثل النماذج اللغوية الكبيرة (LLMs) تقدمًا كبيرًا في مجال الذكاء الاصطناعي، لا سيما في مجال معالجة اللغات الطبيعية (NLP). وتتميز هذه النماذج بحجمها الهائل، وغالبًا ما تحتوي على مليارات المعلمات، ويتم تدريبها على مجموعات بيانات ضخمة تضم نصوصًا ورموزًا. ويتيح هذا التدريب المكثف لنماذج التعلم العميق للغة الطبيعية فهم السياق، وتوليد نصوص متماسكة وشبيهة بالبشر، وترجمة اللغات، والإجابة على الأسئلة، وأداء مجموعة واسعة من المهام اللغوية بإتقان ملحوظ. وهي نوع محدد من نماذج التعلُّم العميق (DL) ، وهي تقود الابتكار في العديد من التطبيقات وتشكل حجر الزاوية في الذكاء الاصطناعي التوليدي الحديث.
إن نموذج اللغة الكبير هو في الأساس شبكة عصبية متطورة (NN)، تعتمد عادةً على بنية المحولات، والتي تم تقديمها في الورقة البحثية المؤثرة"الانتباه هو كل ما تحتاجه". تشير كلمة "كبير" في LLM إلى العدد الضخم من المتغيرات - المتغيراتالتي يتم تعديلها أثناء التدريب - والتي يمكن أن تتراوح بين المليارات وحتى التريليونات. بشكل عام، يسمح عدد المعلمات الأعلى للنموذج بتعلم أنماط أكثر تعقيدًا من البيانات.
تتعلم هذه الأنماط من خلال التعلّم غير الخاضع للإشراف على مجموعات نصية ضخمة تم جمعها من الإنترنت والكتب والمصادر الأخرى، وغالبًا ما يشار إليها باسم البيانات الضخمة. وتساعدهم هذه العملية على فهم القواعد والحقائق والقدرات المنطقية وحتى الفروق الدقيقة مثل النبرة والأسلوب، على الرغم من أنها يمكن أن تقودهم أيضًا إلى تعلم التحيزات الموجودة في بيانات التدريب. القدرة الأساسية التي يتم تطويرها أثناء التدريب هي التنبؤ بالكلمات اللاحقة في الجملة. وتشكل هذه القدرة التنبؤية أساسًا لمهام أكثر تعقيدًا مثل توليد النصوص، ونمذجة اللغة، والإجابة على الأسئلة.
تشمل الأمثلة المعروفة سلسلة GPT من OpenAI (مثل GPT-4)، ونماذج لاما من Meta AI مثل لاما 3، و Gemini من Google DeepMind، و Claude من Anthropic.
إن تعدد استخدامات الآليات متعددة الاستخدامات يسمح بتطبيقها في مجالات متنوعة. وفيما يلي مثالان ملموسان:
ينطوي فهم آليات إدارة الأراضي المنخفضة والمتوسطة على الإلمام بالعديد من المفاهيم ذات الصلة:
في حين تتفوق نماذج LLMs في المهام اللغوية، إلا أنها تختلف بشكل كبير عن النماذج المصممة أساسًا للرؤية الحاسوبية (CV). نماذج السيرة الذاتية، مثل Ultralytics YOLO (على سبيل المثال YOLOv8و YOLOv9، و YOLOv10، و YOLO11)، وهي نماذج متخصصة في تفسير المعلومات المرئية من الصور أو مقاطع الفيديو. تشمل مهامها اكتشاف الأشياء، وتصنيف الصور، وتجزئة النماذج.
ومع ذلك، فإن الحدود غير واضحة مع ظهور النماذج متعددة الوسائط ونماذج لغة الرؤية (VLMs). تدمج هذه النماذج، مثل GPT-4o من OpenAI أو Gemini من Google الفهم عبر طرائق مختلفة (مثل النصوص والصور)، مما يتيح مهام مثل وصف الصور أو الإجابة عن أسئلة حول المحتوى المرئي.
توفر منصات مثل Ultralytics HUB أدوات وبنية تحتية لتدريب ونشر نماذج الذكاء الاصطناعي المختلفة، بما في ذلك تلك الخاصة بمهام الرؤية، مما يسهل تطوير تطبيقات الذكاء الاصطناعي المتنوعة. ومع ازدياد قوة نماذج الذكاء الاصطناعي ونماذج الذكاء الاصطناعي الأخرى، تزداد أهمية الاعتبارات المتعلقة بأخلاقيات الذكاء الاصطناعي والتحيز الخوارزمي وخصوصية البيانات. للمزيد من المعلومات حول مفاهيم الذكاء الاصطناعي ومقارنات النماذج، استكشف صفحات توثيقUltralytics وصفحات مقارنة النماذج.