مسرد المصطلحات

نموذج اللغة الكبير (LLM)

استكشف أساسيات نماذج اللغة الكبيرة (LLMs). تعرف على بنية Transformer، والترميز، وكيفية دمج نماذج اللغة الكبيرة مع Ultralytics .

نموذج اللغة الكبيرة (LLM) هو نوع متطور من الذكاء الاصطناعي (AI) الذي تم تدريبه على مجموعات بيانات ضخمة لفهم اللغة البشرية وتوليدها ومعالجتها. تمثل هذه النماذج تطوراً هاماً في التعلم العميق (DL)، حيث تستخدم شبكات عصبية بمليارات المعلمات لالتقاط الأنماط اللغوية المعقدة والقواعد النحوية والعلاقات الدلالية. في جوهرها، تعتمد معظم نماذج LLM الحديثة على بنية Transformer، التي تسمح لها بمعالجة تسلسلات البيانات بشكل متوازٍ بدلاً من معالجتها بشكل متسلسل. تستخدم هذه البنية آلية الانتباه الذاتي، مما يمكّن النموذج من تقييم أهمية الكلمات المختلفة في الجملة بالنسبة لبعضها البعض، بغض النظر عن المسافة بينها في النص.

الآليات الأساسية لـ LLM

تبدأ وظيفة LLM بالترميز، وهي عملية يتم فيها تقسيم النص الخام إلى وحدات أصغر تسمى الرموز (الكلمات أو الكلمات الفرعية). خلال مرحلة تدريب النموذج، يحلل النظام بيتابايت من النصوص من الإنترنت والكتب والمقالات. ويشارك في التعلم غير الخاضع للإشراف للتنبؤ بالرمز التالي في التسلسل، مما يؤدي إلى تعلم البنية الإحصائية للغة بشكل فعال.

بعد هذا التدريب الأولي، غالبًا ما يقوم المطورون بإجراء تعديلات دقيقة لتخصيص النموذج لمهام محددة، مثل التحليل الطبي أو المساعدة في الترميز. هذه القدرة على التكيف هي السبب في أن منظمات مثل مركز ستانفورد لأبحاث النماذج الأساسية classify "نماذج أساسية" — قواعد واسعة يتم بناء تطبيقات محددة عليها.

تطبيقات واقعية

لقد تجاوزت نماذج اللغة الكبيرة (LLMs) مرحلة البحث النظري لتصل إلى تطبيقات عملية عالية التأثير في مختلف الصناعات:

المساعدون الافتراضيون الأذكياء: تعتمد خدمة العملاء الحديثة بشكل كبير على روبوتات الدردشة التي تعمل بنظام LLM. على عكس الأنظمة القديمة القائمة على القواعد ، يمكن لهذه الوكالات التعامل مع الاستفسارات الدقيقة. لتحسين الدقة وتقليل الهلوسة، يقوم المطورون بدمج تقنية Retrieval Augmented Generation (RAG)، مما يسمح للنموذج بالرجوع إلى وثائق الشركة الخارجية المحدثة قبل الإجابة.
أنظمة الرؤية واللغة متعددة الوسائط: تربط حدود الذكاء الاصطناعي النص بالبيانات المرئية. تسمح نماذج الرؤية واللغة (VLMs) للمستخدمين بالبحث عن الصور باستخدام اللغة الطبيعية. على سبيل المثال، يتيح الجمع بين واجهة لغوية وكاشف قوي مثل YOLO26 للأنظمة تحديد ووصف الأشياء في موجزات الفيديو في الوقت الفعلي بناءً على الأوامر الصوتية.

ربط النص والرؤية بالرمز

بينما تعالج نماذج اللغة الكبيرة القياسية النصوص، تتجه الصناعة نحو الذكاء الاصطناعي متعدد الوسائط. يوضح المثال التالي كيف يمكن للمطالبات اللغوية التحكم في مهام الرؤية الحاسوبية باستخدام YOLO وهو نموذج يفهم واصفات النصوص للكشف عن المفردات المفتوحة.

from ultralytics import YOLOWorld

# Load a model capable of understanding natural language prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using text descriptions rather than fixed labels
model.set_classes(["person wearing a red helmet", "blue industrial machine"])

# Run inference to detect these specific text-defined objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

التمييز بين المفاهيم ذات الصلة

من المهم التمييز بين مصطلح LLM ومصطلحات أوسع أو موازية:

LLM مقابل معالجة اللغة الطبيعية (NLP): NLP هو المجال الأكاديمي الشامل الذي يهتم بالتفاعل بين أجهزة الكمبيوتر واللغة البشرية. LLM هو أداة أو تقنية محددة تستخدم في هذا المجال لتحقيق نتائج متطورة.
LLM مقابل الذكاء الاصطناعي التوليدي: الذكاء الاصطناعي التوليدي هو فئة تشمل أي ذكاء اصطناعي قادر على إنشاء محتوى جديد. LLMs هي مجموعة فرعية نصية من هذه الفئة، في حين أن نماذج مثل Stable Diffusion تمثل مجموعة فرعية لتوليد الصور .

التحديات والتوقعات المستقبلية

على الرغم من قدراتها، تواجه نماذج اللغة الكبيرة (LLMs) تحديات تتعلق بالتحيز في الذكاء الاصطناعي، حيث يمكنها أن تعيد إنتاج التحيزات الموجودة في بيانات التدريب الخاصة بها دون قصد. علاوة على ذلك، فإن القوة الحاسوبية الهائلة المطلوبة لتدريب نماذج مثل GPT-4 أو Google تثير مخاوف بشأن استهلاك الطاقة. تركز الأبحاث حاليًا على تكمية النماذج لجعل هذه الأنظمة فعالة بما يكفي لتشغيلها على أجهزة الحافة.

للحصول على رؤى تقنية أعمق، توفر الورقة الأصلية Attention Is All You Need النظرية الأساسية لـ Transformers. يمكنك أيضًا استكشاف كيفية عمل NVIDIA تقوم بتحسين الأجهزة لهذه الأحمال الضخمة.

نموذج اللغة الكبير (LLM)

تدريب نماذج Ultralytics YOLO لتبسيط سير العمل في مختلف الصناعات

حل ترخيص مرن للمؤسسات لدعم ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ مع Ultralytics YOLO

الآليات الأساسية لـ LLM

تطبيقات واقعية

ربط النص والرؤية بالرمز

التمييز بين المفاهيم ذات الصلة

التحديات والتوقعات المستقبلية

اقرأ المزيد في هذه الفئة

12 حالة استخدام للصور الجوية مدعومة بالرؤية الحاسوبية

ما هو تقدير العمق الأحادي العين؟ نظرة عامة

نظرة على استخدامYOLO Ultralytics YOLO للكشف عن التهديدات باستخدام الذكاء الاصطناعي

انضم إلى مجتمع Ultralytics