مسرد المصطلحات

التضمينات

تعرّف على ماهية التضمينات وكيف تعمل على تعزيز الذكاء الاصطناعي من خلال التقاط العلاقات الدلالية في البيانات من أجل معالجة اللغات الطبيعية والتوصيات والرؤية الحاسوبية.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

في مجال التعلّم الآلي والذكاء الاصطناعي، تُعد التضمينات تقنية قوية لتمثيل البيانات - مثل الكلمات أو الجمل أو الصور أو غيرها من العناصر - كمتجهات عددية كثيفة في فضاء متعدد الأبعاد. يتم تعلم هذا التحويل من البيانات، مما يسمح للخوارزميات بالتقاط المعنى الدلالي أو السياق أو خصائص المدخلات. الميزة الرئيسية هي أن العناصر المتشابهة يتم تعيينها إلى نقاط قريبة في "فضاء التضمين" هذا، مما يمكّن الآلات من فهم العلاقات والأنماط المعقدة بشكل أكثر فعالية من التمثيلات المتفرقة التقليدية.

ما هي التضمينات؟

التضمينات هي في الأساس عبارة عن تمثيلات متجهية كثيفة ومنخفضة الأبعاد وكثيفة للمتغيرات المنفصلة (مثل الكلمات) أو الأشياء المعقدة (مثل الصور). وعلى عكس طرق مثل الترميز الأحادي الذي ينشئ متجهات عالية الأبعاد ومتناثرة حيث يكون كل عنصر مستقل، فإن التضمينات تلتقط العلاقات الدقيقة. على سبيل المثال، في تضمين الكلمات، فإن الكلمات ذات المعاني المتشابهة أو المستخدمة في سياقات متشابهة، مثل "كلب" و"جرو"، سيكون لها متجهات متقاربة رياضيًا (على سبيل المثال، باستخدام تشابه جيب التمام). يعكس هذا التقارب في فضاء التضمين التشابه الدلالي. تتألف هذه المتجهات عادةً من أرقام حقيقية ويمكن أن تتراوح أبعادها من عشرات إلى آلاف الأبعاد، اعتمادًا على مدى تعقيد البيانات والنموذج.

كيف تعمل التضمينات

وعادةً ما يتم إنشاء التضمينات باستخدام نماذج الشبكات العصبية (NN) المدربة على مجموعات بيانات كبيرة. على سبيل المثال، تتضمن إحدى التقنيات الشائعة لتضمين الكلمات تدريب نموذج للتنبؤ بكلمة ما بناءً على الكلمات المحيطة بها (سياقها) داخل الجمل. أثناء عملية التدريب هذه، تقوم الشبكة بتعديل بارامتراتها الداخلية، بما في ذلك متجهات التضمين لكل كلمة، لتقليل أخطاء التنبؤ. تُشفّر المتجهات الناتجة ضمنيًا المعلومات النحوية والدلالية المستفادة من مجموعة النصوص الضخمة. ويُعد عدد الأبعاد في فضاء التضمين معيارًا بالغ الأهمية يؤثر على قدرة النموذج على التقاط التفاصيل مقابل تكلفته الحسابية. غالبًا ما يتطلب تصور هذه المساحات عالية الأبعاد تقنيات تقليل الأبعاد مثل t-SNE أو PCA، والتي يمكن عرضها باستخدام أدوات مثل TensorFlow Projector.

تطبيقات التضمينات

التضمينات أساسية للعديد من تطبيقات الذكاء الاصطناعي الحديثة:

  • معالجة اللغات الطبيعية (NLP): تدعم تضمينات الكلمات والجمل مهام مثل تحليل المشاعر والترجمة الآلية وتصنيف النصوص. فهي تسمح للنماذج بفهم التماثلات (على سبيل المثال، "ملك" - "رجل" + "امرأة" ≈ "ملكة") من خلال إجراء العمليات الحسابية المتجهة. تشمل النماذج الكلاسيكية Word2Vec و GloVe، في حين أن النماذج الحديثة مثل BERT تولد تضمينات تعتمد على السياق باستخدام بنيات المحولات.
  • أنظمة التوصيات: يتم تضمين المستخدمين والعناصر (مثل الأفلام أو المنتجات) في نفس المساحة. يتم تقديم التوصيات من خلال العثور على العناصر التي تكون تضميناتها قريبة من تضمين المستخدم، مما يعكس تفضيلاته. تعتمد شركات مثل Netflix بشكل كبير على تقنيات التضمين.
  • الرؤية الحاسوبية (CV): يمكن تحويل الصور أو رقع الصور إلى تضمينات لمهام مثل استرجاع الصور (العثور على صور متشابهة بصريًا) أو التجميع. نماذج مثل Ultralytics YOLO يمكن استخدامها ليس فقط لاكتشاف الأجسام أو تجزئة الصور، ولكن يمكن أيضًا استخدام طبقاتها الداخلية كمستخرجات ميزات قوية لتوليد تضمينات تمثل محتوى الصورة.

التضمينات مقابل تقنيات التمثيل الأخرى

تقدم التضمينات مزايا على طرق التمثيل الأبسط:

  • ترميز واحد ساخن: يمثل الفئات كمتجهات ثنائية متناثرة. هذه المتجهات متعامدة (متباينة) ولا تلتقط أي علاقات دلالية بين الفئات. تنمو الأبعاد أيضًا بشكل خطي مع عدد العناصر الفريدة، وتصبح غير فعالة بالنسبة للمفردات الكبيرة.
  • حقيبة الكلمات (BoW): يمثل النص بناءً على تكرار الكلمات، مع تجاهل القواعد النحوية وترتيب الكلمات. على الرغم من بساطته، إلا أنه يفشل في التقاط المعنى الدلالي بشكل فعال مقارنةً بالتضمينات.
  • TF(تردد المصطلح-تردد المستند العكسي): يقوم بترجيح الكلمات بناءً على تكرارها في مستند ما مقارنةً بتكرارها في مجموعة من المستندات. وهو يقيس أهمية الكلمات ولكنه لا يقيس بطبيعته التشابه الدلالي مثل التضمينات.

استنتاج

تمثل التضمينات تقدمًا كبيرًا في كيفية معالجة الآلات للبيانات المعقدة وفهمها. فمن خلال تعيين العناصر إلى تمثيلات متجهات ذات معنى، فإنها تتيح إجراء تحليلات معقدة وتشغيل مجموعة واسعة من تطبيقات الذكاء الاصطناعي، خاصة في معالجة اللغات الطبيعية وأنظمة التوصيات. ومع استمرار تطور النماذج وتقنيات التدريب، من المرجح أن تصبح التضمينات أكثر أهمية في بناء الأنظمة الذكية. تعمل المنصات مثل Ultralytics HUB على تسهيل تدريب ونشر النماذج التي تعتمد غالباً على هذه التمثيلات القوية، مما يجعل الذكاء الاصطناعي المتقدم أكثر سهولة. لمزيد من التعلم، استكشف وثائقUltralytics .

قراءة الكل