Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التضمينات (Embeddings)

اكتشف كيف تربط التضمينات بين البيانات البشرية ومنطق الآلة. تعلم كيفية إنشاء تمثيلات متجهة لمهام الذكاء الاصطناعي باستخدام Ultralytics واستكشف Ultralytics .

التضمينات هي تمثيلات متواصلة كثيفة ومنخفضة الأبعاد للمتغيرات المنفصلة، وتستخدم كـ مترجم أساسي بين البيانات البشرية ومنطق الآلة. في مجال الذكاء الاصطناعي (AI)، لا تستطيع أجهزة الكمبيوتر فهم البيانات الفوضوية وغير المنظمة مثل النصوص أو الصور أو الصوت بشكل بديهي. تحل التضمينات هذه المشكلة عن طريق تحويل هذه المدخلات إلى قوائم من الأرقام الحقيقية، المعروفة باسم المتجهات، والتي توجد في فضاء رياضي عالي الأبعاد. على عكس الترميزات التقليدية التي قد تخصص معرفًا عشوائيًا لكائن ما، يتم تعلم التضمينات من خلال التدريب، مما يضمن أن العناصر المتشابهة من الناحية الدلالية — مثل الكلمتين "ملك" و "ملكة"، أو صورتين لقطتين مختلفتين — يتم وضعها بالقرب من بعضها البعض في الفضاء المتجه.

كيف تعمل التضمينات

يتضمن إنشاء التضمين إدخال البيانات الأولية في شبكة عصبية مصممة لاستخراج الميزات. أثناء التدريب، يتعلم النموذج ضغط الخصائص الأساسية للمدخلات في شكل رقمي مضغوط. على سبيل المثال، لا يرى نموذج الرؤية الحاسوبية (CV) الذي يحلل صورة فوتوغرافية البكسلات فحسب، بل يرسم الأشكال والأنسجة والألوان في إحداثيات محددة في رسم بياني متعدد الأبعاد. عند قياس التشابه، تحسب الأنظمة المسافة بين هذه الإحداثيات باستخدام مقاييس مثل تشابه جيب التمام أو المسافة الأوقليدية. تسمح هذه القرب الرياضي للخوارزميات بأداء مهام معقدة مثل التصنيف والتجميع بكفاءة عالية.

تطبيقات واقعية

تعمل التضمينات بمثابة محرك للعديد من الميزات الذكية المستخدمة في منتجات البرمجيات الحديثة.

  • البحث الدلالي: غالبًا ما تعتمد محركات البحث التقليدية على مطابقة الكلمات الرئيسية بالضبط، وهو ما يفشل إذا استعلم المستخدم عن "سيارة" ولكن الوثيقة تحتوي على "سيارة". تلتقط عمليات التضمين المعنى وراء الكلمات. من خلال تمثيل استعلام البحث ووثائق قاعدة البيانات كمتجهات، يمكن للنظام استرداد النتائج التي تتطابق مع نية المستخدم، حتى إذا اختلفت الكلمات المحددة.
  • أنظمة التوصية: تستخدم خدمات البث ومواقع التجارة الإلكترونية التضمينات لتخصيص تجارب المستخدمين. إذا شاهد مستخدم فيلم خيال علمي، يحدد النظام متجه تضمين ذلك الفيلم ويبحث عن أفلام أخرى ذات متجهات قريبة في قاعدة البيانات. وهذا يسمح بتقديم اقتراحات دقيقة بناءً على تشابه المحتوى بدلاً من مجرد العلامات أو الفئات اليدوية.
  • التعلم بدون تدريب: تستخدم النماذج المتقدمة التضمينات المشتركة لربط طرق مختلفة، مثل النص والصور. وهذا يمكّن النظام من التعرف على الأشياء التي لم يرها بشكل صريح أثناء التدريب من خلال ربط تضمين الصورة بتضمين النص لاسم الشيء.

إنشاء التضمينات باستخدام Python

نماذج حديثة مثل يولو26 يمكن استخدامها لتوليد تضمينات صور قوية بكفاءة. يوضح المثال التالي كيفية استخراج متجه ميزة من صورة باستخدام ultralytics حزمة Python .

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate embeddings for an image
# The embed() method returns the feature vector representing the image content
embedding_vector = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding (e.g., a vector of length 1280)
print(f"Embedding shape: {embedding_vector[0].shape}")

التضمينات مقابل المفاهيم ذات الصلة

لتنفيذ حلول الذكاء الاصطناعي بفعالية، من المفيد التمييز بين التضمينات والمصطلحات التقنية الوثيقة الصلة بها.

  • التضمين مقابل البحث المتجه: التضمين هو تمثيل البيانات نفسه (قائمة الأرقام). البحث المتجه هو العملية اللاحقة الاستعلام عن قاعدة البيانات للعثور على أقرب الجيران إلى هذا التضمين. غالبًا ما تُستخدم أدوات متخصصة تُعرف باسم قاعدة البيانات المتجهة لتخزين البحث عن هذه التضمينات على نطاق واسع.
  • التضمين مقابل الترميز: في معالجة اللغة الطبيعية (NLP)، الترميز هو الخطوة الأولية لتقسيم النص إلى أجزاء أصغر (رموز). ثم يتم تعيين هذه الرموز إلى التضمينات. لذلك، الترميز يقوم بإعداد البيانات، بينما التضمينات تمثل معنى البيانات.
  • التضمينات مقابل التعلم العميق: التعلم العميق هو مجال أوسع من مجالات التعلم الآلي يعتمد على الشبكات العصبية. التضمينات هي ناتج أو طبقة محددة ضمن بنية التعلم العميق، وغالبًا ما تعمل كجسر بين المدخلات الأولية وطبقات اتخاذ القرار في النموذج.

يمكن للمطورين الذين يرغبون في إدارة دورة حياة مجموعات البيانات الخاصة بهم، بما في ذلك التعليقات التوضيحية وتدريب النماذج لإنشاء تضمينات مخصصة، الاستفادة من Ultralytics . تعمل هذه الأداة الشاملة على تبسيط سير العمل من إدارة البيانات إلى النشر، مما يضمن أن التضمينات التي تدعم تطبيقاتك مستمدة من بيانات عالية الجودة ومنسقة جيدًا. سواء كنت تستخدم أطر عمل مثل PyTorch أو TensorFlow، فإن إتقان التضمينات هو خطوة حاسمة في بناء أنظمة متطورة للتعرف على الأنماط.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن