مسرد المصطلحات

البحث عن المتجهات

اكتشف كيف يُحدِث البحث المتجه ثورة في الذكاء الاصطناعي من خلال تمكين التشابه الدلالي في استرجاع البيانات في مجال البرمجة اللغوية العصبية والبحث المرئي وأنظمة التوصيات وغيرها!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

البحث الناقل هو طريقة مستخدمة في الذكاء الاصطناعي (AI) والتعلم الآلي (ML) للعثور على البيانات بناءً على التشابه، بدلاً من الكلمات الرئيسية الدقيقة. تخيل البحث عن الصور التي تشبه صورة معينة، أو العثور على مستندات مشابهة دلالياً لنص معين. وهنا يأتي دور البحث المتجه، مما يمكّن الآلات من فهم المعلومات واسترجاعها بناءً على المعنى والسياق.

فهم تضمينات المتجهات

يكمن مفهوم تضمينات المتجهات في صميم البحث عن المتجهات. وهي عبارة عن تمثيلات رقمية للبيانات، مثل النصوص أو الصور أو الصوت، يتم تحويلها إلى متجهات عالية الأبعاد. تلتقط هذه المتجهات السمات الأساسية والمعنى الدلالي للبيانات. على سبيل المثال، في معالجة اللغة الطبيعية (NLP)، يمكن لنماذج مثل BERT (تمثيلات التشفير ثنائية الاتجاه من المحولات) تحويل الجمل إلى متجهات، حيث يتم وضع الجمل المتشابهة معًا بشكل متقارب في فضاء المتجه. وبالمثل، في الرؤية الحاسوبية، يمكن لنموذج Ultralytics YOLO يمكن للنموذج توليد متجهات سمات للصور، مما يسمح بإجراء مقارنات تشابه بين المحتوى المرئي.

بمجرد تحويل البيانات إلى تضمينات متجهات، تستخدم خوارزميات البحث عن المتجهات مقاييس المسافة مثل تشابه جيب التمام أو المسافة الإقليدية لقياس القرب بين المتجهات. من خلال حساب هذه المسافات، يمكن للنظام تحديد واسترجاع نقاط البيانات الأكثر تشابهًا مع متجه الاستعلام، حتى لو لم تكن تحتوي على الكلمات الرئيسية بالضبط.

تطبيقات البحث في المتجهات

يُحدث البحث المتجه ثورة في مختلف تطبيقات الذكاء الاصطناعي، لا سيما تلك التي تتعامل مع البيانات غير المهيكلة:

  • أنظمة التوصية: تستخدم منصات مثل Netflix أو Spotify البحث المتجه للتوصية بالأفلام أو الأغاني بناءً على تفضيلات المستخدم. من خلال تضمين ملفات تعريف المستخدم وخصائص العناصر في مساحة متجهة، يمكن للنظام العثور بسرعة على العناصر المشابهة لتفاعلات المستخدم السابقة، مما يعزز التخصيص ومشاركة المستخدم.

  • البحث المرئي: في التجارة الإلكترونية أو استرجاع الصور، يعمل البحث المتجه على تعزيز قدرات البحث المرئي. يمكن للمستخدمين تحميل صورة، ويمكن للنظام، باستخدام التضمينات المتجهة للصور، العثور على منتجات أو صور متشابهة بصريًا من قاعدة بيانات. وهذا أكثر فعالية بكثير من عمليات البحث عن الصور المستندة إلى الكلمات الرئيسية، خاصةً عندما يكون وصف المحتوى المرئي أمراً صعباً.اكتشف المزيد حول التعرف على الصور

  • معالجة اللغة الطبيعية: يسمح البحث الدلالي، المدعوم بالبحث المتجه، لمحركات البحث وروبوتات الدردشة الآلية بفهم المعنى الكامن وراء الاستعلامات. فبدلاً من الاعتماد على مطابقة الكلمات الرئيسية، تستخدم هذه الأنظمة التضمينات المتجهة للنص للعثور على المستندات أو الردود ذات الصلة بالسياق، مما يحسن دقة وملاءمة نتائج البحث والذكاء الاصطناعي للمحادثة.

  • اكتشاف الشذوذ: في مجالات مثل الأمن السيبراني أو الكشف عن الاحتيال، يمكن للبحث عن المتجهات تحديد الأنماط غير العادية أو القيم المتطرفة. من خلال تمثيل السلوك العادي كمتجهات، يمكن للنظام أن يكتشف بسرعة نقاط البيانات التي تنحرف بشكل كبير عن القاعدة، مما يؤدي إلى تحديد الحالات الشاذة المحتملة لإجراء مزيد من التحقيقات.

الجوانب الفنية

للتعامل مع المتطلبات الحسابية للبحث عن المتجهات، خاصة مع مجموعات البيانات الكبيرة والمتجهات عالية الأبعاد، يتم استخدام أدوات وتقنيات متخصصة. قواعد بيانات المتجهات، مثل Pinecone وMilvus، مصممة لتخزين وفهرسة واستعلام تضمينات المتجهات بكفاءة على نطاق واسع. وغالبًا ما تستخدم قواعد البيانات هذه خوارزميات الجار الأقرب التقريبي (ANN) لتسريع عملية البحث، مما يجعل البحث عن المتجهات في الوقت الفعلي ممكنًا.

وعلاوة على ذلك، يمكن استخدام تقنيات مثل تقليل الأبعاد، مثل تحليل المكونات الرئيسية (PCA)، لتقليل حجم التضمينات المتجهة مع الحفاظ على معلوماتها الأساسية، وتحسين كفاءة التخزين والبحث.

أمثلة من العالم الحقيقي

تعتمد السيارات ذاتية القيادة بشكل كبير على البحث عن المتجهات للإدراك في الوقت الحقيقي. على سبيل المثال، عندما تكتشف مستشعرات السيارة ذاتية القيادة جسمًا ما، يستخدم النظام البحث عن المتجهات لمقارنة متجه سمات الجسم مع قاعدة بيانات الأجسام المعروفة (المشاة والمركبات واللافتات) لتحديده وتصنيفه بسرعة، مما يتيح اتخاذ القرار السريع للملاحة الآمنة. استكشف الذكاء الاصطناعي في السيارات ذاتية القيادة

في التوظيف المدعوم بالذكاء الاصطناعي، يمكن للبحث المتجه أن يطابق بكفاءة بين المرشحين للوظائف وتوصيفات الوظائف. يتم تحويل الملفات الشخصية للمرشحين وتوصيفات الوظائف إلى تضمينات متجهة، وتجد خوارزميات البحث المتجهي المرشحين الذين تتشابه ملفاتهم الشخصية مع متطلبات الوظيفة، مما يسهل عملية استقطاب المواهب.

قراءة الكل