اكتشف كيف يُحدِث البحث المتجه ثورة في الذكاء الاصطناعي من خلال تمكين استرجاع البيانات القائمة على التشابه لتطبيقات مثل البرمجة اللغوية العصبية والرؤية واكتشاف الشذوذ.
البحث عن المتجهات هو تقنية قوية في الذكاء الاصطناعي (AI) والتعلم الآلي (ML) مصممة لاسترداد نقاط البيانات بناءً على تمثيلات المتجهات الخاصة بها. على عكس عمليات البحث التقليدية القائمة على الكلمات الرئيسية، والتي تعتمد على التطابق التام أو مقارنات السلاسل البسيطة، يركز البحث المتجه على القرب أو التشابه بين نقاط البيانات داخل فضاء متجه متعدد الأبعاد. هذا النهج مفيد بشكل خاص للتطبيقات التي تتضمن بيانات غير منظمة، مثل الصور والصوت والنصوص.
يتضمن البحث المتجه، في جوهره، تحويل البيانات إلى تمثيلات متجهة - مصفوفات رقمية تلتقط المعنى الدلالي أو السمات الدلالية للبيانات. على سبيل المثال، تولد نماذج معالجة اللغات الطبيعية (NLP) مثل BERT نماذج معالجة اللغات الطبيعية (NLP) تضمينات متجهة للجمل، حيث تلتقط سياقها ومعناها في فضاء عالي الأبعاد. وبالمثل، في مهام الرؤية الحاسوبية مثل تصنيف الصور، تقوم نماذج مثل Ultralytics YOLO توليد تضمينات ميزات للصور.
بمجرد تمثيل البيانات على شكل متجهات، تستخدم خوارزميات البحث عن المتجهات مقاييس التشابه مثل تشابه جيب التمام أو المسافة الإقليدية لتحديد نقاط البيانات الأقرب إلى متجه استعلام معين. وهذا يجعل من الممكن استرداد النتائج المتشابهة دلاليًا أو سياقيًا، حتى لو لم يكن هناك تطابق تام.
يُستخدم البحث المتجه على نطاق واسع في محركات التوصيات لاقتراح المنتجات أو المحتوى أو الخدمات بناءً على تفضيلات المستخدم. على سبيل المثال:
في التطبيقات التي يبحث فيها المستخدمون عن صور أو كائنات، يتيح البحث المتجه إمكانية الاسترجاع الفعال بناءً على الميزات المرئية:
يعمل البحث المتجه على تشغيل البحث الدلالي في البرمجة اللغوية العصبية وتعزيز محركات البحث وروبوتات الدردشة:
في صناعات مثل الأمن السيبراني والتمويل، يتم تطبيق البحث عن المتجهات لاكتشاف القيم المتطرفة أو الحالات الشاذة:
لإجراء بحث المتجهات على نطاق واسع، غالبًا ما يتم استخدام أدوات وأطر عمل متخصصة. صُممت قواعد بيانات المتجهات مثل Milvus و Pinecone للتعامل مع بيانات المتجهات واسعة النطاق وعالية الأبعاد بكفاءة. تستفيد هذه الأنظمة من خوارزميات الجار القريب التقريبي (ANN) لتسريع أداء البحث، مما يجعلها مناسبة للتطبيقات في الوقت الفعلي.
بالإضافة إلى ذلك، يمكن لخطوات المعالجة المسبقة مثل تقليل الأبعاد باستخدام تقنيات مثل تحليل المكونات الرئيسية (PCA) تحسين تخزين واسترجاع البيانات المتجهة عن طريق تقليل حجمها مع الحفاظ على العلاقات ذات المغزى.
تعتمد المركبات ذاتية القيادة على البحث المتجه لمعالجة وتحليل البيئة المحيطة بها في الوقت الفعلي. على سبيل المثال:
في مجال استقطاب المواهب، يتم استخدام البحث المتجه لمطابقة المرشحين مع أوصاف الوظائف:
البحث المتجه هو تقنية تحويلية تمكّن أنظمة الذكاء الاصطناعي من إجراء استرجاع قائم على التشابه عبر أنواع مختلفة من البيانات، من النصوص والصور إلى الصوت والفيديو. ومن خلال الاستفادة من التضمينات المتقدمة ومقاييس التشابه، يسهّل البحث المتجه التطبيقات التي تتراوح من التوصيات المخصصة إلى اكتشاف الحالات الشاذة وما بعدها. استكشف أدوات مثل Ultralytics HUB لدمج إمكانات الذكاء الاصطناعي للرؤية في مشروعاتك بسلاسة.