اكتشف كيف تعمل قواعد البيانات المتجهة على تعزيز الذكاء الاصطناعي من خلال عمليات بحث فعالة عن التشابه في البرمجة اللغوية العصبية والرؤية الحاسوبية والتوصيات وغيرها.
قاعدة البيانات المتجهة هي نظام متخصص لإدارة البيانات مصمم لتخزين واسترجاع وإدارة التمثيلات المتجهة عالية الأبعاد للبيانات. في التعلم الآلي والذكاء الاصطناعي، تُعد قواعد البيانات المتجهة ضرورية لإجراء عمليات بحث ومقارنات التشابه بكفاءة على التضمينات الرقمية المستمدة من النصوص والصور والصوت وأنواع البيانات الأخرى.
تم تحسين قواعد البيانات المتجهة لإدارة المتجهات، وهي تمثيلات رياضية لنقاط البيانات في فضاء متعدد الأبعاد. وغالبًا ما يتم إنشاء هذه المتجهات من خلال نماذج التعلم الآلي وتغلف العلاقات أو السمات المعقدة، مثل المعنى الدلالي لكلمة ما، أو الخصائص البصرية لصورة ما، أو الخصائص الصوتية لمقطع صوتي.
على عكس قواعد البيانات التقليدية التي تعتمد على المطابقات التامة أو الفهرسة البسيطة، تستخدم قواعد بيانات المتجهات خوارزميات متطورة مثل البحث التقريبي لأقرب جار (ANN) لتحديد المتجهات الأكثر تشابهًا مع متجه الاستعلام بسرعة. وهذا يجعلها مثالية للتطبيقات التي تكون فيها الصلة والتشابه أكثر أهمية من التطابق التام.
في البرمجة اللغوية العصبية، تُستخدم قواعد البيانات المتجهة لتخزين تضمينات الكلمات أو تضمينات الجمل التي تم إنشاؤها بواسطة نماذج مثل BERT أو GPT. تتيح هذه التضمينات مهام مثل البحث الدلالي وأنظمة الإجابة عن الأسئلة. على سبيل المثال، يمكن لقاعدة بيانات المتجهات استرداد المستندات المتشابهة في المعنى مع استعلام المستخدم، حتى لو لم تتطابق الكلمات بالضبط.
تلعب قواعد البيانات المتجهة دورًا حاسمًا في مهام الرؤية الحاسوبية مثل عمليات البحث عن تشابه الصور. يمكن لنماذج مثل Ultralytics YOLO معالجة الصور إلى تضمينات يتم تخزينها في قاعدة بيانات متجهة. يتيح ذلك البحث عن الصور ذات المحتوى أو الميزات المتشابهة، مثل العثور على منتجات متشابهة بصريًا في كتالوجات التجارة الإلكترونية.
تستخدم محركات التوصية قواعد بيانات المتجهات لتخزين تضمينات المستخدم والعناصر. ثم تتم مقارنة هذه التضمينات لاقتراح العناصر (مثل الأفلام والمنتجات) التي تتماشى بشكل وثيق مع تفضيلات المستخدم، كما هو موضح في سجل تفاعله.
تستخدم منصات مثل Netflix أو Spotify قواعد بيانات المتجهات للتوصية بالمحتوى. على سبيل المثال، يتم ترميز تفضيلات المستخدم على شكل متجهات، والتي تتم مطابقتها مع المتجهات التي تمثل الأفلام أو الأغاني في قاعدة البيانات. ثم يتم التوصية بأقرب التطابقات للمستخدم.
قد تستخدم إحدى منصات التجارة الإلكترونية قاعدة بيانات متجهة للسماح للمستخدمين بتحميل صورة لمنتج ما والعثور على عناصر مماثلة متاحة للشراء. يتم تحقيق ذلك من خلال إنشاء تضمينات لكل من الصورة التي تم تحميلها وكتالوج المنتج باستخدام نموذج رؤية حاسوبية، ثم إجراء بحث عن التشابه في قاعدة البيانات المتجهة.
بينما يشير البحث عن المتجهات إلى عملية العثور على متجهات متشابهة، فإن قاعدة بيانات المتجهات هي البنية التحتية التي تتيح هذا البحث. البحث عن المتجهات هو ميزة توفرها قواعد بيانات المتجهات، وغالبًا ما تستفيد من تقنيات مثل تشابه جيب التمام أو المسافة الإقليدية.
التضمينات هي تمثيلات البيانات المخزنة داخل قاعدة بيانات المتجهات. يتم إنشاؤها بواسطة نماذج التعلم الآلي وتعمل كأساس لإجراء عمليات البحث عن التشابه. للمزيد من التفاصيل حول التضمينات، استكشف التضمينات في التعلم الآلي.
جعلت التطورات الأخيرة في نماذج التعلم الآلي وتسريع الأجهزة قواعد البيانات المتجهة أكثر كفاءة وقابلية للتطوير. تعمل أدوات مثل Ultralytics HUB على تبسيط تكامل قواعد البيانات المتجهة مع مهام سير عمل الذكاء الاصطناعي من خلال تمكين التدريب والنشر السلس للنماذج. بالإضافة إلى ذلك، توفر المكتبات مفتوحة المصدر مثل FAISS (البحث عن التشابه في الذكاء الاصطناعي على فيسبوك) والحلول التجارية مثل Pinecone أو Weaviate تطبيقات قوية لإدارة البيانات المتجهة.
لمعرفة المزيد حول كيفية قيام قواعد البيانات المتجهة والتقنيات ذات الصلة بتحويل الصناعات، تفضل بزيارة مدونةUltralytics . لحالات استخدام محددة مثل الرعاية الصحية أو التصنيع، استكشف تطبيقات الذكاء الاصطناعي في الرعاية الصحية والذكاء الاصطناعي في التصنيع.