مسرد المصطلحات

آلة دعم المتجهات الداعمة (SVM)

اكتشف قوة آلات المتجهات الداعمة (SVMs) للتصنيف والانحدار واكتشاف الحالات الشاذة، مع تطبيقات ورؤى من العالم الحقيقي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

آلة دعم المتجهات الداعمة (SVM) هي خوارزمية شائعة وقوية للتعلم الآلي الخاضع للإشراف (ML) تُستخدم بشكل أساسي في مهام التصنيف، على الرغم من أنها فعالة أيضًا في الانحدار (انحدار متجه الدعم - SVR) واكتشاف الحالات المتطرفة. تعمل SVMs، التي تم تطويرها في تسعينيات القرن الماضي، من خلال إيجاد حد أمثل، يسمى المستوى الفائق، والذي يفصل بين نقاط البيانات التي تنتمي إلى فئات مختلفة في فضاء عالي الأبعاد. تتمثل الفكرة الرئيسية في تعظيم الهامش - أي المسافة بين المستوى الفائق وأقرب نقاط البيانات (متجهات الدعم) من كل فئة - مما يؤدي غالبًا إلى أداء تعميم جيد على البيانات غير المرئية.

كيف يعمل Svm

يتمثل المبدأ الأساسي للإدارة الصوتية المغناطيسية التفاعلية في إيجاد المستوى الفائق المثالي لتقسيم مجموعة البيانات. بالنسبة للبيانات التي يمكن فصلها بخط مستقيم أو مستوى مستوٍ (البيانات القابلة للفصل الخطي)، تحدد الآلة الكهروضوئية الجذعية المستوى الفائق الذي يخلق أكبر فجوة ممكنة بين الفئات. تُعرف نقاط البيانات الأقرب إلى هذا المستوى الفائق، والتي تعتبر حاسمة في تحديد موضعه واتجاهه، باسم متجهات الدعم. هذا التركيز على النقاط الأكثر تحديًا بالقرب من الحدود يجعل SVMs SVMs فعالة من حيث الذاكرة، حيث إن متجهات الدعم هذه فقط هي المطلوبة لتحديد النموذج بعد التدريب.

بالنسبة لمجموعات البيانات التي لا يمكن فيها الفصل بين الفئات بحدود خطية (بيانات غير قابلة للفصل الخطي)، تستخدم الآلات الجبرية التكرارية الخاصة SVMs تقنية تسمى خدعة النواة. تسمح هذه الطريقة الذكية لآلات SVMs بتعيين البيانات الأصلية في فضاء ذي أبعاد أعلى حيث يمكن الفصل الخطي دون حساب الإحداثيات في هذا الفضاء الجديد بشكل صريح. تتضمن دوال النواة الشائعة ما يلي:

  • النواة الخطية: تُستخدم للبيانات القابلة للفصل الخطي.
  • نواة متعددة الحدود: يحوِّل البيانات إلى فضاء متعدد الحدود من الدرجة الأعلى.
  • نواة دالة الأساس الشعاعي (RBF): خيار شائع يمكنه التعامل مع العلاقات المعقدة، وتعيين البيانات في فضاء لا نهائي الأبعاد.
  • النواة الجيبية: تشبه دالة التنشيط المستخدمة في الشبكات العصبية.

يُعد اختيار النواة ومعلماتها أمرًا بالغ الأهمية، وغالبًا ما يتطلب ضبطًا دقيقًا للمعامل الفائق.

الملاءمة والتطبيقات

تظل SVMs ذات أهمية على الرغم من ظهور التعلّم العميق (DL)، لا سيما في السيناريوهات ذات البيانات عالية الأبعاد (العديد من الميزات) ولكن عينات التدريب محدودة. وهي معروفة بضماناتها النظرية وقوتها، خاصةً عند وجود هامش واضح للفصل. من الناحية التاريخية، كانت الآلات الكهروضوئية المغناطيسية SVMs مقترنة بمستخرجات الميزات مثل مخطط التدرجات الموجّهة (HOG) هي الأحدث في مهام مثل اكتشاف الأجسام، كما هو مذكور في تطور اكتشاف الأجسام.

تشمل التطبيقات الشائعة ما يلي:

  • تصنيف الصور: تصنيف الصور إلى فئات محددة مسبقًا، مثل تحديد الأرقام المكتوبة بخط اليد أو التمييز بين أنواع مختلفة من الأشياء. على سبيل المثال، يمكن تدريب SVM على تصنيف الصور الطبية على أنها تحتوي على أورام أو لا تحتوي على أورام بناءً على السمات المستخرجة.
  • تصنيف النصوص: فرز المستندات إلى مواضيع، وتحليل المشاعر (المراجعات الإيجابية/السلبية)، والكشف عن الرسائل غير المرغوب فيها. على سبيل المثال، تصنيف المقالات الإخبارية إلى فئات مثل "الرياضة" أو "السياسة" أو "التكنولوجيا".
  • اكتشاف الوجوه: تحديد الوجوه داخل الصور، غالباً كخطوة أولية قبل التعرف على الوجوه.
  • المعلوماتية الحيوية: تصنيف البروتينات أو الجينات أو عينات المرضى بناءً على بيانات بيولوجية معقدة.
  • التعرف على خط اليد: يستخدم في أنظمة التعرف على الأحرف المكتوبة بخط اليد.

المزايا والقيود

المزايا:

  • فعالة في المساحات عالية الأبعاد، حتى عندما يتجاوز عدد الأبعاد عدد العينات.
  • كفاءة الذاكرة لأنها تستخدم فقط مجموعة فرعية من نقاط التدريب (متجهات الدعم) في دالة القرار.
  • متعدد الاستخدامات بسبب وظائف النواة المختلفة التي تسمح بالتكيف مع أنواع البيانات المختلفة.
  • يحقق دقة عالية بشكل عام عندما تكون الفئات منفصلة بشكل جيد.

القيود:

  • يمكن أن يكون التدريب على مجموعات بيانات كبيرة جدًا مكلفًا وبطيئًا من الناحية الحسابية.
  • يعتمد الأداء اعتمادًا كبيرًا على اختيار دالة النواة والمعلمات الفائقة.
  • أقل فعالية في مجموعات البيانات المشوشة حيث تتداخل الفئات بشكل كبير.
  • لا توفر الآلات الكهروضوئية الجبرية التكرارية الخاصة (SVMs) تقديرات احتمالية مباشرةً؛ حيث تتطلب هذه التقديرات مزيدًا من المعالجة (على سبيل المثال، قياس بلات).

Svm مقابل الخوارزميات الأخرى

بالمقارنة مع خوارزميات أبسط مثل الانحدار اللوجستي، تهدف SVMs إلى تعظيم الهامش بدلاً من مجرد إيجاد حد فاصل، مما قد يؤدي إلى تعميم أفضل. على عكس أشجار القرار أو الغابات العشوائية، تقوم SVMs ببناء مستوى فرعي واحد مثالي. بينما نماذج التعلم العميق الحديثة مثل Ultralytics YOLO تتفوق في الاستخراج التلقائي للميزات من البيانات الخام (مثل وحدات البكسل في الرؤية الحاسوبية)، فإن الآلات الكهروضوئية المغناطيسية SVMs غالبًا ما تتطلب هندسة ميزات دقيقة ولكن يمكنها أن تؤدي أداءً جيدًا على مجموعات بيانات أصغر أو أنواع محددة من البيانات المنظمة. تشمل التطبيقات الشائعة LibSVM ووحدة SVM في scikit-learn. يمكن تبسيط تدريب وإدارة هذه النماذج باستخدام منصات مثل Ultralytics HUB.

قراءة الكل