مسرد المصطلحات

تقليل البُعدية

تبسيط البيانات عالية الأبعاد باستخدام تقنيات تقليل الأبعاد. حسِّن أداء نموذج التعلم الآلي وتصوره وكفاءته اليوم!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تقليل الأبعاد هو عملية حاسمة في التعلم الآلي (ML) وتحليل البيانات المستخدمة لتقليل عدد الميزات (أو الأبعاد) في مجموعة البيانات مع الحفاظ على أكبر قدر ممكن من المعلومات ذات المغزى. يمكن أن تؤدي البيانات عالية الأبعاد، الشائعة في مجالات مثل الرؤية الحاسوبية ومعالجة اللغات الطبيعية (NLP)، إلى عدم الكفاءة الحسابية وتعقيد النموذج وخطر الإفراط في التكييف. من خلال تقليل الأبعاد، نهدف إلى تبسيط النماذج وتحسين سرعة التدريب وتحسين الأداء وتسهيل عرض البيانات.

ما أهمية تقليل الأبعاد؟

يمثل العمل مع مجموعات البيانات عالية الأبعاد العديد من التحديات، وغالبًا ما يشار إليها باسم"لعنة الأبعاد". فمع زيادة عدد الخصائص، يزداد حجم مساحة البيانات أضعافًا مضاعفة، مما يتطلب بيانات أكثر بكثير للحفاظ على الأهمية الإحصائية. يساعد تقليل الأبعاد على التخفيف من هذه المشكلات من خلال:

  1. تقليل التكلفة الحسابية: أبعاد أقل تعني أن هناك حاجة إلى عمليات حسابية أقل لخوارزميات التدريب، مما يؤدي إلى تطوير واستدلال أسرع للنموذج.
  2. تحسين أداء النموذج: يمكن أن تؤدي إزالة الميزات غير ذات الصلة أو الزائدة عن الحاجة إلى تقليل الضوضاء ومساعدة النماذج على التعميم بشكل أفضل على البيانات غير المرئية، مما يؤدي غالبًا إلى تحسين الدقة ومقاييس الأداء الأخرى.
  3. تمكين تصور البيانات: يكافح البشر لتصور البيانات بما يتجاوز ثلاثة أبعاد. ويتيح اختزال البيانات إلى بُعدين أو ثلاثة أبعاد باستخدام تقنيات مثل تحليل المكونات الرئيسية (PCA) أو تضمين الجوار العشوائي الموزع على شكل حرف T (t-SNE) الاستكشاف البصري واكتشاف الرؤى.
  4. تقليل التكرار: غالبًا ما تحتوي البيانات عالية الأبعاد على ميزات مترابطة. يمكن لتقنيات تقليل الأبعاد أن تجمع أو تختار ميزات لتمثيل البيانات بشكل أكثر إحكاماً.

طرق تقليل الأبعاد

هناك طريقتان أساسيتان لتقليل البُعدية، وغالبًا ما يتم تطبيقهما أثناء المعالجة المسبقة للبيانات:

  1. اختيار الميزات: يتضمن ذلك اختيار مجموعة فرعية من الميزات الأصلية الأكثر صلة بالمهمة. يتم ترتيب الميزات بناءً على الدرجات الإحصائية أو أهمية النموذج، ويتم تجاهل الميزات الأقل أهمية. الجانب الرئيسي هو أن الميزات المختارة تبقى دون تغيير عن شكلها الأصلي.
  2. استخراج الميزات: تنشئ هذه الطريقة ميزات جديدة منخفضة الأبعاد من خلال دمج الميزات الأصلية أو تحويلها. على عكس اختيار الميزات، تختلف الميزات الناتجة عن الميزات الأصلية ولكنها تلتقط المعلومات الأساسية. تتضمن تقنيات استخلاص السمات الشائعة PCA، والتحليل الخطي التمييزي (LDA)، والمبرمجات التلقائية. تقدم العديد من المكتبات، مثل Scikit-learn، تطبيقات لهذه الأساليب.

من المهم التمييز بين تقليل الأبعاد وهندسة الميزات، وهي عملية أوسع نطاقًا يمكن أن تتضمن إنشاء ميزات جديدة أو تحويل الميزات الموجودة أو تقليل الأبعاد كخطوة واحدة.

التطبيقات الواقعية

يتم تطبيق تقليل الأبعاد على نطاق واسع في مختلف المجالات:

استنتاج

يُعد تقليل الأبعاد تقنية أساسية لإدارة تعقيد مجموعات البيانات الحديثة في الذكاء الاصطناعي وتعلم الآلة. من خلال تبسيط البيانات من خلال اختيار الميزات أو استخراج الميزات، يمكن للممارسين بناء نماذج أكثر كفاءة وقوة وقابلية للتفسير. ويُعد فهم وتطبيق تقليل الأبعاد أمرًا بالغ الأهمية لتحسين سير العمل، سواءً من أجل تدريب أسرع على منصات مثل Ultralytics HUB أو نشر نماذج ذات متطلبات حسابية أقل.

قراءة الكل