مسرد المصطلحات

K-أقرب الجيران (KNN)

اكتشف خوارزمية K-Nearest Neighbours (KNN)، وهي خوارزمية تعلُّم آلي بسيطة لكنها قوية لمهام التصنيف والانحدار. تعلّم كيف تعمل!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

K-Nearest Neighbours (KNN) هي خوارزمية أساسية للتعلم الآلي تُستخدم في مهام التصنيف والانحدار. وهي معروفة ببساطتها وطبيعتها البديهية، مما يجعلها خيارًا شائعًا للمبتدئين في مجال التعلم الآلي. الفكرة الأساسية وراء خوارزمية KNN هي أن نقاط البيانات ذات السمات المتشابهة تميل إلى الانتماء إلى نفس الفئة أو لها قيم متشابهة. تقوم هذه الخوارزمية بعمل تنبؤات استنادًا إلى فئة الأغلبية أو متوسط قيمة أقرب نقاط البيانات "K" في مجموعة بيانات التدريب.

كيف تعمل شبكة الجيران الأقرب K-Nearest Neighbours (KNN)

تعمل خوارزمية KNN على مبدأ القرب. عند تقديم نقطة بيانات جديدة غير مرئية، تقوم بحساب المسافة بين هذه النقطة وجميع النقاط في مجموعة بيانات التدريب. ثم تحدد نقاط التدريب "K" الأقرب إلى النقطة الجديدة. بالنسبة للتصنيف، يتم تعيين الفئة الأكثر شيوعًا بين جيرانها الأقرب "K" للنقطة الجديدة. بالنسبة إلى الانحدار، تكون القيمة المتوقعة هي متوسط (أو المتوسط المرجح) لقيم أقرب جيرانها "K". يعد اختيار "K" أمرًا بالغ الأهمية ويمكن أن يؤثر بشكل كبير على أداء النموذج. قد يؤدي اختيار "K" الأصغر إلى حساسية الضوضاء، بينما يمكن أن يؤدي اختيار "K" الأكبر إلى تخفيف حدود القرار ولكن قد يتضمن نقاطًا من فئات أخرى.

مقاييس المسافة

يعتمد مفهوم "الأقرب" في شبكة KNN على مقياس المسافة. تشمل مقاييس المسافة الشائعة المستخدمة المسافة الإقليدية ومسافة مانهاتن ومسافة مينكوفسكي. لكل مقياس خصائصه الخاصة وهو مناسب لأنواع مختلفة من البيانات. على سبيل المثال، يشيع استخدام المسافة الإقليدية للبيانات العددية المستمرة، بينما يمكن أن تكون مسافة مانهاتن أكثر قوة في مواجهة القيم المتطرفة.

الملاءمة والتطبيقات

يُستخدم KNN على نطاق واسع نظرًا لسهولة تنفيذه وفعاليته في مجالات مختلفة. وهي مفيدة بشكل خاص عندما تكون المعرفة المسبقة بتوزيع البيانات قليلة أو معدومة. يمكن تطبيق شبكة KNN في أنظمة التوصية، مثل اقتراح المنتجات للمستخدمين بناءً على تفضيلات المستخدمين المتشابهين. يمكنك معرفة المزيد عن أنظمة التوصية في سياق الذكاء الاصطناعي والتعلم الآلي.

التطبيقات الواقعية

مثال 1: الرعاية الصحية

في مجال الرعاية الصحية، يمكن استخدام شبكة KNN للتنبؤ بما إذا كان من المحتمل أن يصاب المريض بمرض معين بناءً على التاريخ الطبي للمرضى المماثلين. من خلال تحليل عوامل مثل العمر وضغط الدم ومستويات الكوليسترول، يمكن لشبكة KNN تصنيف المرضى الجدد إلى فئات الخطر، مما يساعد في التشخيص المبكر وخطط العلاج الشخصية. استكشف المزيد عن الذكاء الاصطناعي في مجال الرعاية الصحية.

مثال 2: التعرف على الصور

يمكن استخدام شبكة KNN في مهام التعرف على الص ور، مثل التعرف على الأرقام المكتوبة بخط اليد أو تصنيف صور الأشياء. من خلال تمثيل الصور كمتجهات مميزة، يمكن لشبكة KNN تصنيف الصور الجديدة بناءً على تشابهها مع الصور المصنفة في مجموعة التدريب. هذا التطبيق مهم بشكل خاص في مجالات مثل التعرف الضوئي على الحروف (OCR) ووضع العلامات الآلية على الصور.

المفاهيم ذات الصلة

تجميع التكتلات K-Means

في حين أن كلاً من KNN و K-Means يتضمنان المعلمة "K"، إلا أنهما يخدمان أغراضًا مختلفة. K-Means هي خوارزمية تعلّم غير خاضعة للإشراف تُستخدم للتجميع، حيث يمثل "K" عدد المجموعات. وعلى النقيض من ذلك، فإن KNN هي خوارزمية تعلّم خاضعة للإشراف تُستخدم للتصنيف والانحدار، حيث يمثل "K" عدد الجيران الذين يتم أخذهم في الاعتبار. تعرف على المزيد حول K-Means Clusterering.

تقليل البُعدية

يمكن أن يتأثر أداء شبكة KNN بالبيانات عالية الأبعاد، وهي ظاهرة تُعرف باسم "لعنة الأبعاد". يمكن استخدام تقنيات مثل تحليل المكونات الرئيسية (PCA) لتقليل عدد السمات مع الاحتفاظ بالمعلومات الأساسية، وبالتالي تحسين كفاءة ودقة شبكة KNN.

المزايا والعيوب

المزايا

  • البساطة: شبكة KNN سهلة الفهم والتنفيذ.
  • لا توجد مرحلة تدريب: لا تحتوي شبكة KNN على مرحلة تدريب واضحة، مما يجعلها فعالة لمجموعات البيانات الديناميكية.
  • المرونة: يمكن استخدامه لكل من مهام التصنيف والانحدار.

العيوب

  • التكلفة الحسابية: يمكن أن يكون KNN مكلفًا حسابيًا، خاصةً مع مجموعات البيانات الكبيرة، حيث يتطلب حساب المسافات إلى جميع نقاط التدريب.
  • الحساسية تجاه "K": يمكن أن يؤثر اختيار "K" بشكل كبير على الأداء.
  • لعنة البُعدية: يتدهور الأداء مع البيانات عالية الأبعاد.

استنتاج

تعد K-Nearest Neighbours خوارزمية متعددة الاستخدامات وبديهية تجد مكانها في مختلف تطبيقات التعلم الآلي. وقدرتها على إجراء تنبؤات بناءً على تشابه نقاط البيانات تجعلها أداة قيّمة لمهام التصنيف والانحدار. ومع ذلك، فإن الدراسة الدقيقة لاختيار "K" ومقياس المسافة أمر ضروري لتحقيق الأداء الأمثل. بالنسبة للمهتمين باستكشاف نماذج التعلم الآلي المتقدمة ونشرها، يقدم موقع Ultralytics حلولاً متطورة مثل نماذج Ultralytics YOLO ومنصة Ultralytics HUB.

قراءة الكل