مسرد المصطلحات

K-أقرب الجيران (KNN)

اكتشف كيف تُبسِّط K-Nearest Neighbours (KNN) التعلُّم الآلي من خلال نهجها البديهي غير البارامترى لمهام التصنيف والانحدار.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

K-Nearest Neighbours (KNN) هي خوارزمية تعلّم آلي بسيطة لكنها قوية تُستخدم في مهام التصنيف والانحدار. تُعتبر خوارزمية تعلّم غير بارامترية وكسولة، مما يعني أنها لا تضع افتراضات قوية حول توزيع البيانات الأساسي وتؤجل الحساب حتى وقت التنبؤ. تعتبر KNN بديهية وسهلة التنفيذ بشكل خاص، مما يجعلها أداة قيمة لفهم مفاهيم التعلم الآلي الأساسية.

كيف تعمل شبكة KNN

تعمل خوارزمية K-Nearest Neighbours في جوهرها على مبدأ التشابه. عند تقديم نقطة بيانات جديدة غير مصنفة، تقوم خوارزمية K-Nearest N Neighbors بتحديد أقرب جيرانها "K" من مجموعة بيانات التدريب. قيمة "K" هي ثابت يُحدّده المستخدم، وهي تحدد عدد الجيران الذين يؤثرون على التصنيف. تتم العملية على النحو التالي:

  1. حساب المسافة: تحسب شبكة KNN المسافة بين نقطة البيانات الجديدة وكل نقطة أخرى في مجموعة بيانات التدريب. تشمل مقاييس المسافة الشائعة المسافة الإقليدية ومسافة مانهاتن ومسافة مينكوفسكي.
  2. اختيار الجار: يختار نقاط البيانات "K" من مجموعة التدريب الأقرب إلى نقطة البيانات الجديدة، بناءً على المسافة المحسوبة في الخطوة السابقة. هذه النقاط "K" هي "أقرب الجيران".
  3. التصنيف أو الانحدار:
    • التصنيف: بالنسبة لمهام التصنيف، تقوم شبكة KNN بتعيين نقطة البيانات الجديدة إلى الفئة الأكثر شيوعًا بين جيرانها الأقرب "K". هذا في الأساس تصويت بالأغلبية بين الجيران.
    • الانحدار: بالنسبة لمهام الانحدار، تتنبأ شبكة KNN بقيمة نقطة البيانات الجديدة من خلال حساب متوسط (أو متوسط) قيم أقرب جيرانها "K".

تطبيقات KNN

إن تعدد استخدامات KNN يجعلها قابلة للتطبيق في مجالات مختلفة. فيما يلي بعض الأمثلة الواقعية:

  • أنظمة التوصية: في منصات مثل نيتفليكس أو أمازون، يمكن استخدام شبكة KNN لإنشاء أنظمة توصية بالترشيح التعاوني. على سبيل المثال، إذا كنت تريد توصيات للأفلام، يمكن لشبكة KNN العثور على المستخدمين "الجيران الأقرب إليك" استنادًا إلى تاريخ مشاهدة مماثل، ثم التوصية بالأفلام التي استمتع بها هؤلاء الجيران. ويستفيد هذا من فكرة أن المستخدمين الذين لديهم تفضيلات متشابهة في الماضي سيكون لديهم على الأرجح تفضيلات مماثلة في المستقبل. تعرف على المزيد حول أنظمة التوصيات وتطبيقات الذكاء الاصطناعي الأخرى في تحليلات البيانات.
  • التشخيص الطبي: يمكن أن تساعد شبكة KNN في تحليل الصور الطبية لتشخيص الأمراض. من خلال تحليل بيانات المريض (الأعراض ونتائج الاختبارات وما إلى ذلك)، يمكن لشبكة KNN العثور على "K" المرضى المتشابهين في قاعدة البيانات، وبناءً على تشخيصاتهم، يمكن التنبؤ بتشخيص مريض جديد. على سبيل المثال، في مجال الكشف عن السرطان، يمكن استخدام السمات المستخرجة من الصور الطبية، ويمكن لشبكة KNN تصنيف الصور الجديدة بناءً على التشابه مع الحالات الحميدة أو الخبيثة المعروفة.

مزايا ومساوئ شبكة KNN

مثل جميع الخوارزميات، فإن شبكة KNN لها نقاط قوتها وضعفها:

المزايا:

  • البساطة: شبكة KNN سهلة الفهم والتنفيذ.
  • تعدد الاستخدامات: يمكن استخدامه لكل من التصنيف والانحدار.
  • غير البارامترية: لا تضع أي افتراضات حول توزيع البيانات، وهو ما يمكن أن يكون مفيدًا في العديد من سيناريوهات العالم الحقيقي.
  • لا توجد مرحلة تدريب: نظرًا لأن شبكة KNN هي متعلم كسول، فلا توجد مرحلة تدريب واضحة، مما يجعلها سريعة التكيف مع البيانات الجديدة.

العيوب:

  • مكلف حسابيًا: في وقت التنبؤ، تحتاج شبكة KNN إلى حساب المسافات إلى جميع نقاط بيانات التدريب، وهو ما قد يكون بطيئًا بالنسبة لمجموعات البيانات الكبيرة.
  • حساس للميزات غير ذات الصلة: يكون أداء KNN ضعيفًا في حالة وجود ميزات غير ذات صلة، حيث يمكن أن تحرف حسابات المسافة. قد يكون من الضروري اختيار الميزات أو تقنيات تقليل الأبعاد.
  • قيمة "K" المثلى: يعد اختيار القيمة الصحيحة ل "K" أمرًا بالغ الأهمية وغالبًا ما يتطلب التجريب. يمكن أن تؤدي قيمة "K" الصغيرة جدًا إلى حساسية التشويش، بينما يمكن أن تؤدي قيمة "K" الكبيرة جدًا إلى طمس حدود الفئة. يمكن أن تساعد تقنيات مثل ضبط المعامل الفائق في العثور على القيمة المثلى ل "K".
  • بيانات غير متوازنة: يمكن أن تنحاز شبكة KNN إلى فئة الأغلبية في مجموعات البيانات غير المتوازنة لأن عينات فئة الأغلبية ستهيمن على الحي.

المفاهيم ذات الصلة

يساعد فهم شبكة KNN من حيث علاقتها بمفاهيم التعلم الآلي الأخرى على تقدير مكانتها ومتى تكون الأنسب لاستخدامها:

  • مقارنة مع خوارزميات التصنيف الأخرى: على عكس الانحدار اللوجستي أو آلات ناقلات الدعم التي تكون بارامترية وتتعلم حدود القرار، فإن شبكة KNN غير بارامترية وقائمة على المثيل. على سبيل المثال، بينما يقوم الانحدار اللوجستي بنمذجة احتمالية الانتماء للفئة، تستخدم KNN نقاط البيانات نفسها مباشرةً للتصنيف.
  • العلاقة مع خوارزميات التجميع: في حين أن KNN هي خوارزمية تعلم خاضعة للإشراف، إلا أنها تشترك في مفهوم التشابه القائم على المسافة مع خوارزميات التعلم غير الخاضعة للإشراف مثل خوارزمية التجميع K-Means. ومع ذلك، تُستخدم خوارزمية K-means لتجميع البيانات غير المسماة في مجموعات، بينما تُستخدم KNN لتصنيف أو توقع قيم نقاط البيانات الجديدة المسماة أو غير المسماة بناءً على بيانات التدريب المسماة.

باختصار، تُعتبر خوارزمية K-Nearest Neighbours خوارزمية أساسية في التعلّم الآلي، وتُقدّر لبساطتها وفعاليتها في مجموعة متنوعة من التطبيقات، خاصةً عندما تكون مجموعة البيانات متوسطة الحجم ويمكن تمييز أنماط البيانات عن طريق القرب. بالنسبة لمجموعات البيانات الأكثر تعقيدًا أو التطبيقات الآنية التي تتطلب استدلالًا أسرع، قد يُفضَّل استخدام نماذج أكثر تعقيدًا مثل Ultralytics YOLO للكشف عن الكائنات قد تكون مفضلة.

قراءة الكل