مسرد المصطلحات

تجميع التكتلات K-Means

تعلم K-Means Clusterering، وهي خوارزمية تعلم رئيسية غير خاضعة للإشراف لتجميع البيانات في مجموعات. استكشف عمليتها وتطبيقاتها ومقارناتها!

تجميع K-Means هو خوارزمية تعلم أساسية غير خاضعة للإشراف تُستخدم في التنقيب عن البيانات والتعلم الآلي (ML). ويتمثل هدفها الأساسي في تقسيم مجموعة بيانات إلى عدد محدد مسبقًا من المجموعات الفرعية المتميزة وغير المتداخلة أو "المجموعات". يشير حرف "K" في اسمها إلى هذا العدد من المجموعات. تعمل الخوارزمية من خلال تجميع نقاط البيانات معًا بناءً على تشابهها، حيث يتم قياس التشابه غالبًا بالمسافة الإقليدية بين النقاط. يتم تمثيل كل مجموعة من خلال مركزها، المعروف باسم النواة المركزية، وهو متوسط جميع نقاط البيانات داخل تلك المجموعة. إنها طريقة قوية وبسيطة في الوقت نفسه لاكتشاف الأنماط والبنى الأساسية في البيانات غير المُسمّاة.

كيف تعمل K-Means

تعمل خوارزمية K-Means بشكل تكراري للعثور على أفضل التعيينات العنقودية لجميع نقاط البيانات. يمكن تقسيم العملية إلى بضع خطوات بسيطة:

  1. التهيئة: أولاً، يتم اختيار عدد المجموعات، K. ثم، يتم وضع مراكز K الأولية بشكل عشوائي داخل مساحة الميزة الخاصة بمجموعة البيانات.
  2. خطوة التعيين: يتم تعيين كل نقطة بيانات من بيانات التدريب إلى أقرب نقطة مركزية. هذا يشكل مجموعات K الأولية.
  3. خطوة التحديث: يتم إعادة حساب النقط المركزية لكل مجموعة من خلال أخذ متوسط جميع نقاط البيانات المخصصة لها.
  4. التكرار: يتم تكرار خطوات التعيين والتحديث حتى لا تتغير تعيينات المجموعات أو حتى الوصول إلى الحد الأقصى لعدد التكرارات. عند هذه النقطة، تكون الخوارزمية قد تقاربت، ويتم تشكيل المجموعات النهائية. يمكنك الاطلاع على شرح مرئي لخوارزمية K-Means لفهم أكثر سهولة.

يعد اختيار القيمة الصحيحة لـ K أمرًا بالغ الأهمية وغالبًا ما يتطلب معرفة المجال أو استخدام طرق مثل طريقة الكوع أو درجة خيال الظل. تتوفر التطبيقات على نطاق واسع في مكتبات مثل Scikit-learn.

التطبيقات الواقعية

يتم تطبيق K-Means في مجالات مختلفة نظرًا لبساطته وكفاءته:

  • تقسيم العملاء: في مجال البيع بالتجزئة والتسويق، تستخدم الشركات K-Means لتجميع العملاء في شرائح متميزة بناءً على تاريخ الشراء أو التركيبة السكانية أو السلوك. على سبيل المثال، قد تحدد شركة ما مجموعة "العملاء الأوفياء ذوي الإنفاق المرتفع" ومجموعة "المتسوقين العرضيين ذوي الميزانية المحدودة". يتيح ذلك وضع استراتيجيات تسويق مستهدفة، كما هو موضح في الدراسات حول تقسيم العملاء باستخدام التجميع.
  • ضغط الصور: في الرؤية الحاسوبية، يُستخدم K-Means في الرؤية الحاسوبية (CV)، يُستخدم K-Means لتكميم الألوان، وهو شكل من أشكال تقليل الأبعاد. فهو يقوم بتجميع ألوان البكسل المتشابهة في مجموعات K، واستبدال لون كل بكسل بلون مركز مجموعته. يقلل هذا من عدد الألوان في الصورة، مما يؤدي إلى ضغطها بشكل فعال. هذه التقنية هي مفهوم أساسي في تجزئة الصور.
  • تحليل المستندات: يمكن للخوارزمية تجميع المستندات بناءً على ترددات مصطلحاتها لتحديد الموضوعات أو تجميع المقالات المتشابهة، مما يساعد في تنظيم مجموعات البيانات النصية الكبيرة.

K-Means مقابل المفاهيم ذات الصلة

من المهم التمييز بين K-Means وخوارزميات التعلم الآلي الأخرى:

  • K-أقرب الجيران (KNN): هذه نقطة التباس شائعة. خوارزمية K-Means هي خوارزمية تجميع غير خاضعة للإشراف تقوم بتجميع البيانات غير المسماة. في المقابل، تعدّ KNN خوارزمية تصنيف أو خوارزمية انحدار خاضعة للإشراف تتنبأ بتسمية نقطة بيانات جديدة بناءً على تسميات أقرب جيرانها K. تقوم K-Means بإنشاء مجموعات، بينما تصنف KNN إلى مجموعات محددة مسبقًا.
  • آلة دعم المتجهات الداعمة (SVM): SVM هو نموذج تعليمي خاضع للإشراف يُستخدم للتصنيف، حيث يجد المستوى الفائق الأمثل لفصل الفئات. أما آلة K-Means فهي غير خاضعة للإشراف وتقوم بتجميع البيانات بناءً على التشابه دون أي تصنيفات محددة مسبقًا.
  • DBSCAN: على عكس K-Means، فإن DBSCAN هي خوارزمية تجميع قائمة على الكثافة يمكنها تحديد المجموعات ذات الشكل التعسفي وهي قوية في مواجهة القيم المتطرفة. تفترض K-Means أن المجموعات كروية الشكل ويمكن أن تتأثر بشدة بالقيم المتطرفة.

على الرغم من أن K-Means أداة أساسية لاستكشاف البيانات، إلا أن المهام المعقدة مثل اكتشاف الكائنات في الوقت الحقيقي تعتمد على نماذج أكثر تقدمًا. وتستخدم أجهزة الكشف الحديثة مثل Ultralytics YOLO تقنيات التعلُّم العميق المتطورة لتحقيق أداء فائق. ومع ذلك، كانت المفاهيم المستمدة من التجميع، مثل تجميع مربعات الارتكاز، أساسية في تطوير أجهزة الكشف عن الكائنات السابقة. يمكن تبسيط إدارة مجموعات البيانات لمثل هذه المهام باستخدام منصات مثل Ultralytics HUB.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة