مسرد المصطلحات

تجميع التكتلات K-Means

تعلم K-Means Clusterering، وهي خوارزمية تعلم رئيسية غير خاضعة للإشراف لتجميع البيانات في مجموعات. استكشف عمليتها وتطبيقاتها ومقارناتها!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

K-Means Clusterering هي خوارزمية تعلّم غير خاضعة للإشراف شائعة تُستخدم لتقسيم مجموعة بيانات إلى مجموعات فرعية (مجموعات) مميزة وغير متداخلة (K). تُعد هذه الطريقة مفيدة بشكل خاص عندما تحتاج إلى تحديد المجموعات المتأصلة داخل البيانات دون معرفة مسبقة بهذه المجموعات. يتمثل الهدف من تجميع K-Means Clustering في تقليل مجموع المسافات المربعة بين نقاط البيانات والنقطة المركزية للمجموعة المخصصة لها، مما يؤدي إلى تجميع نقاط البيانات المتشابهة معًا بشكل فعال.

كيف يعمل التجميع K-Means Clusterering

تتبع خوارزمية التجميع K-Means عملية تكرارية مباشرة:

  1. التهيئة: اختر عشوائيًا نقاط بيانات K من مجموعة البيانات لتكون بمثابة مراكز أولية (نقاط مركزية) للمجموعات.
  2. التعيين: تعيين كل نقطة بيانات إلى أقرب نقطة بيانات إلى أقرب نقطة مركزية بناءً على مقياس المسافة، وعادةً ما تكون المسافة الإقليدية. تشكّل هذه الخطوة مجموعات K.
  3. تحديث: إعادة حساب الوسط الحسابي لكل مجموعة من خلال حساب الوسط الحسابي لجميع نقاط البيانات المخصصة لتلك المجموعة.
  4. التكرار: كرر الخطوتين 2 و3 حتى لا تتغير المجاميع المركزية بشكل ملحوظ، أو حتى الوصول إلى الحد الأقصى لعدد التكرارات. يشير هذا إلى أن المجموعات قد استقرت.

تضمن عملية التنقيح التكرارية هذه تجميع نقاط البيانات مع أقرب جيرانها في فضاء السمات، مما يؤدي إلى إنشاء مجموعات متماسكة. تُعتبر K-Means فعّالة ومستخدمة على نطاق واسع نظرًا لبساطتها وقابليتها للتوسع في مجموعات البيانات الكبيرة. للحصول على فهم أعمق لخوارزميات التجميع، يمكنك استكشاف موارد مثل وثائق التجميع الخاصة ببرنامج scikit-learn التي تقدم رؤى وأمثلة شاملة.

تطبيقات التجميع K-Means Clustering

يحتوي K-Means Clusterering على مجموعة واسعة من التطبيقات في مختلف المجالات، لا سيما في الذكاء الاصطناعي والتعلم الآلي. فيما يلي بعض الأمثلة:

  • تقسيم العملاء في البيع بالتجزئة: يمكن للشركات استخدام تجميع K-Means Clusterering لتقسيم العملاء بناءً على سلوك الشراء أو التركيبة السكانية أو نشاط الموقع الإلكتروني. وهذا يسمح باستراتيجيات التسويق المستهدفة والتوصيات المخصصة وتحسين إدارة علاقات العملاء. على سبيل المثال، يمكن لتجار التجزئة تحليل سجل مشتريات العملاء لتحديد مجموعات متميزة مثل "العملاء ذوي القيمة العالية" أو "صائدي الصفقات" أو "العملاء الجدد" وتخصيص حملات التسويق وفقًا لذلك، على غرار كيفية تعزيز الذكاء الاصطناعي لتجربة العملاء في البيع بالتجزئة.

  • كشف الشذوذ: يمكن استخدام K-Means للكشف عن الحالات الشاذة من خلال تحديد نقاط البيانات التي لا تنتمي إلى أي مجموعة أو بعيدة عن مراكز المجموعات. في مجال الرؤية الحاسوبية، يمكن استخدام ذلك للكشف عن العيوب في التصنيع أو تحديد الأنشطة غير الاعتيادية في لقطات المراقبة. على سبيل المثال، في عملية مراقبة الجودة، يمكن استخدام الرؤية الحاسوبية في التصنيع المدعومة بنماذج Ultralytics YOLO للكشف عن عيوب المنتج، ويمكن بعد ذلك استخدام K-Means لتجميع خصائص العيوب وإبراز الحالات الشاذة لإجراء المزيد من الفحص. تعرف على المزيد حول تقنيات اكتشاف الشذوذ وتطبيقاتها في الذكاء الاصطناعي.

K-Means Clusterering مقابل المفاهيم ذات الصلة

على الرغم من أن K-Means Clusterering أداة قوية، إلا أنه من المهم تمييزها عن المفاهيم الأخرى ذات الصلة:

  • تجميع K-Means مقابل DBSCAN: في حين أن كلاهما خوارزميات تجميع تعلم غير خاضعة للإشراف، فإن K-Means تعتمد على مركزية النواة وتهدف إلى إنشاء مجموعات كروية، في حين أن DBSCAN (التجميع المكاني القائم على الكثافة للتطبيقات ذات الضوضاء) يعتمد على الكثافة ويمكنه اكتشاف مجموعات ذات أشكال عشوائية وتحديد نقاط الضوضاء كقيم متطرفة. يعتبر DBSCAN أكثر قوة في مواجهة القيم المتطرفة ولا يتطلب تحديد عدد المجموعات مسبقًا، على عكس K-Means.

  • التجميع باستخدام K-Means مقابل التعلّم الخاضع للإشراف: تُعد K-Means Clustering تقنية تعلّم غير خاضعة للإشراف، مما يعني أنها تعمل مع بيانات غير موسّمة للعثور على الأنماط. في المقابل، تتعلم خوارزميات التعلّم الخاضع للإشراف، مثل نماذج تصنيف الصور المدرّبة باستخدام Ultralytics YOLO ، من البيانات المصنفة لإجراء تنبؤات أو تصنيفات. يتطلب التعلم الخاضع للإشراف فئات محددة مسبقًا، بينما تكتشف K-Means الفئات من البيانات نفسها.

يوفر فهم تجميع K-Means Clusterering وتطبيقاته رؤى قيمة للاستفادة من التعلم الآلي (ML) في مختلف المجالات. كما يمكن لمنصات مثل Ultralytics HUB المساعدة في إدارة مجموعات البيانات ونشر النماذج التي تستفيد من رؤى البيانات المكتسبة من خلال تقنيات التجميع.

قراءة الكل