اكتشف بساطة وقوة تجميع K-Means، وهي خوارزمية فعالة لتجزئة البيانات والتعرف على الأنماط والتطبيقات الصناعية.
تجميع K-Means هو خوارزمية شائعة للتعلم الآلي غير الخاضع للإشراف تُستخدم لتقسيم البيانات إلى مجموعات متميزة بناءً على التشابه. وهي تهدف إلى تجميع نقاط البيانات في مجموعات K، حيث تنتمي كل نقطة بيانات إلى المجموعة ذات المتوسط الأقرب (النواة المركزية). تُستخدم هذه الطريقة على نطاق واسع لبساطتها وكفاءتها في التعامل مع مجموعات البيانات الكبيرة، مما يجعلها أداة قيّمة في تحليل البيانات الاستكشافية والتعرف على الأنماط والتطبيقات المختلفة في مختلف الصناعات.
تقوم خوارزمية K-Means بتعيين نقاط البيانات بشكل متكرر إلى أقرب نقطة مركزية للمجموعة وتعيد حساب المراكز بناءً على المجموعات المشكّلة حديثًا. تبدأ العملية باختيار مراكز K الأولية، والتي يمكن اختيارها عشوائيًا أو استنادًا إلى بعض الإرشادات. ثم يتم تعيين كل نقطة بيانات إلى المجموعة التي يكون مركزها الأقرب. بعد تعيين جميع نقاط البيانات، يتم إعادة حساب الوسط الحسابي على أنه متوسط نقاط البيانات في كل مجموعة. تستمر عملية التعيين وإعادة الحساب هذه إلى أن لا تتغير الأقطاب المركزية بشكل كبير أو إلى أن يتم الوصول إلى الحد الأقصى لعدد التكرارات.
نقطة مركزية: النقطة المركزية هي متوسط موضع جميع النقاط داخل المجموعة. وهو يمثل مركز المجموعة.
العنقود: الكتلة هي مجموعة من نقاط البيانات التي تتشابه مع بعضها البعض أكثر من نقاط البيانات في مجموعات أخرى.
مقياس المسافة: يستخدم K-Means عادةً المسافة الإقليدية لقياس التشابه بين نقاط البيانات والمراكز. يمكن أيضًا استخدام مقاييس أخرى للمسافات اعتمادًا على طبيعة البيانات.
القصور الذاتي: يقيس القصور الذاتي مجموع المسافات المربعة للعينات إلى أقرب مركز مجموعة لها. يشير القصور الذاتي المنخفض إلى مجموعات أكثر كثافة وتماسكًا.
يجد تجميع K-Means تطبيقات في مجموعة واسعة من المجالات نظرًا لقدرته على الكشف عن الأنماط الأساسية في البيانات. وتشمل بعض الأمثلة البارزة ما يلي:
تقسيم السوق: تستخدم الشركات K-Means لتقسيم العملاء إلى مجموعات متميزة بناءً على سلوك الشراء أو الخصائص الديموغرافية أو غيرها من الخصائص. يتيح ذلك إمكانية إجراء حملات تسويقية مستهدفة وتجارب عملاء مخصصة. استكشف كيف يعمل الذكاء الاصطناعي على تحويل تجارة التجزئة لمزيد من الرؤى.
ضغط الصور: يمكن تطبيق K-Means لتقليل حجم الصور عن طريق تجميع الألوان المتشابهة معًا وتمثيلها بعدد أقل من البتات. ينتج عن ذلك ملفات صور أصغر مع الحفاظ على جودة بصرية مقبولة. تعرف على المزيد حول التعرف على الصور ودوره في الرؤية الحاسوبية.
المزايا:
القيود:
يرتبط التجميع K-Means ارتباطًا وثيقًا بخوارزميات التجميع الأخرى وتقنيات التعلم غير الخاضع للإشراف.
DBSCAN (التجميع المكاني المستند إلى الكثافة للتطبيقات ذات الضوضاء): على عكس K-Means، يقوم DBSCAN بتجميع نقاط البيانات المتقاربة معًا معًا مع وضع علامات على النقاط المتطرفة التي تقع وحدها في المناطق منخفضة الكثافة. ولا يتطلب تحديد عدد المجموعات مسبقًا.
التجميع الهرمي: تقوم هذه الطريقة ببناء تسلسل هرمي للمجموعات إما عن طريق دمج المجموعات الأصغر في مجموعات أكبر (تكتلي) أو عن طريق تقسيم المجموعات الأكبر إلى مجموعات أصغر (تقسيمي).
K-أقرب الجيران (KNN): على الرغم من أن KNN هي خوارزمية تعلّم خاضعة للإشراف تُستخدم للتصنيف والانحدار، إلا أنها تشترك مع K-Means في استخدام مقاييس المسافة للعثور على أقرب الجيران.
تدعم العديد من الأدوات والمكتبات تنفيذ تجميع K-Means.
سايكيت-ليرن: مكتبة شائعة Python للتعلم الآلي توفر تطبيقًا بسيطًا وفعالًا ل K-Means.
TensorFlow: إطار عمل مفتوح المصدر للتعلم الآلي يمكن استخدامه لتنفيذ K-Means، خاصة للتطبيقات واسعة النطاق.
PyTorch: إطار آخر واسع الاستخدام للتعلم العميق يوفر مرونة وكفاءة في تنفيذ خوارزميات التجميع.
Ultralytics YOLO يمكن استخدام النماذج في مهام اكتشاف الأجسام، والتي قد تتضمن التجميع كخطوة معالجة مسبقة لتجميع الأجسام أو الميزات المتشابهة. استكشف المزيد حول استخدام Ultralytics YOLO لتطبيقات الرؤية الحاسوبية المتقدمة. يمكنك أيضًا استكشاف Ultralytics HUB لتدريب ونشر نماذج الذكاء الاصطناعي للرؤية بدون تعليمات برمجية.