Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم غير الخاضع للإشراف

استكشف التعلم غير الخاضع للإشراف لاكتشاف الأنماط الخفية في البيانات غير المصنفة. تعرف على التجميع والكشف عن الحالات الشاذة وكيف يدعم ذلك حلول الذكاء الاصطناعي الحديثة.

التعلم غير المراقب هو نوع من أنواع التعلم الآلي حيث تتعلم الخوارزمية الأنماط من البيانات غير الموسومة دون تدخل بشري. على عكس التعلم المراقب، الذي يعتمد على أزواج المدخلات والمخرجات الموسومة لتدريب النموذج، يتعامل التعلم غير المراقب مع البيانات التي لا تحتوي على تسميات تاريخية. يحاول النظام بشكل أساسي تعليم نفسه من خلال اكتشاف الهياكل أو الأنماط أو العلاقات المخفية داخل بيانات المدخلات. هذا النهج ذو قيمة خاصة لأن الغالبية العظمى من البيانات التي يتم إنشاؤها اليوم — الصور والفيديوهات والنصوص وسجلات أجهزة الاستشعار — غير منظمة و غير مصنفة.

كيف يعمل التعلم غير المراقب

في السيناريوهات غير الخاضعة للإشراف، يُترك الخوارزمية لتكتشف بنفسها الهياكل المثيرة للاهتمام في البيانات. وغالبًا ما يكون الهدف هو نمذجة التوزيع الأساسي للبيانات أو معرفة المزيد عن البيانات نفسها. ونظرًا لعدم توفر "إجابات صحيحة" أثناء التدريب، لا يمكن تقييم النموذج من حيث الدقة بالمعنى التقليدي. وبدلاً من ذلك، غالبًا ما يُقاس الأداء بمدى نجاح النموذج في تقليل الأبعاد أو تجميع نقاط البيانات المتشابهة معًا.

تعكس هذه المنهجية الطريقة التي يتعلم بها البشر المفاهيم الجديدة في كثير من الأحيان. على سبيل المثال، يمكن للطفل التمييز بين الكلاب والقطط من خلال ملاحظة اختلاف أشكالها وسلوكياتها دون أن يعرف بالضرورة أسماء "كلب" و "قطة" في البداية. وبالمثل، تقوم الخوارزميات غير الخاضعة للإشراف بتجميع المعلومات بناءً على أوجه التشابه المتأصلة. هذه القدرة أساسية لتطوير الذكاء الاصطناعي العام (AGI)، لأنها تسمح للأنظمة بالتكيف مع البيئات الجديدة دون إشراف بشري مستمر.

التقنيات الرئيسية في التعلم غير المراقب

يشمل التعلم غير المراقب عدة تقنيات متميزة، كل منها مناسب لأنواع مختلفة من مشاكل تحليل البيانات :

  • التجميع: هذا هو التطبيق الأكثر شيوعًا، حيث تقوم الخوارزمية بتجميع نقاط البيانات المتشابهة مع بعضها البعض. ومن الطرق الشائعة التجميع K-Means، الذي يقسم البيانات إلى k مجموعات متميزة بناءً على تشابه الميزات. ويستخدم هذا على نطاق واسع في تقسيم السوق لتحديد مجموعات العملاء ذات السلوكيات الشرائية المتشابهة.
  • تقليل الأبعاد: قد تكون البيانات عالية الأبعاد معقدة ومكلفة من الناحية الحسابية لمعالجتها. تقنيات مثل تحليل المكونات الرئيسية (PCA) تقلل من عدد المتغيرات في مجموعة البيانات مع الحفاظ على معلوماتها الأساسية. وهذا يبسط تصور البيانات ويسرع تدريب نماذج التعلم الآلي الأخرى.
  • كشف الحالات الشاذة: من خلال تعلم شكل البيانات "العادية"، يمكن للنماذج غير الخاضعة للإشراف تحديد القيم المتطرفة التي تنحرف بشكل كبير عن المعيار. وهذا أمر بالغ الأهمية لكشف الاحتيال في مجال التمويل، حيث تؤدي أنماط المعاملات غير العادية إلى إصدار تنبيهات أمنية.
  • تعلم قواعد الارتباط: تكتشف هذه التقنية العلاقات المثيرة للاهتمام بين المتغيرات في قواعد البيانات الكبيرة. وهي مشهورة باستخدامها في تحليل سلة السوق، حيث تساعد تجار التجزئة على فهم أن العملاء الذين يشترون الخبز من المرجح أن يشتروا الزبدة أيضًا.

التعلم غير المراقب مقابل التعلم المراقب

من المهم التمييز بين التعلم غير المراقب والتعلم المراقب. الفرق الأساسي يكمن في البيانات المستخدمة. يتطلب التعلم المراقب مجموعة بيانات مصنفة، مما يعني أن كل مثال تدريبي يقترن بناتج صحيح (على سبيل المثال، صورة قطة مصنفة على أنها "قطة"). يتعلم النموذج ربط المدخلات بالمخرجات لتقليل الأخطاء.

في المقابل، يستخدم التعلم غير الخاضع للإشراف بيانات غير مصنفة. لا توجد حلقة تغذية راجعة تخبر النموذج ما إذا كانت نتيجته صحيحة. هناك حل وسط يسمى التعلم شبه الخاضع للإشراف، والذي يجمع بين كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة لتحسين دقة التعلم، وغالبًا ما يستخدم عندما يكون تصنيف البيانات مكلفًا أو يستغرق وقتًا طويلاً.

تطبيقات واقعية

التعلم غير المراقب يدعم العديد من التقنيات التي نواجهها يوميًا. فيما يلي مثالان ملموسان:

  1. تقسيم العملاء في تجارة التجزئة: تحلل منصات التجارة الإلكترونية ملايين التفاعلات بين المستخدمين دون فئات محددة مسبقًا. باستخدام خوارزميات التجميع، تحدد هذه المنصات شخصيات مستخدمين متميزة، مثل "صيادي الصفقات في عطلة نهاية الأسبوع" أو "عشاق التكنولوجيا". وهذا يتيح حملات تسويقية وأنظمة توصيات مخصصة للغاية، مما يحسن تجربة العملاء بشكل كبير. تقسيم العملاء في تجارة التجزئة: تحلل منصات التجارة الإلكترونية ملايين التفاعلات بين المستخدمين دون
  2. تحليل التسلسل الجيني: في مجال المعلوماتية الحيوية، يستخدم الباحثون التعلم غير المراقب لتحليل البيانات الجينية. تقوم الخوارزميات بتجميع تسلسلات الحمض النووي للعثور على علامات جينية أو طفرات متشابهة عبر مجموعات سكانية مختلفة. وهذا يساعد في فهم العلاقات التطورية وتحديد الاستعدادات الجينية للإصابة بالأمراض دون الحاجة إلى معرفة مسبقة بوظيفة كل جين على حدة.

مثال على الكود: التجميع باستخدام Scikit-Learn

بينما Ultralytics YOLO26 هو في المقام الأول إطار عمل للكشف عن الكائنات الخاضعة للإشراف ، وغالبًا ما تُستخدم تقنيات غير خاضعة للإشراف في خطوات المعالجة المسبقة، مثل تحليل توزيعات مربعات الربط أو تجميع ميزات مجموعة البيانات. فيما يلي مثال بسيط باستخدام sklearn لتنفيذ تجميع K-Means ، وهي تقنية أساسية غير خاضعة للإشراف.

import numpy as np
from sklearn.cluster import KMeans

# Generate synthetic data: 10 points with 2 features each
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])

# Initialize KMeans with 2 clusters (k=2)
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")

# Fit the model to the data (no labels provided!)
kmeans.fit(X)

# Predict which cluster each point belongs to
print(f"Labels: {kmeans.labels_}")
# Output will group the first 3 points together (0) and the last 3 together (1)

دور التعلم غير المراقب في التعلم العميق

يتكامل التعلم العميق (DL) الحديث بشكل متزايد مع المبادئ غير الخاضعة للإشراف. تسمح تقنيات مثل التعلم الذاتي (SSL) للنماذج بإنشاء إشارات إشرافية خاصة بها من البيانات. على سبيل المثال، في معالجة اللغة الطبيعية (NLP)، يتم تدريب نماذج مثل GPT-4 مسبقًا على كميات هائلة من النصوص للتنبؤ بالكلمة التالية في الجملة، مما يؤدي إلى تعلم بنية اللغة بشكل فعال دون علامات واضحة.

وبالمثل، في الرؤية الحاسوبية (CV)، تُستخدم أجهزة التشفير التلقائي لتعلم تشفير البيانات بكفاءة. تعمل هذه الشبكات العصبية على ضغط الصور إلى تمثيل أبعاد أقل ثم إعادة بنائها. تعلم هذه العملية الشبكة أبرز ميزات البيانات المرئية ، وهو أمر مفيد لمهام مثل إزالة الضوضاء من الصور و النمذجة التوليدية.

بالنسبة لأولئك الذين يسعون إلى إدارة مجموعات البيانات للتدريب، توفر Ultralytics أدوات لتصور توزيعات البيانات، مما يساعد في تحديد المجموعات أو الحالات الشاذة قبل بدء عملية التدريب الخاضعة للإشراف. غالبًا ما يكون فهم بنية البيانات من خلال الاستكشاف غير الخاضع للإشراف هو الخطوة الأولى نحو بناء حلول ذكاء اصطناعي قوية.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن