استكشف التعلم غير الخاضع للإشراف لاكتشاف الأنماط الخفية في البيانات غير المصنفة. تعرف على التجميع والكشف عن الحالات الشاذة وكيف يدعم ذلك حلول الذكاء الاصطناعي الحديثة.
التعلم غير المراقب هو نوع من أنواع التعلم الآلي حيث تتعلم الخوارزمية الأنماط من البيانات غير الموسومة دون تدخل بشري. على عكس التعلم المراقب، الذي يعتمد على أزواج المدخلات والمخرجات الموسومة لتدريب النموذج، يتعامل التعلم غير المراقب مع البيانات التي لا تحتوي على تسميات تاريخية. يحاول النظام بشكل أساسي تعليم نفسه من خلال اكتشاف الهياكل أو الأنماط أو العلاقات المخفية داخل بيانات المدخلات. هذا النهج ذو قيمة خاصة لأن الغالبية العظمى من البيانات التي يتم إنشاؤها اليوم — الصور والفيديوهات والنصوص وسجلات أجهزة الاستشعار — غير منظمة و غير مصنفة.
في السيناريوهات غير الخاضعة للإشراف، يُترك الخوارزمية لتكتشف بنفسها الهياكل المثيرة للاهتمام في البيانات. وغالبًا ما يكون الهدف هو نمذجة التوزيع الأساسي للبيانات أو معرفة المزيد عن البيانات نفسها. ونظرًا لعدم توفر "إجابات صحيحة" أثناء التدريب، لا يمكن تقييم النموذج من حيث الدقة بالمعنى التقليدي. وبدلاً من ذلك، غالبًا ما يُقاس الأداء بمدى نجاح النموذج في تقليل الأبعاد أو تجميع نقاط البيانات المتشابهة معًا.
تعكس هذه المنهجية الطريقة التي يتعلم بها البشر المفاهيم الجديدة في كثير من الأحيان. على سبيل المثال، يمكن للطفل التمييز بين الكلاب والقطط من خلال ملاحظة اختلاف أشكالها وسلوكياتها دون أن يعرف بالضرورة أسماء "كلب" و "قطة" في البداية. وبالمثل، تقوم الخوارزميات غير الخاضعة للإشراف بتجميع المعلومات بناءً على أوجه التشابه المتأصلة. هذه القدرة أساسية لتطوير الذكاء الاصطناعي العام (AGI)، لأنها تسمح للأنظمة بالتكيف مع البيئات الجديدة دون إشراف بشري مستمر.
يشمل التعلم غير المراقب عدة تقنيات متميزة، كل منها مناسب لأنواع مختلفة من مشاكل تحليل البيانات :
من المهم التمييز بين التعلم غير المراقب والتعلم المراقب. الفرق الأساسي يكمن في البيانات المستخدمة. يتطلب التعلم المراقب مجموعة بيانات مصنفة، مما يعني أن كل مثال تدريبي يقترن بناتج صحيح (على سبيل المثال، صورة قطة مصنفة على أنها "قطة"). يتعلم النموذج ربط المدخلات بالمخرجات لتقليل الأخطاء.
في المقابل، يستخدم التعلم غير الخاضع للإشراف بيانات غير مصنفة. لا توجد حلقة تغذية راجعة تخبر النموذج ما إذا كانت نتيجته صحيحة. هناك حل وسط يسمى التعلم شبه الخاضع للإشراف، والذي يجمع بين كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير المصنفة لتحسين دقة التعلم، وغالبًا ما يستخدم عندما يكون تصنيف البيانات مكلفًا أو يستغرق وقتًا طويلاً.
التعلم غير المراقب يدعم العديد من التقنيات التي نواجهها يوميًا. فيما يلي مثالان ملموسان:
بينما Ultralytics YOLO26 هو في المقام الأول إطار عمل للكشف عن الكائنات الخاضعة للإشراف
، وغالبًا ما تُستخدم تقنيات غير خاضعة للإشراف في خطوات المعالجة المسبقة، مثل تحليل توزيعات مربعات الربط
أو تجميع ميزات مجموعة البيانات. فيما يلي مثال بسيط باستخدام sklearn لتنفيذ تجميع K-Means
، وهي تقنية أساسية غير خاضعة للإشراف.
import numpy as np
from sklearn.cluster import KMeans
# Generate synthetic data: 10 points with 2 features each
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
# Initialize KMeans with 2 clusters (k=2)
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")
# Fit the model to the data (no labels provided!)
kmeans.fit(X)
# Predict which cluster each point belongs to
print(f"Labels: {kmeans.labels_}")
# Output will group the first 3 points together (0) and the last 3 together (1)
يتكامل التعلم العميق (DL) الحديث بشكل متزايد مع المبادئ غير الخاضعة للإشراف. تسمح تقنيات مثل التعلم الذاتي (SSL) للنماذج بإنشاء إشارات إشرافية خاصة بها من البيانات. على سبيل المثال، في معالجة اللغة الطبيعية (NLP)، يتم تدريب نماذج مثل GPT-4 مسبقًا على كميات هائلة من النصوص للتنبؤ بالكلمة التالية في الجملة، مما يؤدي إلى تعلم بنية اللغة بشكل فعال دون علامات واضحة.
وبالمثل، في الرؤية الحاسوبية (CV)، تُستخدم أجهزة التشفير التلقائي لتعلم تشفير البيانات بكفاءة. تعمل هذه الشبكات العصبية على ضغط الصور إلى تمثيل أبعاد أقل ثم إعادة بنائها. تعلم هذه العملية الشبكة أبرز ميزات البيانات المرئية ، وهو أمر مفيد لمهام مثل إزالة الضوضاء من الصور و النمذجة التوليدية.
بالنسبة لأولئك الذين يسعون إلى إدارة مجموعات البيانات للتدريب، توفر Ultralytics أدوات لتصور توزيعات البيانات، مما يساعد في تحديد المجموعات أو الحالات الشاذة قبل بدء عملية التدريب الخاضعة للإشراف. غالبًا ما يكون فهم بنية البيانات من خلال الاستكشاف غير الخاضع للإشراف هو الخطوة الأولى نحو بناء حلول ذكاء اصطناعي قوية.