Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

التعلم التبايني

استكشف التعلم التبايني في التعلم الآلي. تعرف على كيفية استخدامه للبيانات الخاضعة للإشراف الذاتي لبناء ميزات ذكاء اصطناعي قوية لـ Ultralytics والرؤية الحاسوبية.

التعلم التبايني هو نموذج للتعلم الآلي يعلم النماذج فهم البيانات من خلال مقارنة العينات المتشابهة والمختلفة . على عكس التعلم التقليدي المشرف عليه، الذي يعتمد بشكل كبير على مجموعات البيانات المصنفة يدويًا، غالبًا ما يستخدم التعلم التبايني في سياقات التعلم الذاتي المشرف عليه. الفكرة الأساسية بسيطة ولكنها قوية: يتعلم النموذج سحب تمثيلات العناصر ذات الصلة (الأزواج الإيجابية) في فضاء متجه بينما يدفع العناصر غير ذات الصلة (الأزواج السلبية) بعيدًا عن بعضها. تسمح هذه العملية للخوارزميات ببناء ميزات قوية وقابلة للتعميم من كميات هائلة من البيانات غير المصنفة، وهو أمر بالغ الأهمية لتوسيع نطاق أنظمة الذكاء الاصطناعي (AI).

آلية التعلم التبايني

يكمن مفهوم التعلم عن طريق المقارنة في صميم التعلم التبايني. فبدلاً من حفظ أن صورة معينة هي "قطة"، يتعلم النموذج أن صورتين مختلفتين لقطتين أكثر تشابهاً مع بعضهما البعض من أي منهما مع صورة كلب. ويتم تحقيق ذلك عادةً من خلال زيادة البيانات. يتم تحويل الصورة المدخلة، والتي غالبًا ما تسمى "المرساة"، إلى نسختين مختلفتين باستخدام تقنيات مثل الاقتصاص أو التقليب أو تذبذب الألوان . تشكل هاتان النسختان زوجًا إيجابيًا. ثم يتم تدريب النموذج على تقليل المسافة بين تضميناتهما مع زيادة المسافة إلى الصور العشوائية الأخرى (العينات السلبية) في الدفعة.

يساعد هذا النهج الشبكة العصبية على التركيز على السمات الدلالية عالية المستوى بدلاً من تفاصيل البكسل منخفضة المستوى. على سبيل المثال، سواء كانت السيارة حمراء أو زرقاء، أو موجهة إلى اليسار أو اليمين، فإن المفهوم الأساسي لـ "السيارة" يظل كما هو. من خلال تجاهل هذه الاختلافات السطحية ، يطور النموذج فهمًا أعمق للعالم البصري، مما يفيد بشكل كبير المهام النهائية مثل اكتشاف الكائنات وتصنيفها.

تطبيقات واقعية

أصبح التعلم التبايني حجر الزاوية للعديد من تطبيقات الذكاء الاصطناعي الحديثة، لا سيما عندما تكون البيانات المصنفة نادرة أو باهظة الثمن.

  1. تصنيف الصور بدون تدريب: تستخدم نماذج مثل CLIP (التدريب المسبق على اللغة والصورة التباينية) التعلم التبايني لمواءمة الصور والنصوص في مساحة ميزات مشتركة. من خلال التدريب على ملايين أزواج الصور والنصوص ، يتعلم النموذج ربط المفاهيم البصرية بوصف اللغة الطبيعية. وهذا يتيح التعلم بدون تدريب، حيث يمكن للنموذج classify إلى فئات لم يرها من قبل أثناء التدريب ببساطة عن طريق مطابقة الصورة مع موجه نصي.
  2. تدريب مسبق قوي للتصوير الطبي: في مجال الرعاية الصحية، يعد الحصول على فحوصات طبية مصنفة من قبل خبراء أمرًا مكلفًا ويستغرق وقتًا طويلاً. يستخدم الباحثون التعلم التبايني لتدريب النماذج مسبقًا على قواعد بيانات كبيرة من الأشعة السينية أو الأشعة المقطعية غير المصنفة. يخلق هذا التدريب المسبق غير الخاضع للإشراف بنية أساسية قوية يمكن ضبطها بدقة باستخدام عدد صغير من الأمثلة المصنفة detect مثل الالتهاب الرئوي أو الأورام بدقة عالية. تستفيد هذه التقنية من التعلم النقلي لتحسين أدوات التشخيص في الذكاء الاصطناعي في مجال الرعاية الصحية.

التمييز بين المفاهيم ذات الصلة

من المفيد التمييز بين التعلم التبايني والتقنيات المماثلة لفهم دوره الفريد في مجال التعلم الآلي (ML).

  • مقابل أجهزة التشفير التلقائي: في حين أن كلاهما طريقتان غير خاضعتان للإشراف، تهدف أجهزة التشفير التلقائي إلى إعادة بناء البيانات المدخلة بكسل بكسل، وضغطها في طبقة عنق الزجاجة. من ناحية أخرى، لا يحاول التعلم التبايني إعادة إنشاء الصورة، بل يركز فقط على تعلم التمثيلات التمييزية التي تفصل بين المفاهيم المختلفة.
  • مقابل الشبكات التنافسية التوليدية (GANs): تتضمن الشبكات التنافسية التوليدية (GANs) مولدًا يقوم بإنشاء بيانات مزيفة ومميّزًا يحاول detect . يركز التعلم التبايني على تعلم التمثيل بدلاً من إنشاء البيانات، مما يجعله أكثر ملاءمة لمهام مثل البحث والاسترجاع والتصنيف.
  • مقابل خسارة الثلاثيات: تتطلب خسارة الثلاثيات التقليدية بشكل صريح مرساة وعينة إيجابية وسلبية. تعمم الطرق التباينية الحديثة، مثل SimCLR أو MoCo، هذا الأمر من خلال مقارنة المرساة بالعديد من العينات السلبية في وقت واحد داخل دفعة، غالبًا باستخدام وظيفة خسارة محددة مثل InfoNCE.

مثال عملي مع التضمينات

في حين أن تدريب نموذج مقارن من الصفر يتطلب موارد كثيرة، يمكنك بسهولة استخدام نماذج مدربة مسبقًا لاستخراج الميزات. يوضح المثال التالي كيفية تحميل نموذج واستخراج متجه الميزات (التضمين) لصورة باستخدام ultralytics الحزمة. يمثل هذا التضمين المحتوى الدلالي الذي تم تعلمه عبر تقنيات مشابهة للتدريب المسبق التبايني.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image to get the results
# The 'embed' argument can be used in advanced workflows to extract feature layers
results = model("https://ultralytics.com/images/bus.jpg")

# Access the top predicted class probability
# This prediction is based on the learned feature representations
print(f"Top class: {results[0].names[results[0].probs.top1]}")
print(f"Confidence: {results[0].probs.top1conf:.4f}")

هذه القدرة على استخراج ميزات غنية وذات مغزى تجعل التعلم التبايني ضروريًا لبناء أنظمة الرؤية الحاسوبية الحديثة (CV) ، مما يتيح البحثالفعال عن الصور والتحليلات المتقدمة. لإدارة مجموعات البيانات وتدريب النماذج المخصصة التي تستفيد من هذه البنى المتقدمة، توفر Ultralytics بيئة مبسطة للنشر والمراقبة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن