Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

سيجمويد (Sigmoid)

استكشف دور الدالة السينيّة في التعلم الآلي. تعرّف على كيفية تمكين وظيفة التنشيط هذه للتصنيف الثنائي في نماذج مثل Ultralytics .

وظيفة Sigmoid هي مكون رياضي أساسي يستخدم على نطاق واسع في مجالات التعلم الآلي (ML) و التعلم العميق (DL). غالبًا ما يشار إليها باسم "وظيفة السحق"، وهي تأخذ أي رقم ذي قيمة حقيقية كمدخل وتربطه بقيمة بين 0 و 1. هذه المنحنى المميز على شكل حرف "S" يجعلها مفيدة للغاية لتحويل مخرجات النموذج الأولية إلى احتمالات قابلة للتفسير. في سياق الشبكة العصبية (NN)، تعمل الدالة السينيّة كدالة تنشيط، حيث تضيف عدم خطية تسمح للنماذج بتعلم أنماط معقدة تتجاوز العلاقات الخطية البسيطة. على الرغم من أنها تم استبدالها إلى حد كبير بدوال أخرى في الطبقات الخفية العميقة، إلا أنها تظل خيارًا قياسيًا لطبقات الإخراج في مهام التصنيف الثنائي .

آليات السيني في الذكاء الاصطناعي

في جوهرها، تقوم الدالة السينيّة بتحويل البيانات المدخلة — التي يشار إليها غالبًا باسم logits — إلى نطاق معياري. هذا التحويل ضروري للمهام التي يكون هدفها توقع احتمالية وقوع حدث ما. من خلال تحديد الناتج بين 0 و 1، توفر الدالة درجة احتمالية واضحة.

  • الانحدار اللوجستي: في النمذجة الإحصائية التقليدية، Sigmoid هو المحرك وراء الانحدار اللوجستي. وهو يسمح لعلماء البيانات بتقدير احتمالية نتيجة ثنائية، مثل ما إذا كان العميل سيترك الخدمة أم سيبقى.
  • التصنيف الثنائي: بالنسبة للشبكات العصبية المصممة للتمييز بين فئتين (على سبيل المثال، "قطة" مقابل "كلب")، غالبًا ما تستخدم الطبقة النهائية تنشيطًا سيغموديًا. إذا كان الناتج أكبر من عتبة (عادةً 0.5)، يتنبأ النموذج بالفئة الإيجابية.
  • التصنيف متعدد العلامات: على عكس المشكلات متعددة الفئات حيث تكون الفئات متعارضة، تسمح المهام متعددة العلامات للصورة أو النص بالانتماء إلى فئات متعددة في وقت واحد. هنا، يتم تطبيق Sigmoid بشكل مستقل على كل عقدة إخراج، مما يمكّن النموذج من detect " و"شخص" في نفس المشهد دون تعارض.

الاختلافات الرئيسية عن وظائف التنشيط الأخرى

بينما كان Sigmoid هو الإعداد الافتراضي لجميع الطبقات في السابق، اكتشف الباحثون قيودًا مثل مشكلة التدرج المتلاشي، حيث تصبح التدرجات صغيرة جدًا بحيث لا يمكن تحديث الأوزان بشكل فعال في الشبكات العميقة. أدى ذلك إلى اعتماد بدائل للطبقات المخفية .

  • Sigmoid مقابل ReLU (وحدة خطية مصححة): ReLU أسرع حسابيًا ويتجنب التدرجات المتلاشية عن طريق إخراج المدخلات مباشرةً إذا كانت موجبة، وصفرًا في الحالات الأخرى.وهو الخيار المفضل للطبقات المخفية في البنى الحديثة مثل YOLO26، بينما يتم حجز Sigmoid للطبقة النهائية في مهام محددة.
  • Sigmoid مقابل Softmax: كلاهما يعين النواتج إلى نطاق 0-1، لكنهما يخدمان أغراضًا مختلفة. يعامل Sigmoid كل ناتج على حدة، مما يجعله مثاليًا للمهام الثنائية أو متعددة التسميات. يفرض Softmax على جميع النواتج أن يبلغ مجموعها 1، مما يخلق توزيعًا احتماليًا يستخدم في التصنيف متعدد الفئات حيث تكون فئة واحدة فقط هي الصحيحة.

تطبيقات واقعية

تتعدد فوائد الدالة السينيّة في مختلف الصناعات التي تتطلب تقدير الاحتمالات.

  1. التشخيص الطبي: غالبًا ما تستخدم نماذج الذكاء الاصطناعي المستخدمة في تحليل الصور الطبية مخرجات سيغمويد لتوقع احتمالية وجود مرض في الأشعة السينية أو التصوير بالرنين المغناطيسي. على سبيل المثال، قد تنتج النموذج 0.85، مما يشير إلى احتمالية وجود ورم بنسبة 85٪، مما يساعد الأطباء في الكشف المبكر.
  2. كشف البريد العشوائي: تستخدم أنظمة تصفية البريد الإلكتروني نماذج معالجة اللغة الطبيعية (NLP) مع مصنفات Sigmoid لتحديد ما إذا كانت الرسالة الواردة "بريدًا عشوائيًا" أم "ليست بريدًا عشوائيًا". يقوم النموذج بتحليل الكلمات الرئيسية والبيانات الوصفية، ويصدر نتيجة تحدد ما إذا كان البريد الإلكتروني سيصل إلى صندوق الوارد أم إلى مجلد البريد غير المرغوب فيه.

التنفيذ العملي

يمكنك ملاحظة كيفية قيام Sigmoid بتحويل البيانات باستخدام PyTorch وهي مكتبة شائعة لبناء نماذج التعلم العميق. يوضح هذا المثال البسيط تأثير "السحق" على مجموعة من قيم الإدخال.

import torch
import torch.nn as nn

# Create a Sigmoid layer
sigmoid = nn.Sigmoid()

# Define input data (logits) ranging from negative to positive
input_data = torch.tensor([-5.0, -1.0, 0.0, 1.0, 5.0])

# Apply Sigmoid to squash values between 0 and 1
output = sigmoid(input_data)

print(f"Input: {input_data}")
print(f"Output: {output}")
# Output values near 0 for negative inputs, 0.5 for 0, and near 1 for positive inputs

بالنسبة لأولئك الذين يرغبون في تدريب النماذج التي تستخدم هذه المفاهيم دون كتابة كود منخفض المستوى، توفر Ultralytics واجهة سهلة الاستخدام لإدارة مجموعات البيانات وتدريب النماذج الحديثة مثل YOLO26. من خلال التعامل مع تعقيدات البنية تلقائيًا، تتيح للمستخدمين التركيز على جمع بيانات تدريب عالية الجودة لتطبيقات الرؤية الحاسوبية الخاصة بهم .

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن