اكتشف دور العمود الفقري في التعلُّم العميق، واستكشف أفضل البنى مثل ResNet وViT، وتعرّف على تطبيقات الذكاء الاصطناعي في العالم الحقيقي.
في التعلّم العميق، لا سيما في مجال الرؤية الحاسوبية، يشير "العمود الفقري" إلى مجموعة الطبقات الأولية والتأسيسية في نموذج الشبكة العصبية (NN). والغرض الأساسي منها هو استخراج السمات: معالجة بيانات المدخلات الأولية، مثل الصورة، وتحويلها إلى تمثيل مضغوط وغني بالمعلومات. هذا التمثيل، الذي يُطلق عليه غالبًا خرائط السمات، يلتقط الأنماط والقوام والأشكال الأساسية من المدخلات. فكر في العمود الفقري كعينين للذكاء الاصطناعي، حيث يقوم بالتفسير الأولي قبل أن يحدث التفكير على مستوى أعلى. هذه المعالجة التأسيسية أمر بالغ الأهمية لقدرة النموذج الكلية على فهم وتفسير المعلومات البصرية للمهام اللاحقة.
ويتكون العمود الفقري النموذجي من سلسلة من الطبقات، تتضمن عادةً طبقات التلافيف، وطبقات التجميع (التي تقلل من الأبعاد المكانية)، ووظائف التنشيط (التي تقدم اللاخطية). ومع مرور البيانات المدخلة عبر هذه الطبقات، تتعلم الشبكة تدريجيًا السمات الهرمية. قد تكتشف الطبقات المبكرة عناصر بسيطة مثل الحواف والزوايا، بينما تجمع الطبقات الأعمق بين هذه الميزات الأبسط للتعرف على البنى الأكثر تعقيدًا وأجزاء من الأشياء، وفي النهاية الأشياء بأكملها. المخرجات التي يتم إنشاؤها بواسطة العمود الفقري هي مجموعة من خرائط السمات عالية المستوى التي تلخص المعلومات المهمة من المدخلات الأصلية. تقلل هذه العملية بفعالية من أبعاد البيانات مع الحفاظ على معناها الدلالي، مما يشكل الأساس للعديد من نماذج التعلم العميق الناجحة.
في نماذج الرؤية الحاسوبية المتطورة المصممة لمهام مثل اكتشاف الأجسام أو تجزئة النماذج أو تقدير الوضع، يوفر العمود الفقري تمثيل الميزة الأساسية. وتعتمد المكونات اللاحقة، التي غالباً ما تسمى "الرقبة" (التي تقوم بتنقيح وتجميع الميزات) و"الرأس" (الذي يقوم بالتنبؤ بالمهمة النهائية)، على الميزات المستخرجة من العمود الفقري. على سبيل المثال، يستخدم رأس الكشف هذه الميزات المنقحة للتنبؤ بالمربعات المحيطة بالأجسام المكتشفة وفئاتها المقابلة. ويتميز العمود الفقري عن هذه المراحل اللاحقة؛ حيث ينصب تركيزه الوحيد على توليد تمثيل ميزات قوية، وغالبًا ما تكون ذات أغراض عامة، من بيانات الإدخال. تتمثل الممارسة الشائعة في استخدام العمود الفقري المدرب مسبقًا على مجموعات بيانات واسعة النطاق مثل ImageNet ثم ضبطها لمهام نهائية محددة باستخدام التعلم التحويل، مما يسرع عملية التدريب بشكل كبير.
يتم استخدام العديد من بنيات الشبكات العصبية الراسخة بشكل متكرر كعمود فقري نظرًا لفعاليتها المثبتة في استخراج السمات:
يؤثر اختيار العمود الفقري بشكل كبير على خصائص أداء النموذج، بما في ذلك السرعة والتكلفة الحسابية(FLOPs) والدقة، كما هو موضح في مقارنات النماذج المختلفة. أطر مثل PyTorch و TensorFlowجنبًا إلى جنب مع مكتبات مثل OpenCV، هي أدوات أساسية لتنفيذ واستخدام هذه العمود الفقري. كما تعمل المنصات مثل Ultralytics HUB على تبسيط عملية استخدام النماذج ذات العمود الفقري المختلفة.
من المهم عدم الخلط بين العمود الفقري والشبكة العصبية بأكملها أو مكونات أخرى محددة:
العمود الفقري هي مكونات أساسية في عدد لا يحصى من تطبيقات الذكاء الاصطناعي: