مسرد المصطلحات

العمود الفقري

اكتشف دور العمود الفقري في التعلُّم العميق، واستكشف أفضل البنى مثل ResNet وViT، وتعرّف على تطبيقات الذكاء الاصطناعي في العالم الحقيقي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

في التعلّم العميق، لا سيما في مجال الرؤية الحاسوبية، يشير "العمود الفقري" إلى مجموعة الطبقات الأولية والتأسيسية في نموذج الشبكة العصبية (NN). والغرض الأساسي منها هو استخراج السمات: معالجة بيانات المدخلات الأولية، مثل الصورة، وتحويلها إلى تمثيل مضغوط وغني بالمعلومات. هذا التمثيل، الذي يُطلق عليه غالبًا خرائط السمات، يلتقط الأنماط والقوام والأشكال الأساسية من المدخلات. فكر في العمود الفقري كعينين للذكاء الاصطناعي، حيث يقوم بالتفسير الأولي قبل أن يحدث التفكير على مستوى أعلى. هذه المعالجة التأسيسية أمر بالغ الأهمية لقدرة النموذج الكلية على فهم وتفسير المعلومات البصرية للمهام اللاحقة.

الوظائف الأساسية

ويتكون العمود الفقري النموذجي من سلسلة من الطبقات، تتضمن عادةً طبقات التلافيف، وطبقات التجميع (التي تقلل من الأبعاد المكانية)، ووظائف التنشيط (التي تقدم اللاخطية). ومع مرور البيانات المدخلة عبر هذه الطبقات، تتعلم الشبكة تدريجيًا السمات الهرمية. قد تكتشف الطبقات المبكرة عناصر بسيطة مثل الحواف والزوايا، بينما تجمع الطبقات الأعمق بين هذه الميزات الأبسط للتعرف على البنى الأكثر تعقيدًا وأجزاء من الأشياء، وفي النهاية الأشياء بأكملها. المخرجات التي يتم إنشاؤها بواسطة العمود الفقري هي مجموعة من خرائط السمات عالية المستوى التي تلخص المعلومات المهمة من المدخلات الأصلية. تقلل هذه العملية بفعالية من أبعاد البيانات مع الحفاظ على معناها الدلالي، مما يشكل الأساس للعديد من نماذج التعلم العميق الناجحة.

الدور في نماذج الرؤية الحاسوبية

في نماذج الرؤية الحاسوبية المتطورة المصممة لمهام مثل اكتشاف الأجسام أو تجزئة النماذج أو تقدير الوضع، يوفر العمود الفقري تمثيل الميزة الأساسية. وتعتمد المكونات اللاحقة، التي غالباً ما تسمى "الرقبة" (التي تقوم بتنقيح وتجميع الميزات) و"الرأس" (الذي يقوم بالتنبؤ بالمهمة النهائية)، على الميزات المستخرجة من العمود الفقري. على سبيل المثال، يستخدم رأس الكشف هذه الميزات المنقحة للتنبؤ بالمربعات المحيطة بالأجسام المكتشفة وفئاتها المقابلة. ويتميز العمود الفقري عن هذه المراحل اللاحقة؛ حيث ينصب تركيزه الوحيد على توليد تمثيل ميزات قوية، وغالبًا ما تكون ذات أغراض عامة، من بيانات الإدخال. تتمثل الممارسة الشائعة في استخدام العمود الفقري المدرب مسبقًا على مجموعات بيانات واسعة النطاق مثل ImageNet ثم ضبطها لمهام نهائية محددة باستخدام التعلم التحويل، مما يسرع عملية التدريب بشكل كبير.

هياكل العمود الفقري الشائعة

يتم استخدام العديد من بنيات الشبكات العصبية الراسخة بشكل متكرر كعمود فقري نظرًا لفعاليتها المثبتة في استخراج السمات:

يؤثر اختيار العمود الفقري بشكل كبير على خصائص أداء النموذج، بما في ذلك السرعة والتكلفة الحسابية(FLOPs) والدقة، كما هو موضح في مقارنات النماذج المختلفة. أطر مثل PyTorch و TensorFlowجنبًا إلى جنب مع مكتبات مثل OpenCV، هي أدوات أساسية لتنفيذ واستخدام هذه العمود الفقري. كما تعمل المنصات مثل Ultralytics HUB على تبسيط عملية استخدام النماذج ذات العمود الفقري المختلفة.

التمييز بين العمود الفقري والمصطلحات ذات الصلة

من المهم عدم الخلط بين العمود الفقري والشبكة العصبية بأكملها أو مكونات أخرى محددة:

  • الشبكة العصبية بأكملها: العمود الفقري هو جزء واحد فقط، عادةً ما يكون جزء استخراج الميزة الأولية، من بنية شبكة أكبر. وتتضمن الشبكة الكاملة أيضًا الرقبة والرأس (الرؤوس) المسؤولة عن التنبؤات الخاصة بالمهام.
  • رأس الكشف: هذا هو الجزء الأخير من نموذج الكشف عن الكائنات الذي يأخذ الميزات (غالبًا ما تتم معالجتها بواسطة كل من العمود الفقري والرقبة) ويخرج إحداثيات الصندوق المحدود واحتمالات الفئة. إنه خاص بمهمة محددة، على عكس العمود الفقري الأكثر عمومية.
  • مستخرج الميزات: في حين أن العمود الفقري هو مستخرج الميزات، فإن مصطلح "مستخرج الميزات" يمكن أن يشير أحيانًا إلى أي جزء من الشبكة يستخرج الميزات، أو حتى خوارزميات استخراج الميزات المستقلة خارج نطاق التعلم العميق (مثل SIFT أو HOG). في سياق بنيات التعلم العميق الحديثة مثل Ultralytics YOLOيشير "العمود الفقري" على وجه التحديد إلى القاعدة الالتفافية الأولية.

التطبيقات الواقعية

العمود الفقري هي مكونات أساسية في عدد لا يحصى من تطبيقات الذكاء الاصطناعي:

  1. القيادة الذاتية: تعتمد الأنظمة في السيارات ذاتية القيادة اعتماداً كبيراً على العمود الفقري القوي (على سبيل المثال، متغيرات ResNet أو EfficientNet) لمعالجة المدخلات من الكاميرات ومستشعرات LiDAR. تمكّن الميزات المستخرجة من اكتشاف وتصنيف المركبات والمشاة وإشارات المرور وخطوط المسارات، وهو أمر بالغ الأهمية للملاحة الآمنة واتخاذ القرارات، كما رأينا في الأنظمة التي طورتها شركات مثل Waymo.
  2. تحليل الصور الطبية: في حلول الذكاء الاصطناعي في مجال الرعاية الصحية، تُستخدم العمود الفقري لتحليل الفحوصات الطبية مثل الأشعة السينية أو الأشعة المقطعية أو التصوير بالرنين المغناطيسي. على سبيل المثال، قد يستخرج العمود الفقري مثل DenseNet ميزات من الأشعة السينية للصدر للمساعدة في الكشف عن علامات الالتهاب الرئوي أو من الأشعة المقطعية لتحديد الأورام المحتملة(الأبحاث ذات الصلة في طب الأشعة: الذكاء الاصطناعي). وهذا يساعد أخصائيي الأشعة في التشخيص وتخطيط العلاج. نماذج Ultralytics مثل YOLO11 يمكن تكييفها لمهام مثل الكشف عن الأورام من خلال الاستفادة من العمود الفقري القوي.
قراءة الكل