اكتشف دور العمود الفقري في التعلُّم العميق، واستكشف أفضل البنى مثل ResNet وViT، وتعرّف على تطبيقات الذكاء الاصطناعي في العالم الحقيقي.
في مجال التعلّم العميق، لا سيما في مجال الرؤية الحاسوبية، يشير مصطلح "العمود الفقري" إلى جزء أساسي من الشبكة العصبية المسؤول عن استخراج الميزة. فكر فيه على أنه الأساس الذي تُبنى عليه بقية الشبكة. يأخذ العمود الفقري البيانات المدخلة الخام، مثل الصور، ويحولها إلى تنسيق منظم، يُعرف باسم خرائط السمات، والتي يمكن استخدامها بفعالية من قبل الأجزاء اللاحقة من الشبكة. تلتقط خرائط الميزات هذه المعلومات الأساسية حول المدخلات، مثل الحواف والأنسجة والأشكال، مما يمكّن النموذج من فهم وتفسير البيانات المرئية المعقدة. بالنسبة للمستخدمين الملمين بمفاهيم التعلم الآلي الأساسية، يمكن فهم العمود الفقري على أنه الطبقات الأولية للشبكة العصبية التي تتعلم التمثيلات الهرمية لبيانات المدخلات.
يلعب العمود الفقري دورًا حاسمًا في تحديد الأداء العام وكفاءة نموذج التعلم العميق. ويتكون عادةً من طبقات متعددة من عمليات التلافيف والتجميع والتنشيط. تكون الطبقات التلافيفية مسؤولة عن استخراج الميزات من بيانات الإدخال، بينما تقلل طبقات التجميع من الأبعاد المكانية لخرائط الميزات، مما يجعل النموذج أكثر كفاءة من الناحية الحسابية. تُدخل وظائف التنشيط اللاخطية في الشبكة، مما يسمح لها بتعلم الأنماط المعقدة. يتم بعد ذلك تغذية مخرجات العمود الفقري، أي خرائط السمات، في الأجزاء اللاحقة من الشبكة، مثل رؤوس الكشف لاكتشاف الأجسام أو وحدات التجزئة لتجزئة الصور. تؤثر جودة الميزات المستخرجة بواسطة العمود الفقري بشكل مباشر على قدرة النموذج على أداء المهمة المقصودة بدقة.
اكتسبت العديد من البنى الأساسية شعبية في مجال الرؤية الحاسوبية نظراً لفعاليتها في مختلف المهام. وتشمل بعض الأمثلة البارزة ما يلي:
تُعد العمود الفقري أساسيًا لمجموعة واسعة من تطبيقات الذكاء الاصطناعي في العالم الحقيقي، مما يمكّن الآلات من "رؤية" البيانات المرئية وتفسيرها بطريقة مشابهة للبشر. فيما يلي مثالان ملموسان:
في السيارات ذاتية القيادة، تُستخدم العمود الفقري لمعالجة البيانات المرئية من الكاميرات وأجهزة الاستشعار الأخرى، مما يسمح للمركبة بإدراك محيطها. على سبيل المثال Ultralytics YOLO تستخدم النماذج العمود الفقري الفعال لاكتشاف الأجسام مثل المشاة والمركبات الأخرى وإشارات المرور في الوقت الفعلي. هذه المعلومات ضرورية لنظام الملاحة في السيارة لاتخاذ قرارات مستنيرة وضمان القيادة الآمنة.
في تحليل الصور الطبية، يتم استخدام العمود الفقري لاستخراج الميزات من الصور الطبية مثل الأشعة السينية والتصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب. يمكن بعد ذلك استخدام هذه الميزات في مهام مثل تشخيص الأمراض، والكشف عن الشذوذ، وتجزئة البنى التشريحية. على سبيل المثال، يمكن تدريب العمود الفقري على مجموعة بيانات من صور أورام الدماغ، مثل مجموعة بيانات الكشف عن أورام الدماغ، لتعلم الميزات ذات الصلة التي تساعد في تحديد الأورام وتحديد مواقعها.
يعتمد اختيار العمود الفقري المناسب لتطبيق معين على عدة عوامل، بما في ذلك مدى تعقيد المهمة، والموارد الحاسوبية المتاحة، والدقة المطلوبة. بالنسبة للبيئات ذات الموارد المحدودة، مثل الأجهزة المحمولة أو تطبيقات الذكاء الاصطناعي المتطورة، قد يُفضل استخدام عمود فقري أخف مع عدد أقل من المعلمات. من ناحية أخرى، بالنسبة للمهام التي تتطلب دقة عالية، قد يكون من الضروري استخدام عمود فقري أعمق وأكثر تعقيدًا.
من المهم التمييز بين العمود الفقري والمكونات الأخرى للشبكة العصبية. فبينما يستخرج العمود الفقري الميزات، تكون الأجزاء الأخرى من الشبكة، مثل رأس الكشف أو وحدة التجزئة، مسؤولة عن إجراء تنبؤات بناءً على تلك الميزات. فالعمود الفقري يشبه عيون الشبكة، حيث يوفر المعلومات البصرية الخام، بينما تكون المكونات الأخرى مثل الدماغ، حيث تقوم بتفسير تلك المعلومات لأداء مهام محددة. بالإضافة إلى ذلك، غالبًا ما يتم تطبيق مفهوم نقل التعلّم على العمود الفقري، حيث يتم استخدام العمود الفقري المدرّب مسبقًا على مجموعة بيانات كبيرة مثل ImageNet كنقطة انطلاق للتدريب على مهمة جديدة. يسمح ذلك للنموذج بالاستفادة من المعرفة المكتسبة من مجموعة بيانات ما قبل التدريب، مما يحسن الأداء ويقلل من وقت التدريب. تعمل أدوات مثل Ultralytics HUB على تبسيط عملية تجربة النماذج الأساسية المختلفة وتدريب النماذج المخصصة.