Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

العمود الفقري

استكشف دور العمود الفقري في التعلم العميق. تعرف على كيفية استخدام Ultralytics للعمود الفقري المحسّن من أجل استخراج الميزات وكشف الأجسام بسرعة ودقة.

العمود الفقري هو المكون الأساسي لاستخراج الميزات في بنية التعلم العميق، حيث يعمل كمحرك أساسي يحول البيانات الخام إلى تمثيلات ذات معنى. في سياق الرؤية الحاسوبية، يتكون العمود الفقري عادةً من سلسلة من الطبقات داخل شبكة عصبية تعالج الصور المدخلة لتحديد الأنماط الهرمية. تتراوح هذه الأنماط من ميزات بسيطة منخفضة المستوى مثل الحواف والأنسجة إلى مفاهيم معقدة عالية المستوى مثل الأشكال والأشياء. يُشار إلى ناتج العمود الفقري غالبًا باسم خريطة الميزات، وهو بمثابة مدخلات للمكونات النهائية التي تؤدي مهام محددة مثل التصنيف أو الكشف.

دور العمود الفقري

تتمثل الوظيفة الأساسية للعمود الفقري في "رؤية" وفهم المحتوى المرئي للصورة قبل اتخاذ أي قرارات محددة. وهو يعمل كمترجم عالمي، حيث يحول قيم البكسل إلى تنسيق مكثف وغني بالمعلومات. تعتمد معظم الأعمدة الفقرية الحديثة على الشبكات العصبية التلافيفية (CNN) أو محولات الرؤية (ViT) ويتم تدريبها مسبقًا في كثير من الأحيان على مجموعات بيانات ضخمة مثل ImageNet. عملية التدريب المسبق هذه ، وهي جانب أساسي من جوانب التعلم النقلي، تمكن النموذج من الاستفادة من الميزات المرئية التي تم تعلمها مسبقًا، مما يقلل بشكل كبير من البيانات والوقت اللازمين لتدريب نموذج جديد لتطبيق معين.

على سبيل المثال، عند استخدام Ultralytics تتضمن البنية أساسية محسّنة للغاية تستخرج الميزات متعددة النطاقات بكفاءة. وهذا يسمح للأجزاء اللاحقة من الشبكة بالتركيز بالكامل على تحديد مواقع الكائنات وتعيين احتمالات الفئات دون الحاجة إلى إعادة تعلم كيفية التعرف على الهياكل البصرية الأساسية من الصفر.

العمود الفقري مقابل الرقبة مقابل الرأس

لفهم بنية نماذج الكشف عن الأشياء بشكل كامل، من الضروري التمييز بين العمود الفقري والمكونين الرئيسيين الآخرين : الرقبة والرأس.

  • العمود الفقري: "مستخرج الميزات ". يعزل المعلومات البصرية الأساسية من الصورة المدخلة. ومن الأمثلة الشائعة على ذلك الشبكات المتبقية (ResNet)، التي طورتها في الأصل شركة Microsoft ، و CSPNet، التي تم تحسينها من أجل الكفاءة الحسابية.
  • العنق: "مجمع الميزات". يقع العنق بين العمود الفقري والرأس، ويقوم بتحسين ودمج الميزات من مستويات مختلفة. ومن الهياكل الشائعة المستخدمة هنا شبكة هرم الميزات (FPN)، التي تعزز قدرة النموذج على detect بأحجام مختلفة.
  • الرأس: "المتنبئ". يقوم رأس الكشف بمعالجة الميزات المجمعة من الرقبة لتوليد الناتج النهائي، مثل المربعات المحيطة وتسميات الفئات.

تطبيقات واقعية

تعد البنية الأساسية بمثابة العمود الفقري الصامت وراء العديد من تطبيقات الذكاء الاصطناعي الصناعية والعلمية. إن قدرتها على تعميم البيانات المرئية تجعلها قابلة للتكيف عبر قطاعات متنوعة.

  1. التشخيص الطبي: في مجال الرعاية الصحية، تقوم الشبكات الأساسية بتحليل الصور الطبية المعقدة مثل الأشعة السينية والأشعة المقطعية والتصوير بالرنين المغناطيسي. من خلال إجراء تحليل الصور الطبية، يمكن لهذه الشبكات استخراج الشذوذات الدقيقة التي تشير إلى المرض. على سبيل المثال، تستفيد النماذج المتخصصة من الشبكات الأساسية القوية للكشف عن الأورام، وتحديد العلامات المبكرة للسرطان التي قد لا تراها العين البشرية. تدعو منظمات مثل جمعية الأشعة في أمريكا الشمالية (RSNA) إلى استخدام أدوات التعلم العميق هذه لإحداث ثورة في رعاية المرضى.
  2. الأنظمة المستقلة: في صناعات السيارات والروبوتات، تعالج الشبكات الأساسية موجات الفيديو الواردة من الكاميرات المثبتة على متن المركبة لتفسير البيئة المحيطة. يعتمد الذكاء الاصطناعي في صناعة السيارات على هذه الميزات القوية لاستخراج المعلومات من أجل detect وقراءة إشارات المرور وتحديد المشاة في الوقت الفعلي. تضمن الشبكة الأساسية الموثوقة قدرة النظام على التمييز بين العوائق الثابتة والمركبات المتحركة، وهو مطلب أمان أساسي لتقنيات القيادة المستقلة التي طورتها شركات مثل Waymo.

التنفيذ باستخدام Ultralytics

الهياكل المعمارية الحديثة مثل YOLO11 و YOLO26 المتطورة تدمج هياكل أساسية قوية بشكل افتراضي. تم تصميم هذه المكونات لتحقيق زمن استدلال أمثل عبر مختلف منصات الأجهزة ، من الأجهزة الطرفية إلى وحدات معالجة الرسومات

يوضح Python التالي Python كيفية تحميل نموذج مع هيكل أساسي مدرب مسبقًا باستخدام ultralytics الحزمة. يستفيد هذا الإعداد تلقائيًا من العمود الفقري لاستخراج الميزات أثناء الاستدلال.

from ultralytics import YOLO

# Load a YOLO26 model, which includes a pre-trained CSP backbone
model = YOLO("yolo26n.pt")

# Perform inference on an image
# The backbone extracts features, which are then used for detection
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting detection
results[0].show()

من خلال استخدام بنية أساسية مدربة مسبقًا، يمكن للمطورين إجراء ضبط دقيق على مجموعات البيانات المخصصة الخاصة بهم باستخدام Ultralytics . يسهل هذا النهج التطوير السريع للنماذج المتخصصة — مثل تلك المستخدمة في الكشف عن الطرود في مجال الخدمات اللوجستية— دون الحاجة إلى الموارد الحاسوبية الهائلة التي تتطلبها عادةً تدريب شبكة عصبية عميقة من الصفر.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن