مسرد المصطلحات

هياكل الكشف عن الكائنات

اكتشف قوة بنيات اكتشاف الأجسام، العمود الفقري للذكاء الاصطناعي لفهم الصور. تعرّف على الأنواع والأدوات والتطبيقات الواقعية اليوم!

تُعد هياكل اكتشاف الكائنات هي المخططات الأساسية لنماذج التعلّم العميق التي تقوم باكتشاف الكائنات. تتضمن مهمة الرؤية الحاسوبية هذه تحديد وجود وموقع الأجسام داخل صورة أو مقطع فيديو، وعادةً ما يتم ذلك من خلال رسم مربع محدد حولها وتعيين تصنيف لها. تحدد البنية بنية النموذج، بما في ذلك كيفية معالجته للمعلومات المرئية وإجراء التنبؤات. يعد اختيار البنية أمرًا بالغ الأهمية لأنه يؤثر بشكل مباشر على سرعة النموذج ودقته ومتطلباته الحسابية.

كيفية عمل هياكل الكشف عن الكائنات

تتكون معظم البنى الحديثة للكشف عن الأجسام من ثلاثة مكونات رئيسية تعمل بالتسلسل:

  • العمود الفقري: وهي عبارة عن شبكة عصبية تلافيفية (CNN)، غالبًا ما يتم تدريبها مسبقًا على مجموعة بيانات كبيرة لتصنيف الصور مثل ImageNet. ويتمثل دورها الأساسي في العمل كمستخرج للميزات، حيث تقوم بتحويل الصورة المدخلة إلى سلسلة من خرائط الميزات التي تلتقط المعلومات البصرية الهرمية. تشمل شبكات العمود الفقري الشائعة شبكة ResNet وشبكة CSPDarknet، والتي تُستخدم في العديد من نماذج YOLO. يمكنك معرفة المزيد عن أساسيات شبكات CNN من مصادر مثل النظرة العامة المفصلة لشركة IBM.
  • الرقبة: يقع هذا المكون الاختياري بين العمود الفقري والرأس. يعمل على تجميع وتنقيح خرائط الميزات التي تم إنشاؤها بواسطة العمود الفقري، وغالبًا ما يجمع بين ميزات من مقاييس مختلفة لتحسين اكتشاف الأجسام ذات الأحجام المختلفة. ومن الأمثلة على ذلك شبكات الميزات الهرمية (FPNs).
  • رأس الكشف: الرأس هو المكوّن الأخير المسؤول عن إجراء التنبؤات. وهو يأخذ خرائط السمات المعالجة من الرقبة (أو مباشرةً من العمود الفقري) ويخرج احتمالات الفئة وإحداثيات المربع المحيط لكل كائن مكتشف.

أنواع البنى

يتم تصنيف بنيات الكشف عن الكائنات بشكل عام بناءً على نهجها في التنبؤ، مما يؤدي إلى المفاضلة بين السرعة والدقة. يمكنك استكشاف مقارنات مفصّلة بين النماذج لرؤية هذه المفاضلة أثناء العمل.

  • كاشفات الأجسام ذات المرحلتين: تقوم هذه النماذج، مثل عائلة R-CNN، أولاً بتحديد مجموعة من مناطق الكائنات المرشحة (مقترحات المناطق) ثم تصنيف كل منطقة. يمكن أن تحقق هذه العملية المكونة من خطوتين دقة عالية ولكنها غالبًا ما تكون أبطأ.
  • كاشفات الكائنات ذات المرحلة الواحدة: تتعامل البنى مثل عائلة Ultralytics YOLO (أنت تنظر مرة واحدة فقط) مع اكتشاف الأجسام كمشكلة انحدار واحدة. فهي تتنبأ بالمربعات المحدودة واحتمالات الفئة مباشرةً من الصورة الكاملة في مسار واحد، مما يتيح الاستدلال في الوقت الفعلي.
  • أجهزة الكشف الخالية من المرساة: من أحدث التطورات في أجهزة الكشف ذات المرحلة الواحدة، البنى الخالية من المرساة مثل Ultralytics YOLO11 التي تلغي الحاجة إلى مربعات الارتكاز المحددة مسبقًا. هذا يبسط عملية التدريب وغالبًا ما يؤدي إلى نماذج أسرع وأكثر كفاءة.

التطبيقات الواقعية

تعمل بنيات اكتشاف الكائنات على تشغيل العديد من تطبيقات الذكاء الاصطناعي في قطاعات متنوعة:

الأدوات والتقنيات

غالبًا ما يتضمن تطوير النماذج ونشرها استنادًا إلى هذه البنى أدوات وأطر عمل متخصصة:

  • أطر التعلم العميق: توفر المكتبات مثل PyTorch (قم بزيارة موقع PyTorch الرسمي) و TensorFlow (راجع موقع TensorFlow) اللبنات الأساسية.
  • مكتبات الرؤية الحاسوبية: تقدم OpenCV (الموقع الرسمي: OpenCV.org) مجموعة واسعة من الوظائف لمعالجة الصور ومعالجتها.
  • النماذج والمنصات: توفر شركة Ultralytics أحدث نماذج Ultralytics YOLO ومنصة Ultralytics HUB، مما يسهل عملية تدريب النماذج المخصصة وإدارة مجموعات البيانات (مثل COCO) ونشر الحلول.
  • المصدر المفتوح: يتم تطوير العديد من بنيات وأدوات الكشف عن الكائنات بموجب تراخيص مفتوحة المصدر، مما يعزز التعاون والابتكار داخل مجتمع الذكاء الاصطناعي. تستضيف موارد مثل GitHub العديد من المشاريع في هذا المجال.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة