هياكل الكشف عن الكائنات
اكتشف قوة بنيات اكتشاف الأجسام، العمود الفقري للذكاء الاصطناعي لفهم الصور. تعرّف على الأنواع والأدوات والتطبيقات الواقعية اليوم!
تُعد هياكل اكتشاف الكائنات هي المخططات الأساسية لنماذج التعلّم العميق التي تقوم باكتشاف الكائنات. تتضمن مهمة الرؤية الحاسوبية هذه تحديد وجود وموقع الأجسام داخل صورة أو مقطع فيديو، وعادةً ما يتم ذلك من خلال رسم مربع محدد حولها وتعيين تصنيف لها. تحدد البنية بنية النموذج، بما في ذلك كيفية معالجته للمعلومات المرئية وإجراء التنبؤات. يعد اختيار البنية أمرًا بالغ الأهمية لأنه يؤثر بشكل مباشر على سرعة النموذج ودقته ومتطلباته الحسابية.
كيفية عمل هياكل الكشف عن الكائنات
تتكون معظم البنى الحديثة للكشف عن الأجسام من ثلاثة مكونات رئيسية تعمل بالتسلسل:
- العمود الفقري: وهي عبارة عن شبكة عصبية تلافيفية (CNN)، غالبًا ما يتم تدريبها مسبقًا على مجموعة بيانات كبيرة لتصنيف الصور مثل ImageNet. ويتمثل دورها الأساسي في العمل كمستخرج للميزات، حيث تقوم بتحويل الصورة المدخلة إلى سلسلة من خرائط الميزات التي تلتقط المعلومات البصرية الهرمية. تشمل شبكات العمود الفقري الشائعة شبكة ResNet وشبكة CSPDarknet، والتي تُستخدم في العديد من نماذج YOLO. يمكنك معرفة المزيد عن أساسيات شبكات CNN من مصادر مثل النظرة العامة المفصلة لشركة IBM.
- الرقبة: يقع هذا المكون الاختياري بين العمود الفقري والرأس. يعمل على تجميع وتنقيح خرائط الميزات التي تم إنشاؤها بواسطة العمود الفقري، وغالبًا ما يجمع بين ميزات من مقاييس مختلفة لتحسين اكتشاف الأجسام ذات الأحجام المختلفة. ومن الأمثلة على ذلك شبكات الميزات الهرمية (FPNs).
- رأس الكشف: الرأس هو المكوّن الأخير المسؤول عن إجراء التنبؤات. وهو يأخذ خرائط السمات المعالجة من الرقبة (أو مباشرةً من العمود الفقري) ويخرج احتمالات الفئة وإحداثيات المربع المحيط لكل كائن مكتشف.
أنواع البنى
يتم تصنيف بنيات الكشف عن الكائنات بشكل عام بناءً على نهجها في التنبؤ، مما يؤدي إلى المفاضلة بين السرعة والدقة. يمكنك استكشاف مقارنات مفصّلة بين النماذج لرؤية هذه المفاضلة أثناء العمل.
التطبيقات الواقعية
تعمل بنيات اكتشاف الكائنات على تشغيل العديد من تطبيقات الذكاء الاصطناعي في قطاعات متنوعة:
الأدوات والتقنيات
غالبًا ما يتضمن تطوير النماذج ونشرها استنادًا إلى هذه البنى أدوات وأطر عمل متخصصة: