مسرد المصطلحات

شبكات الكبسولة (CapsNet)

اكتشف شبكات الكبسولة (CapsNets): بنية رائدة للشبكات العصبية تتفوق في التسلسلات الهرمية المكانية وعلاقات السمات.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تمثل شبكات الكبسولات، التي يشار إليها غالبًا باسم CapsNets، نوعًا جديدًا من بنية الشبكات العصبية المصممة لمعالجة بعض القيود التي تعاني منها الشبكات العصبية التلافيفية التقليدية (CNNs)، خاصة في التعامل مع التسلسلات الهرمية المكانية والعلاقات بين السمات في الصور. وعلى عكس شبكات الشبكات العصبية التلافيفية، التي تستخدم مخرجات قياسية من عمليات التجميع، تستخدم شبكات CapsNets متجهات لتمثيل الميزات، مما يسمح لها بالتقاط معلومات أكثر تفصيلاً حول الاتجاه والمواضع المكانية النسبية للأجسام. هذه الإمكانية تجعل شبكات CapsNets فعالة بشكل خاص في مهام مثل التعرف على الصور، حيث يكون فهم الوضع والعلاقات المكانية للأجسام أمرًا بالغ الأهمية.

المفاهيم الأساسية

تقدم CapsNets مفهوم "الكبسولات"، وهي مجموعات من الخلايا العصبية التي يمثل متجه نشاطها خصائص مختلفة لنوع معين من الكيانات، مثل كائن أو جزء من الكائن. ويمثل طول متجه النشاط احتمال وجود الكيان، بينما يرمز اتجاهه إلى معلمات التهيئة (مثل الموضع والحجم والاتجاه). تقوم الكبسولات النشطة في مستوى واحد بعمل تنبؤات، عبر مصفوفات التحويل، لمعلمات الإنشاء الخاصة بالكبسولات ذات المستوى الأعلى. عندما تتفق تنبؤات متعددة، تصبح كبسولة المستوى الأعلى نشطة. تُعرف هذه العملية باسم "التوجيه بالاتفاق".

الاختلافات الرئيسية عن الشبكات العصبية التلافيفية (CNNs)

على الرغم من استخدام كل من الشبكات العصبية التلافيفية والش بكات العصبية التلافيفية (CNNs) في مهام الرؤية الحاسوبية، إلا أنها تختلف بشكل كبير في نهجها لمعالجة المعلومات المكانية:

  • تمثيل الميزات: تستخدم شبكات CNNs قيمًا قياسية لتمثيل الميزات، بينما تستخدم شبكات CapsNets المتجهات، مما يسمح لها بالتقاط معلومات أكثر تفصيلاً حول وضعية وخصائص الأجسام.
  • عمليات التجميع: غالبًا ما تستخدم شبكات الشبكات الشبكية التجميعية (CNNs) عمليات التجميع القصوى، والتي يمكن أن تؤدي إلى فقدان المعلومات المكانية الدقيقة. تتجنب CapsNets ذلك باستخدام التوجيه الديناميكي، الذي يحافظ على التسلسلات الهرمية المكانية.
  • التساوي في التباين: صُممت شبكات CapsNets بحيث تكون متساوية التباين مع التغييرات في وجهة النظر، مما يعني أنها تستطيع التعرف على الأشياء حتى عندما يتغير اتجاهها. لا تتساوى شبكات CNN بطبيعتها وتتطلب تقنيات مثل زيادة البيانات لتحقيق نتائج مماثلة.

مزايا شبكات الكبسولة

تقدم شبكات CapsNets العديد من المزايا مقارنةً بشبكات CNNs التقليدية:

  • تحسين التعامل مع التسلسلات الهرمية المكانية: من خلال تمثيل الميزات على شكل متجهات، يمكن ل CapsNets فهم العلاقات المكانية بين أجزاء الجسم بشكل أفضل.
  • متانة معززة للتحويلات الجذرية: يمكن لشبكات CapsNets التعرّف على الكائنات في ظل التحويلات المختلفة (على سبيل المثال، التدوير، والقياس) دون الحاجة إلى زيادة البيانات على نطاق واسع.
  • تعميم أفضل ببيانات أقل: نظرًا لقدرتها على التقاط المعلومات التفصيلية للميزات، يمكن لشبكات CapsNets غالبًا تحقيق أداء جيد مع عدد أقل من أمثلة التدريب مقارنةً بشبكات CNN.

التطبيقات الواقعية

لقد أظهرت شبكات الكبسولات نتائج واعدة في تطبيقات مختلفة، مما يدل على قدرتها على تطوير مجال التعلم العميق (DL):

  • التصوير الطبي: في تحليل الصور الطبية، يمكن لشبكات CapsNets تحسين دقة تشخيص الأمراض من خلال فهم أفضل للعلاقات المكانية بين البنى التشريحية المختلفة. على سبيل المثال، يمكن استخدامها للكشف عن الأورام وتصنيفها بدقة أكبر من خلال تحليل شكلها وحجمها وموقعها النسبي داخل العضو.
  • المركبات ذاتية القيادة: يمكن لشبكات CapsNets تحسين أنظمة الإدراك في المركبات ذاتية القيادة من خلال تحسين اكتشاف الأجسام والتعرف عليها، خاصةً في الظروف الصعبة مثل اختلاف وجهات النظر والانسدادات. يمكن أن يؤدي ذلك إلى ملاحة أكثر أماناً وموثوقية.
  • التعرف على الوجه: في أنظمة التعرف على الوجه، يمكن أن توفر شبكات CapsNets أداءً أكثر قوة من خلال التقاط العلاقات المكانية بين ملامح الوجه بدقة، حتى في ظل التغيرات في الوضعية والتعبير.

التحديات والتوجهات المستقبلية

على الرغم من مزاياها، تواجه شبكات CapsNets أيضًا تحديات، مثل التعقيد الحسابي الأعلى مقارنةً بشبكات CNNs والحاجة إلى مزيد من البحث لتحسين بنيتها وإجراءات التدريب. وتركز الأبحاث الجارية على تحسين كفاءة التوجيه الديناميكي، واستكشاف أنواع جديدة من الكبسولات، وتطبيق شبكات CapsNets على مجموعة واسعة من المهام التي تتجاوز التعرف على الصور.

مع استمرار تطور مجال الذكاء الاصطناعي (AI) ، تمثل شبكات الكبسولة مجالًا مثيرًا للتطوير، حيث توفر إمكانيات جديدة لإنشاء نماذج شبكات عصبية أكثر قوة وتنوعًا. إن قدرتها على التقاط المعلومات المكانية التفصيلية والتعامل مع التحويلات تجعلها أداة قيّمة لتطوير الرؤية الحاسوبية وتطبيقات الذكاء الاصطناعي الأخرى. بالنسبة للراغبين في استكشاف أحدث نماذج الذكاء الاصطناعي المتطورة، تقدم نماذج Ultralytics YOLO أحدث البنى المعمارية للكشف عن الأجسام التي تتضمن بعضًا من أحدث التطورات في هذا المجال. بالإضافة إلى ذلك، يوفر مركز Ultralytics HUB منصة لتدريب ونشر هذه النماذج، مما يسهل تطوير وتطبيق حلول الذكاء الاصطناعي المتقدمة.

قراءة الكل