اكتشف شبكات الكبسولة (CapsNets): بنية رائدة للشبكات العصبية تتفوق في التسلسلات الهرمية المكانية وعلاقات السمات.
تمثل شبكات الكبسولات، التي يشار إليها غالبًا باسم CapsNets، نوعًا جديدًا من بنية الشبكات العصبية المصممة لمعالجة بعض القيود التي تعاني منها الشبكات العصبية التلافيفية التقليدية (CNNs)، خاصة في التعامل مع التسلسلات الهرمية المكانية والعلاقات بين السمات في الصور. وعلى عكس شبكات الشبكات العصبية التلافيفية، التي تستخدم مخرجات قياسية من عمليات التجميع، تستخدم شبكات CapsNets متجهات لتمثيل الميزات، مما يسمح لها بالتقاط معلومات أكثر تفصيلاً حول الاتجاه والمواضع المكانية النسبية للأجسام. هذه الإمكانية تجعل شبكات CapsNets فعالة بشكل خاص في مهام مثل التعرف على الصور، حيث يكون فهم الوضع والعلاقات المكانية للأجسام أمرًا بالغ الأهمية.
تقدم CapsNets مفهوم "الكبسولات"، وهي مجموعات من الخلايا العصبية التي يمثل متجه نشاطها خصائص مختلفة لنوع معين من الكيانات، مثل كائن أو جزء من الكائن. ويمثل طول متجه النشاط احتمال وجود الكيان، بينما يرمز اتجاهه إلى معلمات التهيئة (مثل الموضع والحجم والاتجاه). تقوم الكبسولات النشطة في مستوى واحد بعمل تنبؤات، عبر مصفوفات التحويل، لمعلمات الإنشاء الخاصة بالكبسولات ذات المستوى الأعلى. عندما تتفق تنبؤات متعددة، تصبح كبسولة المستوى الأعلى نشطة. تُعرف هذه العملية باسم "التوجيه بالاتفاق".
على الرغم من استخدام كل من الشبكات العصبية التلافيفية والش بكات العصبية التلافيفية (CNNs) في مهام الرؤية الحاسوبية، إلا أنها تختلف بشكل كبير في نهجها لمعالجة المعلومات المكانية:
تقدم شبكات CapsNets العديد من المزايا مقارنةً بشبكات CNNs التقليدية:
لقد أظهرت شبكات الكبسولات نتائج واعدة في تطبيقات مختلفة، مما يدل على قدرتها على تطوير مجال التعلم العميق (DL):
على الرغم من مزاياها، تواجه شبكات CapsNets أيضًا تحديات، مثل التعقيد الحسابي الأعلى مقارنةً بشبكات CNNs والحاجة إلى مزيد من البحث لتحسين بنيتها وإجراءات التدريب. وتركز الأبحاث الجارية على تحسين كفاءة التوجيه الديناميكي، واستكشاف أنواع جديدة من الكبسولات، وتطبيق شبكات CapsNets على مجموعة واسعة من المهام التي تتجاوز التعرف على الصور.
مع استمرار تطور مجال الذكاء الاصطناعي (AI) ، تمثل شبكات الكبسولة مجالًا مثيرًا للتطوير، حيث توفر إمكانيات جديدة لإنشاء نماذج شبكات عصبية أكثر قوة وتنوعًا. إن قدرتها على التقاط المعلومات المكانية التفصيلية والتعامل مع التحويلات تجعلها أداة قيّمة لتطوير الرؤية الحاسوبية وتطبيقات الذكاء الاصطناعي الأخرى. بالنسبة للراغبين في استكشاف أحدث نماذج الذكاء الاصطناعي المتطورة، تقدم نماذج Ultralytics YOLO أحدث البنى المعمارية للكشف عن الأجسام التي تتضمن بعضًا من أحدث التطورات في هذا المجال. بالإضافة إلى ذلك، يوفر مركز Ultralytics HUB منصة لتدريب ونشر هذه النماذج، مما يسهل تطوير وتطبيق حلول الذكاء الاصطناعي المتقدمة.