اكتشف كيف تُحدث شبكات ResNets ثورة في التعلُّم العميق من خلال حل التدرجات المتلاشية وتمكين الشبكات فائقة العمق لتحليل الصور والبرمجة اللغوية العصبية وغيرها.
تمثل الشبكات المتبقية، والمعروفة باسم ResNet، بنية رائدة للشبكات العصبية التلافيفية (CNN) طورها كايمينج هي وزملاؤه في Microsoft Research. تم تقديمها في ورقتهم البحثية لعام 2015 بعنوان"التعلم العميق المتبقي للتعرف على الصور"، وقد عالجت ResNet تحديًا رئيسيًا في التعلم العميق (DL): مشكلة التدهور. تحدث هذه المشكلة عندما تؤدي إضافة المزيد من الطبقات إلى شبكة عميقة جدًا إلى ارتفاع خطأ التدريب، على عكس التوقع بأن النماذج الأعمق يجب أن يكون أداؤها أفضل. وقد سمح ابتكار ResNet بالتدريب الناجح لشبكات أعمق بكثير مما كان ممكناً في السابق، مما أدى إلى تقدم كبير في أحدث ما توصلت إليه التكنولوجيا في مختلف مهام الرؤية الحاسوبية.
الفكرة الأساسية وراء ريس نت هي إدخال "اتصالات التخطي" أو "اتصالات الاختصار". في الشبكات العميقة التقليدية، تتغذى كل طبقة بالتتابع على الطبقة التالية. تعدّل شبكة ResNet هذا الأمر من خلال السماح بإضافة مدخلات مجموعة من الطبقات إلى مخرجات تلك المجموعة. يؤدي هذا إلى إنشاء "كتلة متبقية" حيث تتعلم الطبقات تعيينًا متبقيًا (الفرق بين المدخلات والمخرجات المطلوبة) بدلاً من محاولة تعلم التعيين الأساسي بأكمله مباشرةً. إذا كانت الدالة المثلى أقرب إلى تعيين الهوية (حيث يجب أن يكون الخرج هو نفسه المدخلات)، فمن الأسهل على الشبكة أن تتعلم جعل المتبقي صفراً (عن طريق توجيه أوزان الطبقات المكدسة نحو الصفر) بدلاً من تعلم تعيين الهوية نفسه من خلال الطبقات غير الخطية.
تعمل وصلات التخطي هذه على تسهيل تدفق التدرج أثناء الترحيل العكسي، مما يخفف من مشكلة تلاشي التدرج التي غالبًا ما تصيب الشبكات العميقة جدًا. يسمح ذلك ببناء شبكات ذات مئات أو حتى آلاف الطبقات وتدريبها بفعالية، مما يحقق تحسينات ملحوظة في الدقة على مجموعات البيانات المعيارية الصعبة مثل ImageNet.
وسرعان ما أصبحت معماريات ResNet عمودًا فقريًا قياسيًا للعديد من مهام الرؤية الحاسوبية التي تتجاوز تصنيف الصور، بما في ذلك:
إن قدرتها على استخراج ميزات قوية من الصور جعلتها بنية متعددة الاستخدامات ومعتمدة على نطاق واسع.
تتوفّر بنى ResNet بسهولة في أطر التعلم العميق الرئيسية مثل PyTorchPyTorch موقعPyTorch الرسمي) و TensorFlowTensorFlow ). يمكن الوصول إلى النماذج المدرّبة مسبقًا، والتي غالبًا ما يتم تدريبها على ImageNet، من خلال مكتبات مثل torchvision، مما يتيح التعلم الفعال للنقل. تسمح منصات مثل Ultralytics HUB للمستخدمين بالاستفادة من مختلف البنى، بما في ذلك البنى القائمة على ResNet، لتدريب النماذج المخصصة ونشرهاUltralytics وثائقUltralytics HUB). يمكنك العثور على المزيد من الموارد التعليمية حول CNNs في جامعة ستانفورد CS231n أو من خلال دورات مثل تلك التي يقدمها DeepLearning.AI.