الشبكة العصبية التلافيفية (CNN) هي نوع متخصص من الشبكات العصبية (NN) فعالة بشكل خاص في معالجة البيانات الشبيهة بالشبكات، مثل الصور ومقاطع الفيديو. على عكس الشبكات العصبية التقليدية التي تتعامل مع المدخلات كمتجهات مسطحة، تم تصميم الشبكات العصبية التلافيفية لتعلم التسلسلات الهرمية المكانية للسمات بشكل تلقائي وتكييفي مباشرةً من بيانات المدخلات. ويتحقق ذلك في المقام الأول من خلال تطبيق عملية الالتفاف، مما يجعلها حجر الزاوية في الرؤية الحاسوبية الحديثة (CV) ويقود التقدم الكبير في الذكاء الاصطناعي (AI). إن قدرتها على التقاط التبعيات المحلية والعلاقات المكانية تجعلها مناسبة للغاية للمهام التي يكون فيها ترتيب وحدات البكسل مهمًا.
المكونات الأساسية والوظائف الأساسية
عادةً ما يتم إنشاء شبكات CNNs من عدة طبقات رئيسية تقوم بمعالجة المعلومات البصرية وتحويلها:
- الطبقات التلافيفية: هذه هي الطبقات التأسيسية لشبكة CNN. وهي تطبق مجموعة من المرشحات القابلة للتعلم (النواة) عبر صورة الإدخال. يكتشف كل مرشح ميزات محددة مثل الحواف أو الزوايا أو القوام. وبينما ينزلق المرشح (يتدفق) على المدخلات، فإنه ينتج خرائط ميزات تبرز مواقع وقوة الميزات المكتشفة. تتعلم الشبكة هذه المرشحات تلقائيًا أثناء عملية تدريب النموذج.
- طبقات التنشيط: بعد الطبقات التلافيفية، تقدم دوال التنشيط مثل ReLU (الوحدة الخطية المعدلة) أو ReLU المتسربة اللاخطية. وهذا يسمح للشبكة بتعلم أنماط أكثر تعقيدًا تتجاوز التركيبات الخطية البسيطة.
- طبقات التجميع: تقلل هذه الطبقات من الأبعاد المكانية (العرض والارتفاع) لخرائط الميزات، مما يقلل من الحمل الحسابي ويتحكم في الإفراط في التركيب. تتضمن الأساليب الشائعة تجميع الحد الأقصى للتجميع، والذي يأخذ القيمة القصوى في منطقة محلية، مما يساعد الشبكة على أن تصبح أكثر قوة للتغيرات في موضع الميزات. يمكن أن توفر نظرة عامة على طرق التجميع مزيدًا من التفاصيل.
- الطبقات المتصلة بالكامل: توجد هذه الطبقات عادةً بالقرب من نهاية الشبكة، وتربط هذه الطبقات كل خلية عصبية من الطبقة السابقة بكل خلية عصبية في الطبقة الحالية، على غرار الشبكة العصبية التقليدية المتصلة بالتغذية الأمامية. وهي تستخدم الميزات عالية المستوى المستخرجة من طبقات التلافيف والتجميع لأداء مهام التصنيف أو الانحدار، مثل تعيين تسمية نهائية للصورة.
الاختلافات الرئيسية عن الشبكات العصبية الأخرى
تمتلك شبكات CNN خصائص فريدة تميزها عن غيرها من أنواع الشبكات الأخرى:
- التسلسل الهرمي المكاني: على عكس الشبكات العصبية العصبية الأساسية، تقوم شبكات CNN بنمذجة العلاقات المكانية بشكل صريح. تكتشف الطبقات المبكرة الميزات البسيطة (الحواف)، بينما تجمع الطبقات الأعمق بين هذه الميزات للتعرف على الأنماط الأكثر تعقيدًا (الأشكال والأشياء). تحاكي هذه البنية الهرمية جوانب المعالجة البصرية البشرية.
- مشاركة المعلمات: يتم تطبيق مرشح واحد عبر أجزاء مختلفة من صورة الإدخال، مما يقلل بشكل كبير من العدد الإجمالي للمعلمات مقارنةً بشبكة متصلة بالكامل تعالج نفس الصورة. وهذا يجعل شبكات CNN أكثر كفاءة وأقل عرضة للإفراط في التركيب، خاصة مع الصور الكبيرة. تُعرف المنطقة التي يغطيها المرشح في أي نقطة بمجاله الاستقبالي.
- عدم ثبات الترجمة: بفضل التجميع ومشاركة البارامترات، يمكن لشبكات CNN التعرف على كائن ما حتى لو تغير موضعه قليلاً داخل الصورة.
- مقابل الشبكات العصبية المتكررة (RNNs): بينما تتفوق شبكات CNN في معالجة البيانات المكانية مثل الصور، فإن الشبكات العصبية المتكررة (RNNs) مصممة للبيانات المتسلسلة، مما يجعلها مناسبة لمهام مثل معالجة اللغات الطبيعية (NLP) وتحليل السلاسل الزمنية.
التطبيقات الواقعية
تُعد CNNs القوة الدافعة وراء العديد من الإنجازات في مختلف المجالات:
- تحليل الصور الطبية: في مجال الذكاء الاصطناعي في الرعاية الصحية، تقوم شبكات CNN بتحليل الفحوصات الطبية مثل الأشعة السينية والتصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي. وهي تساعد أطباء الأشعة في اكتشاف الحالات الشاذة الدقيقة مثل الأورام أو الكسور أو اعتلال الشبكية السكري. الأبحاث المنشورة في مجلات مثل Radiology: الذكاء الاصطناعي تعرض نماذج CNN التي تحدد الأنماط التي تدل على الأمراض، وغالباً ما تحقق دقة عالية. على سبيل المثال، نماذج مثل Ultralytics YOLO يمكن تكييفها لمهام مثل الكشف عن الأورام في التصوير الطبي، مما يدل على التطبيق العملي للبنى القائمة على شبكة سي إن إن في تحليل الصور الطبية.
- السيارات ذاتية القيادة: تُعد شبكات CNN ضرورية للذكاء الاصطناعي في السيارات ذاتية القيادة. فهي تعمل على تشغيل أنظمة الإدراك التي تقوم بالكشف عن الأجسام في الوقت الفعلي لتحديد المشاة والمركبات وعلامات المرور وعلامات الحارات باستخدام بيانات من الكاميرات و LiDAR. وهذا يُمكِّن السيارة من فهم بيئتها واتخاذ قرارات القيادة الآمنة. تعتمد شركات مثل Waymo بشكل كبير على شبكات CNN في أنظمتها ذاتية القيادة. كما تساهم شبكات CNN أيضاً في تجزئة الصور، مما يسمح للمركبات بالتمييز بين المناطق القابلة للقيادة والعوائق.