المُشَفِّر التلقائي هو نوع من الشبكات العصبية الاصطناعية (NN) يُستخدم في المقام الأول لمهام التعلم غير الخاضعة للإشراف، لا سيما تقليل الأبعاد واستخراج السمات. ويتمثل هدفها الأساسي في تعلم تمثيل مضغوط (ترميز) لبيانات المدخلات، عادةً عن طريق تدريب الشبكة على إعادة بناء مدخلاتها الخاصة. وتتألف من جزأين رئيسيين: مشفر يقوم بتعيين بيانات المدخلات في فضاء كامن منخفض الأبعاد، ومفك تشفير يقوم بإعادة بناء البيانات الأصلية من هذا التمثيل المضغوط. تجبر هذه العملية المشفر التلقائي على التقاط السمات الأكثر بروزًا لبيانات التدريب.
كيف تعمل أجهزة الترميز التلقائي
تتضمن عملية الترميز التلقائي مرحلتين: التشفير وفك التشفير.
- أداة التشفير: يأخذ هذا الجزء البيانات المدخلة (على سبيل المثال، صورة أو متجه) ويضغطها إلى تمثيل منخفض الأبعاد يسمى الفضاء الكامن أو عنق الزجاجة. يجبر هذا الضغط الشبكة على تعلم أنماط ذات معنى وتجاهل الضوضاء أو التكرار. تتكون أداة التشفير عادةً من عدة طبقات، وغالبًا ما تستخدم دوال تنشيط مثل ReLU أو Sigmoid.
- عنق الزجاجة: هذه هي الطبقة المركزية للمبرمج التلقائي حيث يوجد التمثيل المضغوط منخفض الأبعاد للبيانات المدخلة. إنها "الشفرة" التي تلتقط المعلومات الأساسية. إن بُعدية هذه الطبقة هي معيار فرعي بالغ الأهمية.
- وحدة فك التشفير: يأخذ هذا الجزء التمثيل المضغوط من عنق الزجاجة ويحاول إعادة بناء بيانات الإدخال الأصلية بأكبر قدر ممكن من الدقة. وهو يعكس بنية أداة التشفير ولكن بشكل عكسي، حيث يقوم بإعادة تشفير البيانات إلى أبعادها الأصلية.
يتضمن التدريب تغذية الشبكة ببيانات المدخلات ومقارنة المخرجات (البيانات المعاد بناؤها) مع المدخلات الأصلية باستخدام دالة خسارة، مثل متوسط الخطأ المربّع (MSE) للبيانات المستمرة أو الانتروبيا المتقاطعة الثنائية للبيانات الثنائية. يتم تعديل أوزان الشبكة باستخدام الترحيل العكسي وخوارزمية تحسين مثل Adam أو SGD لتقليل خطأ إعادة البناء هذا.
أنواع أجهزة الترميز التلقائي
توجد عدة أشكال مختلفة من البنية الأساسية للمُبرمِج التلقائي الأساسي، كل منها مصمم لمهام محددة:
- أجهزة إعادة الترميز التلقائي للتشويش: مُدرَّبة على إعادة بناء نسخة نظيفة من المدخلات التي تعرضت للتشويش. وهذا يجعلها قوية لمهام مثل تقليل التشويش في الصور. تعرف على المزيد حول أجهزة الترميز التلقائي لإزالة الضوضاء.
- أجهزة الترميز التلقائي المتفرقة: إدخال عقوبة التشتت (شكل من أشكال التنظيم) على طبقة عنق الزجاجة، مما يجبر الشبكة على تعلم التمثيلات حيث يكون عدد قليل فقط من العقد نشطًا في كل مرة.
- الترميز التلقائي المتغير (VAEs): نموذج الذكاء الاصطناعي التوليدي الذي يتعلم رسم خرائط احتمالية للفضاء الكامن، مما يسمح له بتوليد عينات بيانات جديدة مشابهة لبيانات التدريب. اقرأ ورقة VAE.
- المشفرات التلقائية الانقباضية: أضف حدًا جزائيًا إلى دالة الخسارة لتشجيع المُشَفِّر على تعلُّم تمثيلات قوية للتغيرات الصغيرة في المدخلات.
التطبيقات الواقعية
تُعد أدوات الترميز التلقائي أدوات متعددة الاستخدامات تُستخدم في العديد من تطبيقات التعلم الآلي (ML):
- اكتشاف الشذوذ: من خلال تعلم الأنماط الطبيعية في البيانات، يمكن لأجهزة الترميز التلقائي تحديد القيم المتطرفة أو الحالات الشاذة. إذا كان خطأ إعادة البناء لنقطة بيانات معينة مرتفعًا، فهذا يشير إلى أن المدخلات تختلف اختلافًا كبيرًا عن بيانات التدريب، مما قد يشير إلى وجود حالة شاذة مثل المعاملات الاحتيالية في مجال التمويل أو المعدات المعيبة في التصنيع. استكشف المزيد من اكتشاف الشذوذ.
- ضغط الصور وتقليل التشويش: يمكن لأجهزة التشفير التلقائي تعلم التمثيلات المدمجة للصور، مما يؤدي إلى إجراء الضغط بفعالية. تُستخدم برامج إلغاء التشفير التلقائي لإزالة الضوضاء من الصور، وهو أمر ذو قيمة في تحليل الصور الطبية (على سبيل المثال، تحسين التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب) أو استعادة الصور القديمة. انظر حلول التصوير الطبي.
- تقليل الأبعاد: على غرار تحليل المكوّنات الرئيسية (PCA)، تقلل برامج الترميز التلقائي من أبعاد البيانات، ولكن يمكنها التقاط العلاقات المعقدة وغير الخطية التي لا يستطيع تحليل المكوّنات الرئيسية التقاطها. يعد هذا مفيدًا لتصور البيانات وكخطوة معالجة مسبقة لنماذج التعلم الآلي الأخرى.
- تعلّم الميزات: يمكن استخدام جزء التشفير كمستخرج للميزات للمهام النهائية مثل تصنيف الصور أو اكتشاف الأجسام، وغالبًا ما يوفر ميزات أكثر قوة من البيانات الأولية. بينما نماذج مثل Ultralytics YOLO تستخدم عمودًا فقريًا متخصصًا، فإن مبادئ أداة التشفير التلقائي تُعلم تعلم التمثيل.
الترميز التلقائي مقابل المفاهيم ذات الصلة
- تحليل PCA: في حين أن كلاهما يقلل من الأبعاد، فإن تحليل PCA يقتصر على التحويلات الخطية. يمكن لأجهزة التشفير التلقائي، كونها شبكات عصبية، أن تتعلم التعيينات غير الخطية المعقدة، مما يؤدي غالبًا إلى تمثيلات أفضل لمجموعات البيانات المعقدة.
- شبكات الخصومة التوليدية: صُممت شبكات الخصومة التوليدية (GANs) في المقام الأول لتوليد بيانات جديدة واقعية للغاية. بينما يمكن لشبكات VAEs (نوع من أجهزة الترميز التلقائي) أيضًا توليد البيانات، إلا أن تركيزها غالبًا ما ينصب على تعلم فضاء كامن جيد التنظيم، بينما تتفوق شبكات GAN في دقة المخرجات، وأحيانًا على حساب قابلية تفسير الفضاء الكامن.
- السي إن إن والمحولات: تحدد أجهزة التشفير التلقائي نمطًا معماريًا (مشفر-مفك تشفير). وغالبًا ما تستخدم أنواعًا أخرى من الشبكات مثل الشبكات العصبية التلافيفية (CNNs) لبيانات الصور أو المحولات للبيانات المتسلسلة ككتل بناء داخل المشفر وفك التشفير.
الأدوات والتنفيذ
يمكن تنفيذ برامج التشفير التلقائي باستخدام أطر التعلم العميق (DL) الشائعة:
تعمل المنصات مثل Ultralytics HUB على تسهيل سير عمل تعلّم الآلة بشكل عام، بما في ذلك إدارة البيانات وتدريب النماذج، على الرغم من أنها تركز بشكل أساسي على المهام الخاضعة للإشراف مثل الكشف والتجزئة بدلاً من تدريب المبرمج التلقائي غير الخاضع للإشراف.