مسرد المصطلحات

شبكة الخصومة التوليدية (GAN)

اكتشف كيف تُحدِث شبكات GAN ثورة في الذكاء الاصطناعي من خلال توليد صور واقعية وتحسين البيانات وقيادة الابتكارات في مجال الرعاية الصحية والألعاب وغيرها.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تُعد شبكات الخصومة التوليدية (GANs) فئة قوية من أطر التعلم الآلي، وقد قدمها لأول مرة إيان جودفيلو وزملاؤه في عام 2014. وتنتمي هذه الشبكات إلى مجال الذكاء الاصطناعي الت وليدي، وهي معروفة بقدرتها على توليد بيانات جديدة تحاكي بعض توزيعات البيانات المدخلة. تحقق الشبكات العصبية التوليدية ذلك من خلال عملية عدائية تتضمن شبكتين عصبيتين متنافستين: المولد والمميز. وقد أدت هذه البنية الفريدة من نوعها إلى تطورات كبيرة، لا سيما في مجال الرؤية الحاسوبية.

كيفية عمل GANS

الفكرة الأساسية وراء شبكات GANs هي لعبة تنافسية بين شبكتين:

  1. المولّد: تحاول هذه الشبكة إنشاء بيانات اصطناعية (مثل الصور والأصوات والنصوص) تبدو وكأنها مأخوذة من مجموعة بيانات حقيقية. يبدأ بأخذ ضوضاء عشوائية كمدخلات ويحاول تحويلها إلى مخرجات واقعية المظهر.
  2. المميّز تعمل هذه الشبكة كقاضٍ. هدفها هو التمييز بين البيانات الحقيقية (من بيانات التدريب الفعلية) والبيانات المزيفة التي ينتجها المولد. يُخرج احتمالاً يشير إلى مدى احتمال اعتقاده أن عينة المدخلات حقيقية.

أثناء التدريب، يتم تدريب هاتين الشبكتين في وقت واحد. يتعلم المولد إنتاج بيانات واقعية بشكل متزايد لخداع أداة التمييز، بينما تتحسن أداة التمييز في تحديد البيانات المزيفة. تستخدم هذه العملية عملية الترحيل العكسي لتحديث أوزان النموذج لكلتا الشبكتين بناءً على أدائهما، مسترشدةً بدالة خسارة محددة. يصل النظام إلى التوازن عندما ينشئ المولد بيانات مقنعة لدرجة أن أداة التمييز لم تعد قادرة على معرفة الفرق بشكل موثوق (أداء لا يتعدى التخمين العشوائي).

المفاهيم والتحديات الرئيسية

هناك عدة مفاهيم أساسية لفهم شبكات GANs:

  • خسارة الخصومة: تم تصميم دوال الخسارة بحيث يتوافق تحسن المولد مع تدهور المُمَيِّز، والعكس صحيح، مما يؤدي إلى دفع عملية التعلم التنافسي.
  • استقرار التدريب: قد يكون تدريب شبكات GAN صعبة للغاية. وتشمل المشاكل الشائعة ما يلي:
    • انهيار الوضع: ينتج المولد مجموعة محدودة فقط من المخرجات، ويفشل في التقاط التنوع الكامل لبيانات التدريب. تعرف على المزيد حول انهيار الوضع.
    • التدرجات المتلاشية: تصبح أداة التمييز جيدة جدًا بسرعة كبيرة، مما يوفر القليل من التغذية الراجعة المفيدة (التدرجات) للمولد ليتعلم منها. انظر مشكلة التدرجات المتلاشية.
    • عدم التقارب: قد تفشل النماذج في الوصول إلى توازن مستقر.

وقد طوّر الباحثون تقنيات وتعديلات معمارية مختلفة (مثل شبكات Wasserstein GANs أو WGANs) للتخفيف من هذه التحديات وتحسين استقرار التدريب.

التطبيقات الواقعية

وجدت شبكات GAN العديد من التطبيقات، خاصةً في توليد المحتوى المرئي:

  1. توليد صور واقعية: يمكن لشبكات GAN مثل StyleGAN وBigGAN توليد صور واقعية عالية الدقة مثل الوجوه البشرية(هذا الشخص غير موجود مثال شائع) أو الحيوانات أو الأشياء. تُعد هذه الإمكانية ذات قيمة لإنشاء الأعمال الفنية وأصول الألعاب، وربما توليد بيانات اصطناعية لزيادة مجموعات البيانات لنماذج التدريب مثل Ultralytics YOLO.
  2. الترجمة من صورة إلى صورة: يمكن لنماذج مثل pix2pix2pix و CycleGAN تحويل الصور من نمط إلى آخر، مثل تحويل صور الأقمار الصناعية إلى خرائط، أو الرسومات إلى صور، أو تغيير الفصول في الصور الفوتوغرافية. استكشف أمثلة ترجمة الصور.
  3. زيادة البيانات: يمكن لشبكات GANs توليد أشكال مختلفة من البيانات الموجودة، مما يؤدي بشكل فعال إلى زيادة البيانات. وهذا مفيد في مجالات مثل تحليل الصور الطبية حيث قد تكون البيانات الحقيقية نادرة، مما يساعد على تحسين متانة النماذج التشخيصية.

نظام GANS مقابل النماذج التوليدية الأخرى

تختلف شبكات GAN عن المناهج التوليدية الأخرى:

  • المبرمجات التلقائية المتغيرة (VAEs): تعدّ VAEs نوعًا آخر من النماذج التوليدية ولكن يتم تدريبها بشكل مختلف، حيث يتم تحسين الحد الأدنى من احتمالية لوغاريتم البيانات. وهي تنتج بشكل عام مخرجات أكثر سلاسة ولكن من المحتمل أن تكون أكثر ضبابية مقارنةً بشبكات GAN. اقرأ نظرة عامة على VAEs.
  • نماذج الانتشار: تعمل هذه النماذج، مثل نموذج الانتشار المستقر، عن طريق إضافة ضوضاء تدريجياً إلى البيانات ثم تعلم عكس العملية. وغالبًا ما تحقق أحدث النتائج في جودة الصورة وتنوعها ولكنها قد تكون أبطأ في توليد العينات مقارنةً بنماذج GANs. راجع مدخل مسرد مصطلحات نماذج الانتشار.

بينما تركز شبكات الشبكات الشبكية العالمية على التوليد، تهدف النماذج التمييزية إلى التصنيف أو التنبؤ بناءً على بيانات المدخلات، مثل النماذج المستخدمة فقط لتصنيف الصور أو اكتشاف الأجسام. يعتبر المميّز في شبكة GAN نموذجًا تمييزيًا في الأساس، لكن دوره جزء من الإطار التوليدي الأكبر.

تمثل شبكات الخصومة التوليدية علامة فارقة في التعلّم العميق، حيث تدفع حدود الإمكانات الإبداعية للذكاء الاصطناعي. يمكنك التعمق أكثر من خلال قراءة ورقة الشبكات العدائية التوليدية الأصلية. وللتطبيقات العملية، يمكنك استكشاف موارد مثل البرامج التعليمية لشبكات GAN التوليدية فيTensorFlow أو أمثلةPyTorch.

قراءة الكل