تعرّف على كيفية عمل شبكات الخصومة التوليدية (GANs) ومكوناتها الرئيسية وتطبيقاتها والتحديات التي تواجهها في إنشاء بيانات اصطناعية واقعية.
شبكة الخصومة التوليدية (GAN) هي نوع من أطر التعلم العميق المصممة لتوليد بيانات جديدة تشبه مجموعة بيانات التدريب. تم تقديم شبكات GAN لأول مرة من قبل إيان جودفيلو وزملائه في عام 2014، وتتكون شبكات GAN من شبكتين عصبيتين، مولد ومميِّز، يتم تدريبهما معًا في بيئة تنافسية. يقوم المولد بإنشاء حالات بيانات جديدة، بينما يقوم المُميِّز بتقييمها للتأكد من صحتها. ويدفع التفاعل بين هاتين الشبكتين المولد إلى إنتاج بيانات واقعية بشكل متزايد، مما يجعل شبكات الشبكات العصبية العالمية أداة قوية لتوليد البيانات الاصطناعية.
الفكرة الأساسية وراء شبكات GAN هي عملية الخصومة بين المولد والمميز. هدف المولّد هو إنشاء بيانات لا يستطيع المميّز تمييزها عن البيانات الحقيقية. ويتمثل هدف المميّز في تحديد ما إذا كانت البيانات التي يتلقاها حقيقية أم مولّدة بشكل صحيح. تخلق هذه الديناميكية حلقة من التغذية الراجعة حيث تتحسن الشبكتان بمرور الوقت.
تبدأ عملية التدريب بإنتاج المولد لبيانات عشوائية. ثم يتم تدريب المميّز على بيانات حقيقية من مجموعة بيانات التدريب وبيانات مزيفة من المولّد. يتعلّم المُميّز التمييز بين البيانات الحقيقية والمزيّفة ويزوّد المولّد بتغذية راجعة. يستخدم المولّد هذه التغذية الراجعة لتحسين مخرجاته، مما يؤدي إلى إنشاء بيانات من المرجح أن تخدع المميّز. وتستمر هذه العملية بشكل متكرر، حيث تدفع كل شبكة الشبكة الأخرى إلى أداء أفضل.
المولد عبارة عن شبكة عصبية تأخذ ضوضاء عشوائية كمدخلات وتحولها إلى عينات بيانات، مثل الصور أو النصوص أو الصوت. وعادةً ما تتضمن بنية المولد عادةً تقنيات أخذ عينات من البيانات، مثل التلافيف المنقولة في حالة توليد الصور، لبناء المخرجات المطلوبة تدريجيًا من الضوضاء الأولية.
المميّز هو شبكة عصبية أخرى تعمل كمصنف ثنائي. وهو يأخذ عينات البيانات، سواء كانت حقيقية أو مولّدة، كمدخلات ويخرج احتمال أن تكون المدخلات حقيقية. يتم تدريب المميّز باستخدام تقنيات التعلّم القياسية الخاضعة للإشراف، بهدف زيادة دقة تنبؤاته إلى أقصى حد.
وجدت شبكات GAN تطبيقات في مجالات مختلفة، مما يدل على تنوعها وإمكاناتها. فيما يلي بعض الأمثلة البارزة:
أحد أكثر تطبيقات شبكات GAN شيوعًا هو توليد الصور. يمكن لشبكات GAN إنشاء صور واقعية للغاية للوجوه والأشياء والمشاهد. على سبيل المثال، استُخدمت شبكة GAN StyleGAN على الموقع الإلكتروني NVIDIA لتوليد صور واقعية بشكل لا يصدق لوجوه بشرية غير موجودة في الواقع. ولهذه القدرة آثار على مجالات مثل الترفيه والفن والتصميم.
يمكن استخدام شبكات GANs لزيادة مجموعات البيانات الحالية من خلال توليد عينات بيانات اصطناعية جديدة. وهذا مفيد بشكل خاص في السيناريوهات التي يكون فيها جمع كميات كبيرة من البيانات الحقيقية أمرًا صعبًا أو مكلفًا. على سبيل المثال، في التصوير الطبي، يمكن لشبكات GANs توليد صور اصطناعية لأمراض نادرة، مما يساعد على تدريب نماذج تشخيصية أكثر قوة.
يمكن لشبكات GAN إجراء ترجمة من صورة إلى صورة، حيث يتم تحويل صورة من مجال ما إلى صورة في مجال آخر. على سبيل المثال، تم استخدام CycleGAN لتحويل الصور الفوتوغرافية إلى لوحات بأسلوب فنان معين، أو لتحويل صور الأقمار الصناعية إلى صور خرائط.
في حين أن شبكات التخزين العامة أداة قوية لتوليد البيانات، إلا أنها ليست النوع الوحيد من النماذج التوليدية. تشمل النماذج التوليدية الأخرى البارزة نماذج التشفير التلقائي المتغير (VAEs) والنماذج الانحدارية الذاتية.
إن VAEs هي فئة أخرى من النماذج التوليدية التي تستخدم نهجًا احتماليًا لتوليد البيانات. وخلافًا لشبكات GAN، تقوم VAEs بتشفير البيانات المدخلة في فضاء كامن ثم تقوم بفك تشفيرها مرة أخرى إلى فضاء البيانات الأصلي. وغالبًا ما تُستخدم التوقّعات الكامنة في مهام مثل إزالة الضوضاء من الصور واكتشاف الشذوذ. في حين تميل VAEs إلى إنتاج صور أكثر سلاسة ولكن في بعض الأحيان أكثر ضبابية مقارنةً بشبكات GAN، إلا أنها أسهل في التدريب بشكل عام وأقل عرضة لانهيار الوضع.
تقوم النماذج الانحدارية التلقائية، مثل GPT (المحول التوليدي المدرب مسبقًا)، بتوليد البيانات بالتتابع، عنصرًا واحدًا في كل مرة. هذه النماذج فعالة بشكل خاص في توليد النصوص، وقد استُخدمت لإنشاء نص متماسك للغاية ومرتبط بالسياق. وخلافاً لشبكات GAN، لا تنطوي النماذج الانحدارية التلقائية على عملية عدائية بل تركز بدلاً من ذلك على التنبؤ بالعنصر التالي في تسلسل ما بناءً على العناصر السابقة.
على الرغم من قدراتها المثيرة، إلا أن شبكات GAN تنطوي على العديد من التحديات:
يتطور مجال شبكات الشبكات الشبكية العالمية بشكل سريع، حيث تهدف الأبحاث الجارية إلى مواجهة التحديات وتوسيع نطاق تطبيقاتها. تمهد الابتكارات مثل تقنيات التدريب المحسّنة والبنى الجديدة والنماذج الهجينة التي تجمع بين نقاط قوة شبكات الشبكات الشبكية العالمية والنماذج التوليدية الأخرى الطريق لشبكات شبكية عالمية أكثر استقرارًا وتنوعًا.
استكشف مدونةUltralytics للاطلاع على أحدث التطورات في مجال الرؤية الحاسوبية والذكاء الاصطناعي التوليدي. لمعرفة المزيد عن المصطلحات ذات الصلة، تفضل بزيارة مسرد المصطلحات الشامل Ultralytics' مسرد مصطلحات الذكاء الاصطناعي والرؤية الحاسوبية.