مسرد المصطلحات

تزييف عميق

اكتشف التكنولوجيا والتطبيقات والمخاوف الأخلاقية المتعلقة بالتزييف العميق، من الترفيه إلى المعلومات المضللة. تعرّف على حلول الكشف والذكاء الاصطناعي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التزييف العميق هو عبارة عن مقاطع فيديو أو صور أو تسجيلات صوتية واقعية للغاية أو يتم إنشاؤها أو التلاعب بها صناعياً باستخدام تقنيات الذكاء الاصطناعي (AI) المتقدمة وتقنيات التعلم الآلي (ML) ، وخاصةً التعلم العميق (DL). هذا المصطلح هو مزيج من "التعلّم العميق" و"التزييف". تسمح هذه التقنيات بالاستبدال أو التوليف المقنع للوجوه والأصوات والأفعال بحيث يبدو وكأن شخصًا ما قال أو فعل شيئًا لم يفعله في الواقع. وعلى الرغم من أن تقنية "التزييف العميق" نشأت من مجتمعات الإنترنت، إلا أنها تطورت بسرعة، مما أتاح فرصاً إبداعية وتحديات أخلاقية كبيرة.

كيف يتم إنشاء التزييف العميق

تتضمن التقنية الأساسية وراء العديد من عمليات التزييف العميق شبكات الخصومة التوليدية (GANs). تتألف شبكة GAN من شبكتين عصبيتين متنافستين: مولد يقوم بإنشاء المحتوى المزيف (على سبيل المثال، صورة بوجه مقلوب) ومميّز يحاول التمييز بين المحتوى الحقيقي والمزيف. من خلال التدريب التكراري، يصبح المولد بارعًا بشكل متزايد في إنتاج محتوى مزيف واقعي يمكن أن يخدع المميّز، وفي نهاية المطاف، المراقبين البشريين. تُعد أدوات الترميز التلقائي تقنية شائعة أخرى، حيث تتعلم التمثيلات المضغوطة (الترميزات) للوجوه من مجموعات بيانات كبيرة ثم تقوم بفك تشفير هذه التمثيلات لإعادة بناء أو تبديل الوجوه على مقاطع الفيديو المستهدفة. وغالبًا ما يتطلب إنشاء عمليات تزييف عميقة مقنعة بيانات تدريب كبيرة (صور أو مقاطع فيديو للأفراد المستهدفين) وعددًا كبيرًا من GPU الحاسوبية، وغالباً ما تتم إدارتها عبر منصات مثل Ultralytics HUB.

التطبيقات والأمثلة

تمتلك تقنية التزييف العميق مجموعة من التطبيقات، تمتد من الاستخدامات المفيدة إلى الأنشطة الضارة:

  • الترفيه والإعلام: تُستخدم في صناعة الأفلام لإزالة شيخوخة الممثلين، أو إعادة تمثيل الشخصيات التاريخية، أو تحسين الدبلجة عن طريق تغيير حركات الشفاه لتتناسب مع الصوت المترجم. على سبيل المثال، استخدم صانعو الأفلام تقنيات التزييف العميق في فيلم الماندالوريان لإعادة إنشاء نسخة رقمية أصغر سناً من أحد الممثلين رقمياً. مثال آخر هو Synthesia، وهي منصة تستخدم صورًا رمزية للذكاء الاصطناعي لإنشاء مقاطع فيديو وعروض تقديمية للتدريب، مما يؤدي إلى إنشاء محتوى فيديو اصطناعي بشكل فعال.
  • التعليم وإمكانية الوصول: إنشاء معلمين افتراضيين أو إحياء شخصيات تاريخية لأغراض تعليمية. يمكن أن يساعد استنساخ الصوت الأفراد الذين فقدوا أصواتهم.
  • توليدالبيانات الاصطناعية: إنشاء مجموعات بيانات اصطناعية لتدريب نماذج أخرى للتعلم الآلي، خاصة في مجال الرؤية الحاسوبية، حيث قد تكون البيانات الحقيقية نادرة أو حساسة. يمكن أن يساعد ذلك في تحسين متانة نماذج مثل Ultralytics YOLO11 لمهام مثل التعرف على الوجه.
  • التضليل والخبث: نشر معلومات سياسية مضللة، وإنشاء تأييدات أو فضائح مزيفة للمشاهير، وإنتاج مواد إباحية غير توافقية، وارتكاب عمليات احتيال من خلال انتحال الشخصية (على سبيل المثال، التزييف الصوتي العميق لتوثيق المعاملات). تثير هذه الأمور مخاوف جدية بشأن أخلاقيات الذكاء الاصطناعي وخصوصية البيانات.

الكشف عن التزييف العميق

أدى ظهور التزييف العميق إلى تحفيز البحث في طرق الكشف عن التزييف العميق. وغالباً ما تتضمن هذه الأساليب تدريب نماذج تعلّم الآلة لتحديد التناقضات الدقيقة أو التزييفات المميزة للمحتوى الذي تم إنشاؤه، مثل أنماط الوميض غير المعتادة أو تعابير الوجه غير الطبيعية أو التناقضات في الإضاءة أو الظلال. تعتبر تقنيات الرؤية الحاسوبية (CV) أساسية في هذا الجهد. ومع ذلك، فإن الكشف عن التزييف العميق هو سباق تسلح مستمر، حيث تتحسن تقنيات توليد التزييف العميق باستمرار للتهرب من الكشف. منظمات مثل تحدي الكشف عن التزييف العميق (DFDC ) من قبل Meta AI ومبادرات من شركات مثل Microsoft إلى تطوير حالة تكنولوجيا الكشف. تُعد المعايير القياسية ومجموعات البيانات ضرورية لتطوير نماذج الكشف هذه وتقييمها.

التمييز عن التلاعب بوسائل الإعلام الأخرى

تختلف تقنية التزييف العميق عن التحرير التقليدي للصور أو مقاطع الفيديو (مثل استخدام Adobe Photoshop أو After Effects) في المقام الأول في استخدامها للتعلم العميق لتوليد عناصر مرئية أو صوتية جديدة وواقعية بالكامل بناءً على الأنماط المكتسبة، بدلاً من مجرد تغيير وحدات البكسل الموجودة يدوياً أو من خلال خوارزميات أبسط. بينما تركز تقنية التعرف على الصور على تحديد الأشياء أو السمات داخل الصورة، تركز تقنية التزييف العميق على توليف صور أو مقاطع فيديو معقولة. وهي تمثل تطبيقاً متطوراً للذكاء الاصطناعي التوليدي في المجال المرئي. ويؤكد احتمال إساءة الاستخدام على أهمية التطوير المسؤول للذكاء الاصطناعي والتوعية العامة.

قراءة الكل