اكتشف كيف تُحدث نماذج الانتشار ثورة في الذكاء الاصطناعي التوليدي من خلال إنشاء صور ومقاطع فيديو وبيانات واقعية بتفاصيل وثبات لا مثيل لهما.
نماذج الانتشار هي فئة من النماذج التوليدية في التعلم الآلي (ML) التي اكتسبت اهتمامًا كبيرًا لقدرتها على إنتاج عينات متنوعة وعالية الجودة، لا سيما في مجال الرؤية الحاسوبية. تعمل هذه النماذج، المستوحاة من مفاهيم الديناميكا الحرارية، من خلال إضافة ضوضاء بشكل منهجي إلى البيانات (مثل الصورة) في "عملية أمامية" حتى تصبح ضوضاء خالصة، ثم تعلم عكس هذه العملية. تتضمن "العملية العكسية" تدريب شبكة عصبية لإزالة الضوضاء تدريجيًا، بدءًا من الضوضاء العشوائية وتنقيحها بشكل متكرر حتى يتم إنشاء عينة بيانات واقعية.
تنطوي الفكرة الأساسية على مرحلتين:
تختلف نماذج الانتشار اختلافًا كبيرًا عن النُهج التوليدية الشائعة الأخرى مثل شبكات الخصومة التوليدية (GANs). فبينما تتضمن شبكات الشبكات العدائية التوليدية مولدًا ومميّزًا يتنافسان ضد بعضهما البعض، مما يؤدي غالبًا إلى عدم استقرار التدريب، تميل نماذج الانتشار إلى أن تكون ديناميكيات التدريب أكثر استقرارًا. وغالبًا ما تحقق تنوعًا وجودة أفضل للعينات مقارنةً بشبكات GAN، على الرغم من أنها تتطلب عادةً المزيد من الخطوات الحسابية أثناء الاستدلال (التوليد)، مما يجعلها أبطأ. على عكس أجهزة التشفير التلقائي المتغير (VAEs)، التي تتعلم مساحة كامنة مضغوطة، تعمل نماذج الانتشار مباشرةً في مساحة البيانات من خلال عملية التشويش وإزالة الضوضاء. البديل الشائع هو الانتشار المستقر، المعروف بكفاءته ومخرجاته عالية الجودة.
تتفوق نماذج الانتشار في المهام التي تتطلب توليدًا عالي الدقة:
أطر عمل مثل PyTorch والمكتبات مثل مكتبةHugging Face المنتشرة توفر أدوات ونماذج مدربة مسبقًا، مما يسهل على المطورين تجربة نماذج الانتشار ونشرها. إن قدرتها على توليد بيانات متنوعة وعالية الجودة تجعلها أداة قوية في التطور المستمر للذكاء الاصطناعي التوليدي.