FLUX.1 AI Image Gen في Grok 2.0: غير خاضعة للرقابة؟

في 14 أغسطس، أعلنت شركة الذكاء الاصطناعي التابعة لـ Elon Musk، xAI، عن إصدار Grok 2.0، وهو روبوت دردشة مدمج مع FLUX.1، وهو نموذج لتوليد الصور من Black Forest Labs، على X (تويتر سابقًا). FLUX.1 هو نموذج متقدم قادر على إنشاء صور واقعية للغاية، بما في ذلك الصور التي يمكن اعتبارها حساسة أو مضللة.

على عكس العديد من مولدات الصور الشائعة التي تحظر أو تقوم بتصفية أنواع معينة من المحتوى، مثل الصور العنيفة أو الصريحة أو الخادعة، فإن FLUX.1 لديه قيود أقل. يرى البعض ذلك بمثابة فوز لحرية التعبير، بينما أعجب البعض الآخر بقدراته المتقدمة. ومع ذلك، هناك أيضًا مخاوف بشأن الآثار الأخلاقية وإمكانية إساءة استخدام هذه التكنولوجيا القوية. دعنا نتعمق ونستكشف ما يقدمه Grok 2.0، وما الذي يميز FLUX.1، وكيف يمكنك تجربة هذه الأدوات المبتكرة بنفسك.

التعرف على FLUX.1: مولد صور بالذكاء الاصطناعي

FLUX.1 هو مولد صور متقدم مفتوح المصدر للذكاء الاصطناعي أطلقته Black Forest Labs في 1 أغسطس 2024. Black Forest Labs هي شركة ناشئة أسسها مهندسون سابقون في Stability AI المعروفة بعملها على نماذج Stable Diffusion واسعة الاستخدام. صُمم FLUX.1 لينافس مباشرةً اللاعبين المعروفين مثل MidJourney وDALL-E 3، ويوفر مستوى جديدًا من الجودة والمرونة للصور التي يتم إنشاؤها بالذكاء الاصطناعي. على سبيل المثال، يقوم FLUX.1 بعمل رائع في التعامل مع التفاصيل الصعبة التي تعاني منها العديد من النماذج، مثل توليد أيدي بشرية واقعية المظهر أو نص مقروء على اللافتات.

تقدم Black Forest Labs ثلاثة اختلافات مختلفة من FLUX.1 يمكن استخدامها لتطبيقات مختلفة. فيما يلي نظرة فاحصة على الاختلافات:

FLUX.1 [pro]: النموذج الرئيسي مخصص للاستخدام التجاري ومصمم لتقديم أعلى جودة للمخرجات.
‍
FLUX.1 [dev]: نسخة مفتوحة المصدر متاحة للاستخدام غير التجاري. مثالية للبحث والتطوير.
‍
FLUX.1 [schnell]: نموذج مُحسَّن للسرعة بموجب ترخيص Apache 2.0، وهو مثالي للمشاريع الشخصية والتطوير المحلي حيث تكون هناك حاجة إلى توليد صور سريع.

__wf_reserved_inherit — الشكل 1. فهم اختلافات FLUX.1.

‍

كيف يعمل FLUX.1؟

يستخدم FLUX.1 بنية نموذج هجينة تجمع بين تقنيات المحولات والانتشار بحجم نموذج يبلغ 12 مليار معلمة (الأجزاء القابلة للتعديل في الشبكة العصبية التي تساعدها على التعلم من البيانات). المحولات هي نوع من الشبكات العصبية التي يمكنها فهم التسلسلات مثل النصوص والصور من خلال التعرف على الأنماط والعلاقات داخل البيانات. تعمل نماذج الانتشار من خلال البدء بضوضاء عشوائية وتحسينها خطوة بخطوة حتى تتشكل صورة واضحة. من خلال الجمع بين هذين النهجين، يمكن لـ FLUX.1 استخدام نقاط القوة في كلتا البنيتين لإنتاج صور عالية الجودة تتطابق مع المطالبات النصية المقدمة.

يستخدم FLUX.1 أيضًا تقنيات متقدمة مثل تضمينات الموضع الدورانية ومطابقة التدفق. تساعد تضمينات الموضع الدورانية النموذج على فهم ترتيب وموضع العناصر في النصوص والصور للتأكد من أن كل شيء منطقي معًا. مطابقة التدفق هي تقنية تستخدم في النماذج التوليدية لجعل عملية إنشاء الصور من الضوضاء العشوائية أكثر سلاسة وكفاءة.

قياس أداء FLUX.1

عند مقارنة FLUX.1 بنماذج شائعة أخرى مثل MidJourney v6.0 و DALL·E 3 (HD) و SD3-Ultra، يضع FLUX.1 معيارًا جديدًا في إنشاء صور الذكاء الاصطناعي. إنه يتفوق في المجالات الرئيسية مثل جودة الصورة، ومدى اتباعه للمطالبات، وتنوع المخرجات، ودعم الأحجام ونسب العرض إلى الارتفاع المختلفة. تبرز نماذج FLUX.1 [pro] و [dev] لإنتاج صور عالية الجودة تتطابق تمامًا مع ما يريده المستخدمون، وغالبًا ما تتفوق هذه النماذج على النماذج الأخرى في تقديم نتائج واضحة ودقيقة. من ناحية أخرى، يعد FLUX.1 [schnell] أحد أكثر النماذج تقدمًا لإنشاء صور سريعة ويعمل بشكل أفضل من النماذج الأكثر تعقيدًا مثل MidJourney.

‍

Grok 2.0: الأحدث من xAI التابعة لإيلون ماسك

Grok 2.0 هو أحدث نموذج لغوي كبير (large language model) طورته شركة الذكاء الاصطناعي xAI التابعة لإيلون ماسك. تم إطلاق Grok 2.0 في أغسطس 2024، وهو متاح لمستخدمي X Premium و Premium+ على منصة X (تويتر سابقًا). أيضًا، سيكون متاحًا قريبًا للمطورين والشركات من خلال واجهة برمجة تطبيقات (API) للمؤسسات.

‍

تم بناء Grok 2.0 على بنية المحولات (transformer architecture)، وبالمقارنة مع الإصدار الأقدم، Grok 1.5، فهو أكثر توافقًا مع اتباع التعليمات، والاستدلال لحل المشكلات، وتقديم معلومات دقيقة. تم اختبار برنامج الدردشة الآلي (chatbot) مقابل نماذج الذكاء الاصطناعي الرائدة الأخرى وأظهر نتائج مبهرة. يتفوق Grok 2.0 على النماذج الشائعة مثل GPT-4 Turbo و Claude 3.5 Sonnet و Llama 3 405B في المعايير التي تتضمن أسئلة علمية على مستوى الدراسات العليا، ومعرفة عامة، ومسائل رياضية معقدة. كما أن Grok 2.0 جيد في المهام التي تتطلب فهمًا بصريًا وحقق درجات عالية في الاستدلال الرياضي البصري والإجابة على الأسئلة المستندة إلى المستندات.

العلاقة بين Grok 2.0 و FLUX.1

تم دمج FLUX.1 في Grok 2.0 لتوفير مزيج سلس من إنشاء النصوص والصور. في حين أن الجمع بين التقنيات المختلفة أمر شائع اليوم لتحسين الوظائف وتجربة المستخدم، إلا أن هذا التكامل بالذات قد حظي بالكثير من الاهتمام.

من ناحية أخرى، أشاد البعض بدمج FLUX.1 لإضافة عنصر "ممتع" إلى Grok 2.0. يمكن للمستخدمين تجربة إنشاء صور إبداعية وحادة في بعض الأحيان - وهي أشياء قد يتم تقييدها أو تعديلها بشدة بواسطة أدوات الذكاء الاصطناعي الأخرى. على سبيل المثال، شارك المستخدمون صورًا على X تصور شخصيات عامة في مواقف غير لائقة أو مثيرة للجدل، مدعين أنها تدعم فكرة حرية التعبير.

من ناحية أخرى، يجادل النقاد بأن عدم وجود إرشادات أخلاقية واضحة لـ FLUX.1 يمكن أن يؤدي إلى قضايا أخلاقية واجتماعية خطيرة مثل المعلومات المضللة والتزييف العميق. يخشى البعض من أن الجمع بين النصوص القوية وغير الخاضعة للرقابة وتوليد الصور على واحدة من أكثر منصات التواصل الاجتماعي نفوذاً يمكن أن يؤدي إلى تصعيد انتشار المعلومات المضللة.

Grok 2.0 ونهجها غير المقيد

الأمر لا يتعلق فقط بتوليد الصور. بل إن Grok 2.0 نفسه أكثر تقييداً من أدوات الذكاء الاصطناعي الأخرى التي ألفناها مؤخراً، مثل ChatGPT. هذا الافتقار إلى الاعتدال يجعل من الممكن للنموذج أن يتخطى الحدود بطرق يجدها البعض مثيرة ويجدها البعض الآخر مقلقة.

على سبيل المثال، لوحظ أن Grok 2.0 يقوم بإنشاء محتوى نصي يمكن تفسيره بسهولة على أنه أخبار كاذبة أو مضللة. تضمن حادث حديث قيام Grok 2.0 بإنشاء قصة كاذبة عن لاعب الدوري الاميركي للمحترفين كلاي طومسون يُفترض أنه في "موجة تخريب بالطوب." أساء روبوت الدردشة المدعوم بالذكاء الاصطناعي فهم مصطلح كرة السلة "رمي الطوب"، والذي يشير ببساطة إلى التسديدات الفاشلة. بدلاً من ذلك، أخذ Grok 2.0 الأمر حرفيًا واختلق قصة عن ارتكاب طومسون أعمال تخريب بالطوب الفعلي. اكتسب المنشور بسرعة انتشارًا على X، حيث أضاف بعض المستخدمين حتى حسابات ضحايا مزيفة لتأجيج المعلومات المضللة.

‍

على الرغم من هذه المخاوف، يقدر بعض المستخدمين موقف "حرية التعبير" الذي تتخذه Grok 2.0. وهم يجادلون بأنه يسمح بإجراء محادثات أكثر انفتاحًا وحرية إبداعية من نماذج الذكاء الاصطناعي الخاضعة للإشراف الشديد. إنهم يرون Grok 2.0 بمثابة رد على ما يعتبرونه حذرًا مفرطًا، "ذكاء اصطناعي مستيقظ" يحد من المناقشة حول الموضوعات الحساسة. بالنسبة لهؤلاء المستخدمين، يقدم Grok 2.0 نظامًا أساسيًا يبدو أقل تقييدًا بالمعايير المجتمعية.

جرب FLUX.1 و Grok 2.0 بنفسك

هناك بعض الخيارات المختلفة المتعلقة بتجربة FLUX.1 و Grok 2.0. يمكن الوصول إلى FLUX.1 مباشرةً من خلال منصات الذكاء الاصطناعي مثل Hugging Face و Replicate و Fal.ai. أما Grok 2.0 فهو متاح فقط لمشتركي X Premium وPremium+.

النقاط الرئيسية

يدفع FLUX.1 و Grok 2.0 حدود الذكاء الاصطناعي ويثيران محادثات ثاقبة. لقد وضع FLUX.1 معيارًا جديدًا في الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي بقدرته على إنتاج صور واقعية ومفصلة للغاية. يستخدم Grok 2.0 برنامج FLUX.1 لتعزيز قدراته إلى ما هو أبعد من مجرد التفاعلات النصية. من ناحية، يشعر المتحمسون بسعادة غامرة بالحرية الإبداعية والاستكشاف غير الخاضع للرقابة الذي توفره هذه الأدوات. من ناحية أخرى، يثير النقاد ناقوس الخطر بشأن مخاطر المعلومات المضللة والتزييف العميق والآثار الأخلاقية لمثل هذه القدرات غير المنظمة على منصة مؤثرة مثل X. مع تطور FLUX.1 و Grok 2.0، فإنهما يقفان في مركز نقاش حول الحرية والإبداع والمسؤولية في العصر الرقمي - وهو نقاش من المرجح أن يشكل مستقبل الذكاء الاصطناعي لسنوات قادمة.

لمعرفة المزيد عن Ultralytics تحقق من مستودع GitHub الخاص بنا، وانضم إلى مجتمعنا، واستكشف أحدث حلول الذكاء الاصطناعي لدينا في صناعات مثل الرعاية الصحية والتصنيع! 🚀

تطلق xAI Grok 2.0 مع تكامل FLUX.1

التعرف على FLUX.1: مولد صور بالذكاء الاصطناعي

كيف يعمل FLUX.1؟

قياس أداء FLUX.1

Grok 2.0: الأحدث من xAI التابعة لإيلون ماسك

العلاقة بين Grok 2.0 و FLUX.1

Grok 2.0 ونهجها غير المقيد

جرب FLUX.1 و Grok 2.0 بنفسك

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

12 حالة استخدام للصور الجوية مدعومة بالرؤية الحاسوبية

أدوات الرؤية الاصطناعية لتشخيص الرعاية الصحية

من البيانات إلى القرارات: استخدام الذكاء الاصطناعي البصري في استراتيجية المؤسسة

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

تطلق xAI Grok 2.0 مع تكامل FLUX.1

التعرف على FLUX.1: مولد صور بالذكاء الاصطناعي

كيف يعمل FLUX.1؟

قياس أداء FLUX.1

Grok 2.0: الأحدث من xAI التابعة لإيلون ماسك

العلاقة بين Grok 2.0 و FLUX.1

Grok 2.0 ونهجها غير المقيد

جرب FLUX.1 و Grok 2.0 بنفسك

النقاط الرئيسية

اقرأ المزيد في هذه الفئة

12 حالة استخدام للصور الجوية مدعومة بالرؤية الحاسوبية

أدوات الرؤية الاصطناعية لتشخيص الرعاية الصحية

من البيانات إلى القرارات: استخدام الذكاء الاصطناعي البصري في استراتيجية المؤسسة

لنبنِ مستقبل الذكاء الاصطناعي معًا!

لنبنِ مستقبل
الذكاء الاصطناعي معًا!