X
Ultralytics YOLOv8.2 الإصدارUltralytics YOLOv8.2 إطلاق الهاتف المحمولUltralytics YOLOv8.2 سهم الإطلاق
الشيك الأخضر
تم نسخ الرابط إلى الحافظة

نظرة متعمقة في إمكانيات GPT-4o Mini من OpenAI

استكشف ميزات وتطبيقات GPT-4o Mini. يوفر الطراز الأحدث والأكثر فعالية من حيث التكلفة من OpenAI إمكانات ذكاء اصطناعي متقدمة بسعر أرخص بنسبة 60% من GPT-3.5 Turbo.

في مايو 2024، أصدرت OpenAI GPT-4o، والآن، بعد ثلاثة أشهر فقط، عادت الشركة بنموذج آخر مثير للإعجاب: GPT-4o Mini. في 18 يوليو 2024، طرحت OpenAI في 18 يوليو 2024، GPT-4o Mini. يطلقون عليه "النموذج الأكثر فعالية من حيث التكلفة"! GPT-4o Mini هو نموذج مدمج يعتمد على قدرات النماذج السابقة ويهدف إلى جعل الذكاء الاصطناعي المتقدم أكثر سهولة وبأسعار معقولة.

يدعم GPT-4o Mini حاليًا التفاعلات النصية والرؤية، ومن المتوقع أن تضيف التحديثات المستقبلية إمكانات للتعامل مع الصور ومقاطع الفيديو والصوت. في هذه المقالة، سنستكشف ما هو GPT-4o Mini، وميزاته البارزة، وكيف يمكن استخدامه، والاختلافات بين GPT-4 و GPT-4o Mini، وكيف يمكن استخدامه في حالات استخدام رؤية الحاسوب المختلفة. دعونا نتعمق ونرى ما يقدمه GPT-4o Mini!

ما هو GPT-4o Mini؟

GPT-4o Mini هو أحدث إضافة إلى مجموعة نماذج الذكاء الاصطناعي من OpenAI، وهو مصمم ليكون أكثر فعالية من حيث التكلفة وسهولة الوصول إليه. إنه نموذج لغوي كبير متعدد الوسائط (LLM)، مما يعني أنه يمكنه معالجة وتوليد أنواع مختلفة من البيانات، مثل النصوص والصور ومقاطع الفيديو والصوت. يعتمد النموذج على نقاط القوة في النماذج السابقة مثل GPT-4 و GPT-4o لتقديم قدرات قوية في حزمة مدمجة. 

إن GPT-4o Mini أرخص بنسبة 60% من GPT-3.5 Turbo، حيث تبلغ تكلفته 15 سنتاً لكل مليون رمز إدخال (وحدات النص أو البيانات التي يعالجها النموذج) و60 سنتاً لكل مليون رمز إخراج (الوحدات التي يولدها النموذج استجابةً لذلك). لوضع ذلك في منظوره الصحيح، مليون توكن يعادل تقريبًا معالجة 2,500 صفحة من النص. صُمم GPT-4o Mini ليكون فعّالاً وميسور التكلفة في آنٍ واحد مع نافذة سياق تبلغ 128 ألف رمز مميز والقدرة على معالجة ما يصل إلى 16 ألف رمز مميز للإخراج لكل طلب.

الشكل 1. GPT-4o Mini أرخص بنسبة 60% من GPT-3.5 Turbo.

الميزات الرئيسية لـ GPT-4o Mini 

يدعم GPT-4o Mini مجموعة من المهام التي تجعله خياراً رائعاً لمختلف التطبيقات. يمكن استخدامه عند تشغيل العديد من العمليات في آنٍ واحد، مثل استدعاء واجهات برمجة تطبيقات متعددة، والتعامل مع كميات كبيرة من البيانات مثل قواعد التعليمات البرمجية الكاملة أو سجلات المحادثات، وتوفير استجابات سريعة وفورية في روبوتات الدردشة لدعم العملاء.

إليك بعض الميزات الرئيسية الأخرى:

  • قاعدة المعارف المحدّثة: يحتوي النموذج على معلومات حتى أكتوبر 2023.
  • أداة ترميز محسّنة: يجعل GPT-4o Mini معالجة النصوص غيرEnglish أكثر فعالية من حيث التكلفة.
  • تدابير أمان قوية: تتضمن هذه الإجراءات تصفية المحتوى الضار والحماية من مشكلات الأمان مثل الحقن الفوري والتلاعب بالنظام.

البدء باستخدام GPT-4o Mini 

يمكنك تجربة استخدام GPT-4o Mini من خلال واجهة ChatGPT . وهو متاح للمستخدمين المجانيين ومستخدمي Plus والفريق، ليحل محل GPT-3.5 كما هو موضح أدناه. سيحصل مستخدمو المؤسسات أيضًا على إمكانية الوصول قريبًا، بما يتماشى مع هدف OpenAI المتمثل في توفير مزايا الذكاء الاصطناعي للجميع. يتوفر GPT-4o Mini أيضًا من خلال واجهة برمجة التطبيقات (API) للمطورين الذين يرغبون في دمج قدراته في تطبيقاتهم. في الوقت الحالي، لا يمكن الوصول إلى قدرات الرؤية إلا من خلال واجهة برمجة التطبيقات.

الشكل 2. خيارات النماذج ضمن ChatGPT.

الفرق بين GPT-4o و GPT-4o Mini 

يحقق كلٌّ من GPT-4o Mini وGPT-4o-4o أداءً مذهلًا في مختلف المعايير. في حين يتفوق GPT-4o بشكل عام على GPT-4o Mini، إلا أن GPT-4o Mini لا يزال حلاً فعالاً من حيث التكلفة للمهام اليومية. تشمل المعايير مهام التفكير، وإتقان الرياضيات والترميز، والتفكير متعدد الوسائط. كما هو موضح في الصورة أدناه، فإن معايير GPT-4o Mini عالية جدًا عند مقارنتها بالنماذج الشائعة الأخرى.

الشكل 3. مقارنة GPT-4o Mini بنماذج أخرى شائعة.

التدريب العملي على استخدام GPT-4o وGPT-4o Mini

هناك موجه مثير للاهتمام تمت مناقشته على الإنترنت يتضمن قيام برامج LLM الشهيرة بمقارنة الأرقام العشرية بشكل غير صحيح. عندما وضعنا نموذجي GPT-4o و GPT-4o Mini في الاختبار، أظهرت قدراتهما المنطقية اختلافات واضحة. في الصورة أدناه، سألنا كلا النموذجين أيهما أكبر: 9.11 أم 9.9، ثم طلبنا منهما شرح منطقهما.

الشكل 4. اختبار GPT-4o و GPT-4o Mini.

يستجيب كلا النموذجين في البداية بشكل خاطئ ويزعمان أن 9.11 أكبر. ومع ذلك، فإن نموذج GPT-4o قادر على التفكير في طريقه إلى الإجابة الصحيحة ويذكر أن 9.9 أكبر. فهو يقدم شرحًا مفصّلًا ويقارن بين الأعداد العشرية بدقة. على النقيض من ذلك، تتمسك GPT-4o Mini بإجابتها الأولية الخاطئة بعناد على الرغم من اكتشافها أن 9.9 أكبر بشكل صحيح.

يُظهر كلا النموذجين مهارات تفكير قوية. قدرة GPT-4o على تصحيح نفسه تجعله متفوقًا ومفيدًا للمهام الأكثر تعقيدًا. على الرغم من أن GPT-4o Mini، رغم أنه أقل قدرة على التكيف، إلا أنه لا يزال يقدم استدلالًا واضحًا ودقيقًا للمهام الأبسط. 

استخدام GPT-4o Mini لحالات استخدامات الرؤية الحاسوبية المختلفة

إذا كنت تفضل استكشاف إمكانيات الرؤية في GPT-4o Mini دون الغوص في الكود البرمجي، يمكنك بسهولة اختبار واجهة برمجة التطبيقات على ساحة لعب OpenAI Playground. لقد جربنا ذلك بأنفسنا لنرى مدى قدرة GPT-4o Mini على التعامل مع مختلف حالات الاستخدام المتعلقة بالرؤية الحاسوبية.

تصنيف الصور باستخدام GPT-4o Mini

طلبنا من GPT-4o Mini تصنيف صورتين: إحداهما لفراشة والأخرى لخريطة. نجح نموذج الذكاء الاصطناعي في تحديد الفراشة والخريطة. هذه مهمة بسيطة إلى حد ما نظراً لاختلاف الصورتين اختلافاً كبيراً.

الشكل 5. تصنيف الصور بمساعدة GPT-4o Mini.

تابعنا وقمنا بتشغيل صورتين أخريين من خلال النموذج: إحداهما تُظهر فراشة تستقر على نبتة والأخرى تُظهر فراشة تستقر على الأرض. قام الذكاء الاصطناعي بعمل رائع مرة أخرى، حيث رصد الفراشة على النبتة والفراشة على الأرض بشكل صحيح. لذا، تقدمنا خطوة أخرى إلى الأمام مرة أخرى.

الشكل 6. تصنيف الصور المتشابهة بمساعدة GPT-4o Mini.

طلبنا بعد ذلك من GPT-4o Mini تصنيف صورتين: إحداهما تُظهر فراشة تتغذى على أزهار عشبة المستنقعات اللبنية والأخرى تُظهر فراشة تتغذى على زهرة الزينيا. من المدهش أن النموذج كان قادراً على تصنيف تسمية محددة للغاية دون مزيد من الضبط الدقيق. توضح هذه الأمثلة السريعة إمكانية استخدام GPT-4o Mini في مهام تصنيف الصور دون الحاجة إلى تدريب مخصص.

الشكل 7. تصنيف الصور التفصيلية بمساعدة GPT-4o Mini.

فهم الوضعيات باستخدام GPT-4o Mini

اعتبارًا من الآن، لا يمكن التعامل مع مهام الرؤية الحاسوبية مثل اكتشاف الأجسام وتجزئة المثيل باستخدام GPT-4o Mini. يكافح GPT-4o من أجل الدقة، ولكن يمكن استخدامه لمثل هذه المهام. على هذا المنوال، فيما يتعلق بفهم الوضعيات، لا يمكننا اكتشاف الوضعية في الصورة أو تقديرها، لكن يمكننا تصنيف الوضعية وفهمها.

الشكل 8. استخدام GPT-4o Mini لفهم الوضعيات في الصورة. 

تُظهر الصورة أعلاه كيف يمكن لـ GPT-4o Mini تصنيف الوضعيات وفهمها، على الرغم من عدم قدرته على اكتشاف أو تقدير الإحداثيات الدقيقة للوضعية. يمكن أن يكون هذا مفيداً في تطبيقات مختلفة. على سبيل المثال، في التحليلات الرياضية، يمكنه تقييم حركات الرياضيين على نطاق واسع والمساعدة في منع الإصابات. وبالمثل، في العلاج الطبيعي، يمكن أن يساعد في مراقبة التمارين للتأكد من قيام المرضى بالحركات الصحيحة أثناء إعادة التأهيل. وفي المراقبة أيضاً، يمكن أن يساعد في تحديد الأنشطة المشبوهة من خلال تحليل لغة الجسد العامة. في حين لا يستطيع GPT-4o Mini اكتشاف نقاط رئيسية محددة، فإن قدرته على تصنيف الوضعيات العامة تجعله مفيداً في هذه المجالات وغيرها.

تطبيقات GPT-4o Mini مناسبة لـ

لقد ألقينا نظرة على ما يمكن أن يفعله GPT-4o Mini. والآن، دعنا نناقش التطبيقات التي يكون فيها استخدام GPT-4o Mini هو الأمثل.

يُعدّ GPT-4o Mini رائعاً للتطبيقات التي تتطلب فهماً متقدماً للغة الطبيعية وتحتاج إلى بصمة حاسوبية صغيرة. فهو يجعل من الممكن دمج الذكاء الاصطناعي في التطبيقات التي عادةً ما تكون مكلفة للغاية. في الواقع، يُظهر تحليل مفصّل أجراه موقع Artificial Analysis أن GPT-4o Mini يوفر استجابات عالية الجودة بسرعات فائقة مقارنةً بمعظم النماذج الأخرى.

الشكل 9. الجودة مقابل سرعة إخراج GPT-4o Mini.

إليك بعض المجالات الرئيسية التي يمكن أن تتألق فيها في المستقبل:

  • المساعدون الافتراضيون وروبوتات الدردشة الآلية: يمكن لـ GPT-4o Mini توفير استجابات سريعة وذكية لتحسين تفاعلات المستخدم.
  • الأدوات التعليمية: يمكن استخدام النموذج لبناء أدوات لتقديم دروس خصوصية وتوليد محتوى مخصص.
  • أدوات الإنتاجية: يمكنها تحسين مهام مثل تلخيص المستندات، وصياغة رسائل البريد الإلكتروني، وترجمة اللغات لتعزيز الكفاءة.
  • ترجمة اللغات: يمكن استخدام أحدث إصدار من GPT لتطوير مترجمين يوفرون ترجمة لغوية دقيقة وفورية من أجل تواصل أفضل بين اللغات المختلفة.

GPT-4o Mini GPT-4o يفتح أبواباً جديدة

يخلق GPT-4o Mini فرصاً جديدة لمستقبل الذكاء الاصطناعي متعدد الوسائط. لقد انخفضت تكلفة معالجة كل جزء من النص أو البيانات، والمعروفة باسم تكلفة الرمز المميز، بشكل كبير - بنسبة 99% تقريباً - منذ عام 2022، عندما تم إصدار نموذج GPT-3 من GPT-003. يُظهِر الانخفاض في التكلفة اتجاهاً واضحاً نحو جعل الذكاء الاصطناعي المتقدم ميسور التكلفة. مع استمرار تحسن نماذج الذكاء الاصطناعي، أصبح من المرجح بشكل متزايد أن يصبح دمج الذكاء الاصطناعي في كل تطبيق وموقع إلكتروني مجدياً من الناحية الاقتصادية!

هل تريد التدريب العملي على الذكاء الاصطناعي؟ قم بزيارة مستودع GitHub الخاص بنا للاطلاع على ابتكاراتنا وكن جزءاً من مجتمعنا النشط. اكتشف المزيد حول تطبيقات الذكاء الاصطناعي في التصنيع والزراعة على صفحات الحلول الخاصة بنا.

شعار الفيسبوكشعار تويترشعار لينكد إنرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي