استكشف ميزات وتطبيقات GPT-4o Mini. يوفر الطراز الأحدث والأكثر فعالية من حيث التكلفة من OpenAI إمكانات ذكاء اصطناعي متقدمة بسعر أرخص بنسبة 60% من GPT-3.5 Turbo.
في مايو 2024، أصدرت OpenAI GPT-4o، والآن، بعد ثلاثة أشهر فقط، عادت الشركة بنموذج آخر مثير للإعجاب: GPT-4o Mini. في 18 يوليو 2024، طرحت OpenAI في 18 يوليو 2024، GPT-4o Mini. يطلقون عليه "النموذج الأكثر فعالية من حيث التكلفة"! GPT-4o Mini هو نموذج مدمج يعتمد على قدرات النماذج السابقة ويهدف إلى جعل الذكاء الاصطناعي المتقدم أكثر سهولة وبأسعار معقولة.
يدعم GPT-4o Mini حاليًا التفاعلات النصية والرؤية، ومن المتوقع أن تضيف التحديثات المستقبلية إمكانات للتعامل مع الصور ومقاطع الفيديو والصوت. في هذه المقالة، سنستكشف ما هو GPT-4o Mini، وميزاته البارزة، وكيف يمكن استخدامه، والاختلافات بين GPT-4 و GPT-4o Mini، وكيف يمكن استخدامه في حالات استخدام رؤية الحاسوب المختلفة. دعونا نتعمق ونرى ما يقدمه GPT-4o Mini!
GPT-4o Mini هو أحدث إضافة إلى مجموعة نماذج الذكاء الاصطناعي من OpenAI، وهو مصمم ليكون أكثر فعالية من حيث التكلفة وسهولة الوصول إليه. إنه نموذج لغوي كبير متعدد الوسائط (LLM)، مما يعني أنه يمكنه معالجة وتوليد أنواع مختلفة من البيانات، مثل النصوص والصور ومقاطع الفيديو والصوت. يعتمد النموذج على نقاط القوة في النماذج السابقة مثل GPT-4 و GPT-4o لتقديم قدرات قوية في حزمة مدمجة.
إن GPT-4o Mini أرخص بنسبة 60% من GPT-3.5 Turbo، حيث تبلغ تكلفته 15 سنتاً لكل مليون رمز إدخال (وحدات النص أو البيانات التي يعالجها النموذج) و60 سنتاً لكل مليون رمز إخراج (الوحدات التي يولدها النموذج استجابةً لذلك). لوضع ذلك في منظوره الصحيح، مليون توكن يعادل تقريبًا معالجة 2,500 صفحة من النص. صُمم GPT-4o Mini ليكون فعّالاً وميسور التكلفة في آنٍ واحد مع نافذة سياق تبلغ 128 ألف رمز مميز والقدرة على معالجة ما يصل إلى 16 ألف رمز مميز للإخراج لكل طلب.
يدعم GPT-4o Mini مجموعة من المهام التي تجعله خياراً رائعاً لمختلف التطبيقات. يمكن استخدامه عند تشغيل العديد من العمليات في آنٍ واحد، مثل استدعاء واجهات برمجة تطبيقات متعددة، والتعامل مع كميات كبيرة من البيانات مثل قواعد التعليمات البرمجية الكاملة أو سجلات المحادثات، وتوفير استجابات سريعة وفورية في روبوتات الدردشة لدعم العملاء.
إليك بعض الميزات الرئيسية الأخرى:
يمكنك تجربة استخدام GPT-4o Mini من خلال واجهة ChatGPT . وهو متاح للمستخدمين المجانيين ومستخدمي Plus والفريق، ليحل محل GPT-3.5 كما هو موضح أدناه. سيحصل مستخدمو المؤسسات أيضًا على إمكانية الوصول قريبًا، بما يتماشى مع هدف OpenAI المتمثل في توفير مزايا الذكاء الاصطناعي للجميع. يتوفر GPT-4o Mini أيضًا من خلال واجهة برمجة التطبيقات (API) للمطورين الذين يرغبون في دمج قدراته في تطبيقاتهم. في الوقت الحالي، لا يمكن الوصول إلى قدرات الرؤية إلا من خلال واجهة برمجة التطبيقات.
يحقق كلٌّ من GPT-4o Mini وGPT-4o-4o أداءً مذهلًا في مختلف المعايير. في حين يتفوق GPT-4o بشكل عام على GPT-4o Mini، إلا أن GPT-4o Mini لا يزال حلاً فعالاً من حيث التكلفة للمهام اليومية. تشمل المعايير مهام التفكير، وإتقان الرياضيات والترميز، والتفكير متعدد الوسائط. كما هو موضح في الصورة أدناه، فإن معايير GPT-4o Mini عالية جدًا عند مقارنتها بالنماذج الشائعة الأخرى.
هناك موجه مثير للاهتمام تمت مناقشته على الإنترنت يتضمن قيام برامج LLM الشهيرة بمقارنة الأرقام العشرية بشكل غير صحيح. عندما وضعنا نموذجي GPT-4o و GPT-4o Mini في الاختبار، أظهرت قدراتهما المنطقية اختلافات واضحة. في الصورة أدناه، سألنا كلا النموذجين أيهما أكبر: 9.11 أم 9.9، ثم طلبنا منهما شرح منطقهما.
يستجيب كلا النموذجين في البداية بشكل خاطئ ويزعمان أن 9.11 أكبر. ومع ذلك، فإن نموذج GPT-4o قادر على التفكير في طريقه إلى الإجابة الصحيحة ويذكر أن 9.9 أكبر. فهو يقدم شرحًا مفصّلًا ويقارن بين الأعداد العشرية بدقة. على النقيض من ذلك، تتمسك GPT-4o Mini بإجابتها الأولية الخاطئة بعناد على الرغم من اكتشافها أن 9.9 أكبر بشكل صحيح.
يُظهر كلا النموذجين مهارات تفكير قوية. قدرة GPT-4o على تصحيح نفسه تجعله متفوقًا ومفيدًا للمهام الأكثر تعقيدًا. على الرغم من أن GPT-4o Mini، رغم أنه أقل قدرة على التكيف، إلا أنه لا يزال يقدم استدلالًا واضحًا ودقيقًا للمهام الأبسط.
إذا كنت تفضل استكشاف إمكانيات الرؤية في GPT-4o Mini دون الغوص في الكود البرمجي، يمكنك بسهولة اختبار واجهة برمجة التطبيقات على ساحة لعب OpenAI Playground. لقد جربنا ذلك بأنفسنا لنرى مدى قدرة GPT-4o Mini على التعامل مع مختلف حالات الاستخدام المتعلقة بالرؤية الحاسوبية.
طلبنا من GPT-4o Mini تصنيف صورتين: إحداهما لفراشة والأخرى لخريطة. نجح نموذج الذكاء الاصطناعي في تحديد الفراشة والخريطة. هذه مهمة بسيطة إلى حد ما نظراً لاختلاف الصورتين اختلافاً كبيراً.
تابعنا وقمنا بتشغيل صورتين أخريين من خلال النموذج: إحداهما تُظهر فراشة تستقر على نبتة والأخرى تُظهر فراشة تستقر على الأرض. قام الذكاء الاصطناعي بعمل رائع مرة أخرى، حيث رصد الفراشة على النبتة والفراشة على الأرض بشكل صحيح. لذا، تقدمنا خطوة أخرى إلى الأمام مرة أخرى.
طلبنا بعد ذلك من GPT-4o Mini تصنيف صورتين: إحداهما تُظهر فراشة تتغذى على أزهار عشبة المستنقعات اللبنية والأخرى تُظهر فراشة تتغذى على زهرة الزينيا. من المدهش أن النموذج كان قادراً على تصنيف تسمية محددة للغاية دون مزيد من الضبط الدقيق. توضح هذه الأمثلة السريعة إمكانية استخدام GPT-4o Mini في مهام تصنيف الصور دون الحاجة إلى تدريب مخصص.
اعتبارًا من الآن، لا يمكن التعامل مع مهام الرؤية الحاسوبية مثل اكتشاف الأجسام وتجزئة المثيل باستخدام GPT-4o Mini. يكافح GPT-4o من أجل الدقة، ولكن يمكن استخدامه لمثل هذه المهام. على هذا المنوال، فيما يتعلق بفهم الوضعيات، لا يمكننا اكتشاف الوضعية في الصورة أو تقديرها، لكن يمكننا تصنيف الوضعية وفهمها.
تُظهر الصورة أعلاه كيف يمكن لـ GPT-4o Mini تصنيف الوضعيات وفهمها، على الرغم من عدم قدرته على اكتشاف أو تقدير الإحداثيات الدقيقة للوضعية. يمكن أن يكون هذا مفيداً في تطبيقات مختلفة. على سبيل المثال، في التحليلات الرياضية، يمكنه تقييم حركات الرياضيين على نطاق واسع والمساعدة في منع الإصابات. وبالمثل، في العلاج الطبيعي، يمكن أن يساعد في مراقبة التمارين للتأكد من قيام المرضى بالحركات الصحيحة أثناء إعادة التأهيل. وفي المراقبة أيضاً، يمكن أن يساعد في تحديد الأنشطة المشبوهة من خلال تحليل لغة الجسد العامة. في حين لا يستطيع GPT-4o Mini اكتشاف نقاط رئيسية محددة، فإن قدرته على تصنيف الوضعيات العامة تجعله مفيداً في هذه المجالات وغيرها.
لقد ألقينا نظرة على ما يمكن أن يفعله GPT-4o Mini. والآن، دعنا نناقش التطبيقات التي يكون فيها استخدام GPT-4o Mini هو الأمثل.
يُعدّ GPT-4o Mini رائعاً للتطبيقات التي تتطلب فهماً متقدماً للغة الطبيعية وتحتاج إلى بصمة حاسوبية صغيرة. فهو يجعل من الممكن دمج الذكاء الاصطناعي في التطبيقات التي عادةً ما تكون مكلفة للغاية. في الواقع، يُظهر تحليل مفصّل أجراه موقع Artificial Analysis أن GPT-4o Mini يوفر استجابات عالية الجودة بسرعات فائقة مقارنةً بمعظم النماذج الأخرى.
إليك بعض المجالات الرئيسية التي يمكن أن تتألق فيها في المستقبل:
يخلق GPT-4o Mini فرصاً جديدة لمستقبل الذكاء الاصطناعي متعدد الوسائط. لقد انخفضت تكلفة معالجة كل جزء من النص أو البيانات، والمعروفة باسم تكلفة الرمز المميز، بشكل كبير - بنسبة 99% تقريباً - منذ عام 2022، عندما تم إصدار نموذج GPT-3 من GPT-003. يُظهِر الانخفاض في التكلفة اتجاهاً واضحاً نحو جعل الذكاء الاصطناعي المتقدم ميسور التكلفة. مع استمرار تحسن نماذج الذكاء الاصطناعي، أصبح من المرجح بشكل متزايد أن يصبح دمج الذكاء الاصطناعي في كل تطبيق وموقع إلكتروني مجدياً من الناحية الاقتصادية!
هل تريد التدريب العملي على الذكاء الاصطناعي؟ قم بزيارة مستودع GitHub الخاص بنا للاطلاع على ابتكاراتنا وكن جزءاً من مجتمعنا النشط. اكتشف المزيد حول تطبيقات الذكاء الاصطناعي في التصنيع والزراعة على صفحات الحلول الخاصة بنا.