ميزات ChatGPT الجديدة: الرؤية، والبحث، والمزيد

نظرة عامة على ميزة اللوحة القماشية في OpenAI

تحديثات واجهة برمجة تطبيقات ChatGPT

التقطير النموذجي

التخزين المؤقت الفوري

واجهة برمجة التطبيقات الفورية

ضبط ChatGPT الدقيق لمهام الرؤية

عدالة ChatGPT والكشف عن التحيز

فهم بحث ChatGPT

الطريق إلى الأمام

بعد أن ألقينا نظرة أخيرة على نماذج o1 من OpenAI في سبتمبر (والتي صُممت لتحسين التفكير المنطقي)، تمت إضافة العديد من الميزات الجديدة والمثيرة إلى ChatGPT. بعض هذه الإصدارات موجهة للمطورين، والبعض الآخر مصمم لتحسين تجربة المستخدم. بشكل عام، تساعد كل ترقية في جعل التفاعل مع ChatGPT أكثر سهولة وفعالية.

وقد أثارت تحديثات مثل Canvas، المصممة للكتابة التعاونية والترميز، والضبط الدقيق لإمكانيات الرؤية التي تُحسِّن من كيفية عمل ChatGPT مع الصور، الكثير من الاهتمام، مما شجع المستخدمين على استكشاف المزيد من الإمكانيات الإبداعية. وفي الوقت نفسه، تعالج الترقيات التقنية، مثل واجهات برمجة التطبيقات الجديدة وتقارير اختبار الإنصاف، جوانب مثل تكامل النماذج، وممارسات الذكاء الاصطناعي الأخلاقية . دعنا نتعمق في الأمر ونحصل على فهم أفضل لأحدث ميزات ChatGPT من OpenAI!

نظرة عامة على ميزة اللوحة القماشية في OpenAI

Canvas هو أول تحديث رئيسي لواجهة مستخدم ChatGPT (UI) منذ إصداره. إنها واجهة جديدة ذات تخطيط بشاشتين، والمطالبات على الشريط الجانبي الأيسر، والردود في النافذة الجانبية اليمنى. تتخلص واجهة المستخدم الجديدة من سير العمل المعتاد لبنية الدردشة التي تشبه الشاشة الواحدة وتنتقل إلى تخطيط من شاشتين يناسب أغراض تعدد المهام لتعزيز الإنتاجية.

_w_f_reserved_nherit — الشكل 1. يجلب Canvas تحديثات واجهة المستخدم إلى ChatGPT.

‍

قبل تقديم Canvas، كان العمل مع المستندات الطويلة على ChatGPT يعني الاضطرار إلى التمرير لأعلى ولأسفل قليلاً. في التصميم الجديد، يتم عرض المطالبات على الشريط الجانبي الأيسر، ويشغل المستند النصي أو مقتطف التعليمات البرمجية معظم الشاشة. إذا لزم الأمر، يمكنك حتى تخصيص حجم الشريط الجانبي الأيسر وشاشة الإخراج. كما يمكنك أيضًا تحديد جزء من النص أو جزء من التعليمات البرمجية وتحرير الجزء المحدد دون تغيير المستند بأكمله.

‍

إذا كنت تستخدم Canvas، ستلاحظ عدم وجود زر أو مفتاح تبديل محدد لفتحه على واجهة ChatGPT. بدلًا من ذلك، عندما تعمل مع نموذج GPT-4o، تفتح Canvas تلقائيًا إذا اكتشفت أنك تقوم بالتحرير أو الكتابة أو الترميز. بالنسبة للمطالبات الأبسط، يبقى غير نشط. إذا كنت تريد فتحه يدويًا، يمكنك استخدام مطالبات مثل "افتح اللوحة القماشية" أو "أحضر لي تخطيط اللوحة القماشية."

حاليًا، Canvas في مرحلة تجريبية ومتاحة فقط مع GPT-4o. ومع ذلك، فقد ذكر OpenAI أن Canvas سيكون متاحًا لجميع المستخدمين المجانيين عندما يخرج من الإصدار التجريبي.

تحديثات واجهة برمجة تطبيقات ChatGPT

أصدرت OpenAI ثلاثة تحديثات جديدة لواجهة برمجة تطبيقات ChatGPT تهدف إلى تحسين الكفاءة وقابلية التوسع والتنوع. دعنا نلقي نظرة فاحصة على كل من هذه التحديثات.

التقطير النموذجي

باستخدام ميزة تقطير النماذج من خلال واجهات برمجة التطبيقات OpenAI، يمكن للمطورين استخدام مخرجات النماذج المتقدمة مثل GPT-4o أو o1-preview لتحسين أداء النماذج الأصغر حجماً والأكثر كفاءة من حيث التكلفة مثل GPT-4o mini. تقطير النماذج هو عملية تتضمن تدريب نماذج أصغر لمحاكاة سلوك النماذج الأكثر تقدمًا، مما يجعلها أكثر كفاءة لمهام محددة.

قبل تقديم هذه الميزة، كان على المطورين تنسيق مجموعة متنوعة من المهام يدويًا باستخدام أدوات مختلفة. تضمنت هذه المهام توليد مجموعات البيانات، وقياس أداء النموذج، وضبط النماذج، مما جعل العملية معقدة ومعرضة للأخطاء في كثير من الأحيان. يتيح تحديث تقطير النماذج للمطوّرين استخدام الاستكمالات المخزّنة، وهي أداة تتيح لهم توليد مجموعات البيانات تلقائيًا من خلال التقاط وتخزين أزواج المدخلات والمخرجات التي تنتجها النماذج المتقدمة من خلال واجهة برمجة التطبيقات.

تساعد خاصية أخرى من ميزات تقطير النماذج، وهي Evals (قيد الإصدار التجريبي حاليًا)، على قياس مدى جودة أداء النموذج في مهام محددة، دون الحاجة إلى إنشاء نصوص برمجية مخصصة للتقييم أو استخدام أدوات منفصلة. وباستخدام مجموعات البيانات التي تم إنشاؤها باستخدام الاستكمالات المخزنة وتقييم الأداء باستخدام Evals، يمكن للمطورين ضبط نماذج GPT المخصصة الخاصة بهم.

‍

التخزين المؤقت الفوري

في كثير من الأحيان عند إنشاء تطبيقات الذكاء الاصطناعي، وخاصةً روبوتات الدردشة، سيتم استخدام نفس السياق (المعلومات الأساسية أو سجل المحادثة السابقة اللازمة لفهم الطلب الحالي) بشكل متكرر لمكالمات واجهة برمجة التطبيقات المتعددة. يتيح التخزين المؤقت للمطالب للمطورين إمكانية إعادة استخدام رموز الإدخال المستخدمة مؤخرًا (مقاطع نصية يعالجها النموذج لفهم المطالبة وإنشاء استجابة)، مما يساعد على تقليل التكلفة وزمن الاستجابة.

اعتبارًا من الأول من أكتوبر، طبقت OpenAI تلقائيًا خاصية التخزين المؤقت للمطالبات على نماذجها مثل GPT-4o و GPT-4o mini و o1-preview و o1-mini. هذا يعني أنه عندما يستخدم المطورون واجهة برمجة التطبيقات للتفاعل مع نموذج بمطالبة طويلة (أكثر من 1,024 رمزًا)، يحفظ النظام الأجزاء التي عالجها بالفعل.

وبهذه الطريقة، إذا تم استخدام نفس المطالبات أو مطالبات مشابهة مرة أخرى، يمكنه تخطي إعادة حساب تلك الأجزاء. يقوم النظام تلقائيًا بتخزين أطول جزء من المطالبة التي واجهها سابقًا بشكل مؤقت، بدءًا من 1024 رمزًا وإضافة أجزاء من 128 رمزًا كلما أصبحت المطالبة أطول.

واجهة برمجة التطبيقات الفورية

ينطوي إنشاء مساعد صوتي بشكل عام على الحاجة إلى تحويل الصوت إلى نص، ومعالجة النص، ثم تحويله مرة أخرى إلى صوت لتشغيل الرد. تهدف واجهة برمجة تطبيقات Realtime API الخاصة ب OpenAI إلى التعامل مع هذه العملية بأكملها بطلب واحد من واجهة برمجة التطبيقات. ومن خلال تبسيط العملية، تتيح واجهة برمجة التطبيقات إجراء محادثات في الوقت الفعلي مع الذكاء الاصطناعي.

على سبيل المثال، يمكن للمساعد الصوتي المدمج مع واجهة برمجة التطبيقات في الوقت الفعلي تنفيذ إجراءات محددة، مثل تقديم طلب أو العثور على معلومات، بناءً على طلبات المستخدم. تجعل واجهة برمجة التطبيقات المساعد الصوتي أكثر استجابة وقدرة على التكيف بسرعة مع احتياجات المستخدمين. أصبحت واجهة برمجة التطبيقات Realtime API متاحة من خلال الإصدار التجريبي العام في الأول من أكتوبر، مع ستة أصوات. وفي 30 أكتوبر، تمت إضافة خمسة أصوات أخرى، ليصبح المجموع أحد عشر صوتاً متاحاً.

‍

ضبط ChatGPT الدقيق لمهام الرؤية

في الأصل، لم يكن بالإمكان ضبط نموذج لغة الرؤية GPT-4o وتخصيصه إلا باستخدام مجموعات بيانات نصية فقط. والآن، مع إصدار واجهة برمجة تطبيقات الضبط الدقيق للرؤية، يمكن للمطورين تدريب GPT-4o وتخصيصه باستخدام مجموعات بيانات الصور. منذ إصداره، أصبح الضبط الدقيق للرؤية موضوعًا رئيسيًا يحظى باهتمام المطورين ومهندسي الرؤية الحاسوبية.

لضبط قدرات الرؤية في GPT-4o، يمكن للمطوّرين استخدام مجموعات بيانات الصور التي تتراوح بين عدد قليل من الصور يصل إلى 100 صورة إلى ما يصل إلى 50000 صورة. بعد التأكد من أن مجموعة البيانات تتطابق مع التنسيق المطلوب من قبل OpenAI، يمكن تحميلها إلى منصة Openai، ويمكن ضبط النموذج لتطبيقات محددة.

على سبيل المثال، استخدمت شركة Automat، وهي شركة أتمتة، مجموعة بيانات من لقطات الشاشة لتدريب GPT-4o على تحديد عناصر واجهة المستخدم على الشاشة بناءً على الوصف. يساعد ذلك على تبسيط أتمتة العمليات الروبوتية (RPA) من خلال تسهيل تفاعل الروبوتات مع واجهات المستخدم. بدلاً من الاعتماد على الإحداثيات الثابتة أو قواعد التحديد المعقدة، يمكن للنموذج تحديد عناصر واجهة المستخدم استناداً إلى أوصاف بسيطة، مما يجعل إعدادات الأتمتة أكثر قابلية للتكيف وأسهل في الصيانة عند تغيير الواجهات.

‍

عدالة ChatGPT والكشف عن التحيز

تُعد المخاوف الأخلاقية المحيطة بتطبيقات الذكاء الاصطناعي موضوعاً بارزاً للنقاش مع تزايد تقدم الذكاء الاصطناعي. ونظراً لأن إجابات ChatGPT تستند إلى المطالبات التي يقدمها المستخدم والبيانات المتاحة على الإنترنت، فقد يكون من الصعب ضبط لغتها لتكون مسؤولة طوال الوقت. تشير التقارير إلى أن إجابات ChatGPT متحيزة بشأن الاسم والجنس والعرق. ولمعالجة هذه المشكلة، أجرى فريق OpenAI الداخلي اختباراً للإنصاف من منظور الشخص الأول.

غالباً ما تحمل الأسماء إشارات خفية عن ثقافتنا وعوامل جغرافية. في معظم الحالات، يتجاهل ChatGPT الإشارات الخفية في الأسماء. ومع ذلك، في بعض الحالات، تؤدي الأسماء التي تعكس العرق أو الثقافة إلى استجابات مختلفة من ChatGPT، حيث تعكس حوالي 1% منها لغة ضارة. يُعد القضاء على التحيزات واللغة الضارة مهمة صعبة لنموذج اللغة. ومع ذلك، من خلال مشاركة هذه النتائج علنًا والاعتراف بمحدودية النموذج، يساعد OpenAI المستخدمين على تحسين مطالباتهم لتحقيق إجابات أكثر حيادية وغير متحيزة.

‍

فهم بحث ChatGPT

عندما تم إطلاق ChatGPT لأول مرة، كانت هناك مناقشات في مجتمع الذكاء الاصطناعي حول ما إذا كان بإمكانه أن يحل محل تصفح الويب التقليدي. والآن، يستخدم العديد من المستخدمين ChatGPT بدلاً من بحث Google.

يأخذ التحديث الجديد لـ OpenAI، خاصية البحث، هذا الأمر خطوة إلى الأمام. مع خاصية البحث، تُنشئ ChatGPT إجابات محدّثة وتتضمن روابط لمصادر ذات صلة. اعتباراً من 31 أكتوبر، أصبحت خاصية البحث متاحة لجميع مستخدمي ChatGPT Plus و Team، مما يجعل ChatGPT يعمل كمحرك بحث مدعوم بالذكاء الاصطناعي.

‍

الطريق إلى الأمام

تركز تحديثات ChatGPT الأخيرة على جعل الذكاء الاصطناعي أكثر فائدة ومرونة وإنصافاً. تساعد خاصية Canvas الجديدة المستخدمين على العمل بكفاءة أكبر، بينما يسمح الضبط الدقيق للرؤية للمطورين بتخصيص النماذج للتعامل مع المهام المرئية بشكل أفضل. تُعد معالجة الإنصاف والحد من التحيز من الأولويات الرئيسية أيضاً، لضمان عمل الذكاء الاصطناعي بشكل جيد للجميع، بغض النظر عن هويتهم. سواء كنت مطورًا يقوم بضبط النماذج بدقة أو مجرد استخدام أحدث الميزات، فإن ChatGPT يتطور لتلبية مجموعة واسعة من الاحتياجات. مع إمكانات الوقت الحقيقي، والتكامل المرئي، والتركيز على الاستخدام المسؤول، تعمل هذه التحديثات على بناء تجربة ذكاء اصطناعي أكثر جدارة بالثقة والموثوقية للجميع.

استكشف المزيد عن الذكاء الاصطناعي من خلال زيارة مستودع GitHub الخاص بنا والانضمام إلى مجتمعنا. تعرّف على المزيد حول تطبيقات الذكاء الاصطناعي في القيادة الذاتية والرعاية الصحية.

آخر تحديثات OpenAI: Canvas، وصقل الرؤية، والمزيد

نظرة عامة على ميزة اللوحة القماشية في OpenAI