قياس أداء الذكاء الاصطناعي لتقييم تأثير ابتكاراتك

يمكنك مراقبة نجاح ابتكاراتك في مجال الذكاء الاصطناعي باستخدام مؤشرات الأداء الرئيسية ومقاييس الأداء الصحيحة. تعرّف على كيفية تتبع تأثير تطبيقات الذكاء الاصطناعي وتحسينها.

كتبه

أبيرامي فينا

قراءة دقيقة

22 أغسطس 2024

أبريل 13, 2025

فهم مقاييس أداء الذكاء الاصطناعي الرئيسية

الدقة

استرجاع

الدقة مقابل الاستدعاء

متوسط الدقة المتوسطة (mAP)

حساب مقاييس الأداء دون عناء

كيف يتم قياس أداء الذكاء الاصطناعي بعد النشر؟

اختيار مؤشرات الأداء الرئيسية المثلى للذكاء الاصطناعي هو مجرد البداية

لقد استكشفنا سابقاً كيف يمكن استخدام الذكاء الاصطناعي في صناعات مختلفة مثل الرعاية الصحية والتصنيع والسياحة. كما بحثنا أيضاً كيف يمكن لل ذكاء الاصطناعي تحسين مهام العمل اليومية وناقشنا أفكاراً رائدة في مجال أعمال الذكاء الاصطناعي. كل هذه المناقشات تؤدي حتماً إلى نفس السؤال الرئيسي: كيف يمكننا قياس نجاح تطبيقات الذكاء الاصطناعي هذه؟ إنه سؤال مهم لأن مجرد نشر حلول الذكاء الاصطناعي لا يكفي. إن التأكد من أن هذه الحلول تحقق نتائج فعلية هو ما يجعلها تغير قواعد اللعبة.

يمكننا قياس مقاييس أداء الذكاء الاصطناعي لتحديد ما إذا كان نموذج الذكاء الاصطناعي فعالاً حقاً في جعل العمليات أكثر كفاءة، أو تحفيز الابتكار، أو حل المشاكل. من خلال التركيز على مؤشرات الأداء الرئيسية الصحيحة (KPIs)، يمكننا فهم مدى نجاح حل الذكاء الاصطناعي في العمل والأماكن التي قد تحتاج إلى تحسين.

في هذه المقالة، سنلقي نظرة على كيفية قياس نجاح تطبيقات الذكاء الاصطناعي باستخدام مؤشرات الأداء الرئيسية الأكثر صلة. سنغطي الاختلافات بين مؤشرات الأداء الرئيسية للأعمال ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي، وسنستعرض المقاييس الرئيسية مثل الدقة والاستدعاء، وسنساعدك في اختيار أفضل مؤشرات الأداء الرئيسية لحلول الذكاء الاصطناعي الخاصة بك.

الفرق بين مؤشرات الأداء الرئيسية لأعمال الذكاء الاصطناعي ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي

_w_f_reserved_herit — الشكل 1. مقارنة مؤشرات الأداء الرئيسية لأعمال الذكاء الاصطناعي ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي.

‍

عندما تفكر في مؤشرات الأداء الرئيسية، من الطبيعي أن تفترض أنها تتعلق بمقاييس الأعمال مثل العائد على الاستثمار (ROI) أو وفورات التكاليف أو الإيرادات المتحققة - خاصةً عند الحديث عن الذكاء الاصطناعي المؤسسي. تقيس مؤشرات الأداء الرئيسية لأعمال الذكاء الاصطناعي للأعمال هذه كيفية تأثير الذكاء الاصطناعي على نجاح الشركة بشكل عام وتتماشى مع أهداف العمل الأوسع نطاقاً.

ومع ذلك، تركز مؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي على مدى جودة عمل نظام الذكاء الاصطناعي نفسه، باستخدام مقاييس مثل الدقة والدقة والاستدعاء. سوف ندخل في تفاصيل هذه المقاييس أدناه، ولكن في الجوهر، بينما تعرض مؤشرات الأداء الرئيسية للأعمال الفوائد المالية والاستراتيجية للذكاء الاصطناعي، فإن مؤشرات الأداء الرئيسية للأداء تتأكد من أن نموذج الذكاء الاصطناعي يؤدي وظيفته بفعالية.

يمكن أن تخدم بعض المقاييس في الواقع كلا الغرضين. على سبيل المثال، يمكن أن تكون مكاسب الكفاءة، مثل تقليل الوقت أو الموارد اللازمة لإكمال مهمة ما، مؤشر أداء رئيسي (يوضح مدى جودة عمل حل الذكاء الاصطناعي) ومؤشر أداء رئيسي للأعمال (قياس وفورات التكاليف وتحسينات الإنتاجية). رضا العملاء هو مقياس آخر متقاطع. حيث يمكن أن يعكس نجاح أداة خدمة العملاء القائمة على الذكاء الاصطناعي من حيث الأداء الفني وتأثيرها على أهداف العمل بشكل عام.

فهم مقاييس أداء الذكاء الاصطناعي الرئيسية

هناك بعض المقاييس الشائعة المستخدمة لقياس مدى جودة أداء نموذج الذكاء الاصطناعي. أولاً، سنلقي نظرة على تعريفها وكيفية حسابها. بعد ذلك، سنرى كيف يمكن مراقبة هذه المقاييس.

الدقة

الدقة هي مقياس يقيس مدى دقة نموذج الذكاء الاصطناعي في تحديد الإيجابيات الحقيقية (الحالات التي يحدد فيها النموذج كائنًا أو حالة بشكل صحيح كما هو مفترض). على سبيل المثال، في نظام التعرّف على الوجه، قد تحدث النتيجة الإيجابية الحقيقية عندما يتعرف النظام بشكل صحيح على وجه شخص تم تدريبه على اكتشافه ويحدده.

لحساب الدقة، قم أولاً بحساب عدد العناصر الإيجابية الحقيقية. يمكنك بعد ذلك قسمة ذلك على إجمالي عدد العناصر التي صنفها النموذج على أنها إيجابية. يتضمن هذا الإجمالي كلاً من التعريفات الصحيحة والأخطاء التي تُسمى بالإيجابيات الخاطئة. بشكل أساسي، تخبرك الدقة بعدد المرات التي يكون فيها النموذج صحيحًا عندما يدّعي أنه تعرّف على شيء ما.

‍

وهو أمر مهم بشكل خاص في السيناريوهات التي يمكن أن تكون فيها عواقب النتائج الإيجابية الخاطئة مكلفة أو معطلة. على سبيل المثال، في التصنيع الآلي، يشير معدل الدقة المرتفع إلى أن النظام يمكن أن يشير بدقة أكبر إلى المنتجات المعيبة ويمنع التخلص أو إعادة العمل غير الضروري للعناصر الجيدة. مثال جيد آخر هو المراقبة الأمنية. تساعد الدقة العالية على تقليل الإنذارات الكاذبة والتركيز فقط على التهديدات الحقيقية التي تحتاج إلى استجابة أمنية.

استرجاع

يساعد الاستدعاء في قياس قدرة نموذج الذكاء الاصطناعي على تحديد جميع الحالات ذات الصلة، أو الحالات الإيجابية الحقيقية، ضمن مجموعة بيانات. ببساطة، فهو يمثل ببساطة مدى قدرة نظام الذكاء الاصطناعي على التقاط جميع الحالات الفعلية لحالة أو كائن صُمم لاكتشافه. يمكن حساب التذكر بقسمة عدد الاكتشافات الصحيحة على العدد الإجمالي للحالات الإيجابية التي كان ينبغي اكتشافها (يشمل ذلك الحالات التي حددها النموذج بشكل صحيح والحالات التي لم يكتشفها).

فكر في نظام تصوير طبي مدعوم بالذكاء الاصطناعي يُستخدم للكشف عن السرطان. يعكس التذكر، في هذا السياق، النسبة المئوية لحالات السرطان الفعلية التي يحددها النظام بشكل صحيح. يعد التذكر المرتفع أمرًا حيويًا في مثل هذه السيناريوهات لأن فقدان تشخيص السرطان يمكن أن يؤدي إلى عواقب وخيمة على رعاية المرضى.

الدقة مقابل الاستدعاء

الدقة والاستدعاء يشبهان وجهين لعملة واحدة عندما يتعلق الأمر بتقييم أداء نموذج الذكاء الاصطناعي، وغالبًا ما يتطلبان توازنًا. ويكمن التحدي في أن تحسين أحد المقياسين يمكن أن يأتي غالبًا على حساب الآخر.

لنفترض أنك تدفع باتجاه دقة أعلى. قد يصبح النموذج أكثر انتقائية ويصبح قادرًا على تحديد الإيجابيات التي هو متأكد منها فقط. من ناحية أخرى، إذا كنت تهدف إلى تحسين التذكّر، فقد يحدد النموذج المزيد من الإيجابيات، ولكن هذا قد يتضمن المزيد من الإيجابيات الخاطئة وينتهي الأمر بخفض الدقة.

المفتاح هو إيجاد التوازن الصحيح بين الدقة والاستدعاء بناءً على الاحتياجات المحددة لتطبيقك. من الأدوات المفيدة لهذا الأمر منحنى الدقة والاستدعاء، والذي يوضح العلاقة بين المقياسين عند عتبات مختلفة. من خلال تحليل هذا المنحنى، يمكنك تحديد النقطة المثلى التي يحقق فيها النموذج أفضل أداء لحالة الاستخدام الخاصة بك. يساعدك فهم المفاضلة عند ضبط نماذج الذكاء الاصطناعي لتحقيق الأداء الأمثل لحالات الاستخدام المقصودة.

‍

متوسط الدقة المتوسطة (mAP)

متوسط الدقة المتوسطة (mAP) هو مقياس يُستخدم لتقييم أداء نماذج الذكاء الاصطناعي لمهام مثل اكتشاف الأجسام، حيث يحتاج النموذج إلى تحديد وتصنيف أجسام متعددة داخل الصورة. يمنحك mAP درجة واحدة تُظهر مدى جودة أداء النموذج عبر جميع الفئات المختلفة التي تم تدريبه على التعرف عليها. دعنا نرى كيف يتم حسابها.

المنطقة تحت منحنى الدقة والاستدعاء تعطي متوسط الدقة (AP) لتلك الفئة. يقيس متوسط الدقة مدى دقة النموذج في إجراء تنبؤات لفئة معينة، مع الأخذ في الاعتبار كلًا من الدقة والاستدعاء عبر مستويات الثقة المختلفة (تشير مستويات الثقة إلى مدى تأكد النموذج من تنبؤاته). بمجرد حساب متوسط الدقة لكل فئة، يتم تحديد متوسط الدقة لكل فئة من خلال حساب متوسط قيم الدقة لكل فئة.

‍

تُعد mAP مفيدة في تطبيقات مثل القيادة الذاتية، حيث يجب اكتشاف العديد من الأجسام، مثل المشاة والمركبات وإشارات المرور، في وقت واحد. تعني درجة mAP المرتفعة أن النموذج يؤدي أداءً جيدًا باستمرار في جميع الفئات، مما يجعله موثوقًا ودقيقًا في مجموعة واسعة من السيناريوهات.

حساب مقاييس الأداء دون عناء

قد تبدو معادلات وطرق حساب مقاييس الأداء الرئيسية للذكاء الاصطناعي شاقة. ومع ذلك، يمكن لأدوات مثل حزمةUltralytics أن تجعل الأمر بسيطًا وسريعًا. سواء كنت تعمل على مهام الكشف عن الكائنات أو التجزئة أو التصنيف، فإن Ultralytics توفر الأدوات المساعدة اللازمة لحساب المقاييس المهمة بسرعة مثل الدقة والاستدعاء ومتوسط متوسط الدقة (mAP).

لبدء حساب مقاييس الأداء باستخدام Ultralytics ، يمكنك تثبيت الحزمة Ultralytics كما هو موضح أدناه.

في هذا المثال، سنقوم في هذا المثال بتحميل نموذج YOLOv8 مدرب مسبقًا واستخدامه للتحقق من صحة مقاييس الأداء، ولكن يمكنك تحميل أي من النماذج المدعومة التي يوفرها Ultralytics. إليك كيفية القيام بذلك:

بمجرد تحميل النموذج، يمكنك إجراء التحقق من صحة مجموعة البيانات الخاصة بك. سيساعدك مقتطف الشيفرة التالي في حساب مقاييس الأداء المختلفة، بما في ذلك الدقة والاستدعاء و mAP:

إن استخدام أدوات مثل Ultralytics يجعل حساب مقاييس الأداء أسهل بكثير، بحيث يمكنك قضاء المزيد من الوقت في تحسين نموذجك ووقت أقل في القلق بشأن تفاصيل عملية التقييم.

كيف يتم قياس أداء الذكاء الاصطناعي بعد النشر؟

عند تطوير نموذج الذكاء الاصطناعي الخاص بك، من السهل اختبار أدائه في بيئة محكومة. ومع ذلك، بمجرد نشر النموذج، يمكن أن تصبح الأمور أكثر تعقيداً. لحسن الحظ، هناك أدوات وأفضل الممارسات التي يمكن أن تساعدك على مراقبة حل الذكاء الاصطناعي الخاص بك بعد النشر.

صُممت أدوات مثل Prometheus وGrafana وEvidently AI لتتبع أداء نموذجك باستمرار. ويمكنها تقديم رؤى في الوقت الحقيقي، واكتشاف الحالات الشاذة، وتنبيهك إلى أي مشاكل محتملة. تتجاوز هذه الأدوات المراقبة التقليدية من خلال تقديم حلول آلية قابلة للتطوير تتكيف مع الطبيعة الديناميكية لنماذج الذكاء الاصطناعي في الإنتاج.

لقياس نجاح نموذج الذكاء الاصطناعي الخاص بك بعد النشر، إليك بعض أفضل الممارسات التي يجب اتباعها:

ضع مقاييس أداء واضحة: حدد مقاييس رئيسية مثل الدقة والدقة ووقت الاستجابة للتحقق بانتظام من مدى جودة أداء نموذجك.
‍
تحقق بانتظام من انجراف البيانات: راقب التغييرات في البيانات التي يتعامل معها النموذج الخاص بك، حيث يمكن أن يؤثر ذلك على تنبؤاته إذا لم تتم إدارتها بشكل صحيح.
‍
إجراء اختبار أ/ب: استخدم اختبار A/B لمقارنة أداء نموذجك الحالي بالإصدارات أو التعديلات الجديدة. سيسمح لك ذلك بإجراء تقييم كمي للتحسينات أو التراجعات في سلوك النموذج.
‍
توثيق وتدقيق الأداء: احتفظ بسجلات مفصلة لمقاييس الأداء والتغييرات التي تم إجراؤها على نظام الذكاء الاصطناعي الخاص بك. وهو أمر بالغ الأهمية لعمليات التدقيق والامتثال وتحسين بنية نموذجك بمرور الوقت.

اختيار مؤشرات الأداء الرئيسية المثلى للذكاء الاصطناعي هو مجرد البداية

يعتمد نشر حل الذكاء الاصطناعي وإدارته بنجاح على اختيار مؤشرات الأداء الرئيسية الصحيحة وتحديثها باستمرار. بشكل عام، يعد اختيار المقاييس التي تسلط الضوء على مدى جودة أداء حل الذكاء الاصطناعي من الناحية الفنية ومن حيث تأثيره على الأعمال أمرًا حيويًا. مع تغير الأمور، سواء كان ذلك بسبب التقدم التكنولوجي أو التحولات في استراتيجية عملك، من المهم إعادة النظر في مؤشرات الأداء الرئيسية هذه وتعديلها.

من خلال الحفاظ على ديناميكية مراجعات الأداء الخاصة بك، يمكنك الحفاظ على ملاءمة وفعالية نظام الذكاء الاصطناعي الخاص بك. من خلال البقاء على اطلاع على هذه المقاييس، ستحصل على رؤى قيمة تساعد في تحسين عملياتك. يضمن لك النهج الاستباقي أن تكون جهود الذكاء الاصطناعي الخاصة بك ذات قيمة حقيقية وتساعد في دفع أعمالك إلى الأمام!

انضم إلى مجتمعنا وابتكر معنا! استكشف مستودع GitHub الخاص بنا للاطلاع على تطوراتنا في مجال الذكاء الاصطناعي. تعرّف على كيفية إعادة تشكيل صناعات مثل التصنيع والرعاية الصحية باستخدام تقنية الذكاء الاصطناعي الرائدة. 🚀

قياس أداء الذكاء الاصطناعي لتقييم تأثير ابتكاراتك

الفرق بين مؤشرات الأداء الرئيسية لأعمال الذكاء الاصطناعي ومؤشرات الأداء الرئيسية لأداء الذكاء الاصطناعي