شيك أخضر
تم نسخ الرابط إلى الحافظة

فهم دور FPS في الرؤية الحاسوبية

تعرّف على سبب أهمية FPS في رؤية الكمبيوتر وكيفية تأثيره على اكتشاف الأجسام في الوقت الحقيقي وتحليلات الفيديو والتطبيقات التي تعمل بالذكاء الاصطناعي.

تختلف مشاهدة الإعادة البطيئة للحظة رياضية مفضلة لديك، حيث تكون كل التفاصيل واضحة، اختلافاً كبيراً عن مشاهدة لقطات المراقبة التي عادةً ما تبدو متشنجة ويصعب متابعتها. التفاصيل التقنية الرئيسية وراء هذه الاختلافات هي FPS، أو الإطارات في الثانية، والتي تشير إلى عدد الإطارات المعروضة في الثانية الواحدة في الفيديو. يؤدي ارتفاع معدل الإطارات في الثانية إلى حركة سلسة ونابضة بالحياة، في حين أن انخفاض معدل الإطارات في الثانية يمكن أن يؤدي إلى لقطات متشنجة وأقل تفصيلاً.

يؤثر هذا المفهوم بشكل مباشر على رؤية الكمبيوتر، وهو فرع من الذكاء الاصطناعي يسمح للآلات بتفسير البيانات المرئية وتحليلها بشكل مشابه لما يفعله البشر. في الرؤية الحاسوبية، يعني ارتفاع معدل الإطارات في الثانية أن الأنظمة يمكنها التقاط المزيد من المعلومات كل ثانية، مما يحسن دقة اكتشاف الأجسام وتتبعها في الوقت الحقيقي.

في هذه المقالة، سوف نستكشف الجوانب التقنية لـ FPS وكيفية ارتباطها بتطبيقات الرؤية الحاسوبية. لنبدأ!

ماذا يعني FPS في رؤية الكمبيوتر؟

لنفترض أنك تلعب لعبة سباق: عند 60 إطارًا في الثانية، ستشعر بسلاسة واستجابة كل منعطف، ولكن عند 20 إطارًا في الثانية، ستتأخر عناصر التحكم، مما يجعل من الصعب تفادي العقبات. ببساطة، يمكنك التفكير في FPS على أنه عدد الصور الثابتة التي تظهر كل ثانية. المزيد من الصور في الثانية الواحدة تجعل الحركة تبدو سلسة وطبيعية، بينما عدد أقل من الصور يجعلها تبدو متقطعة.

كما هو الحال في الألعاب، يعد FPS جزءًا أساسيًا من تطبيقات رؤية الكمبيوتر. يتيح ارتفاع معدل الإطارات في الثانية إمكانية تتبع الأجسام باستخدام الذكاء الاصطناعي للرؤية بسلاسة، بينما يمكن أن يؤدي انخفاض معدل الإطارات في الثانية إلى فقدان التفاصيل. 

على سبيل المثال، في التحليلات الرياضية، تحتاج الكاميرات التي تعمل بالذكاء الاصطناعي إلى معدل FPS أعلى لتتمكن من تتبع التمريرات السريعة وحركات اللاعبين ومسارات الكرة. قد يؤدي انخفاض معدل الإطارات في الثانية إلى تفويت فرصة التقاط تلامس مهم من القدم إلى الكرة أو تغيير سريع في الاتجاه، مما يؤثر على دقة التحليل. 

وبالمثل، في مجال مراقبة حركة المرور، تعتمد الأنظمة على FPS عالية في الثانية لاكتشاف المركبات المسرعة وتغييرات الحارات في الوقت الفعلي. ويعتمد اختيار FPS المناسب على المتطلبات المحددة لكل تطبيق من تطبيقات الرؤية الحاسوبية، والموازنة بين الأداء والكفاءة والوضوح البصري.

الشكل 1. مقارنة معدلات الإطارات المختلفة.

الجوانب التقنية لـ FPS في رؤية الكمبيوتر

والآن بعد أن ناقشنا ما هو FPS وكيفية استخدامه في رؤية الكمبيوتر، دعنا نتعمق في جوانبه التقنية - بدءًا من كيفية حساب FPS لمقطع فيديو. 

بقسمة العدد الإجمالي للإطارات على المدة بالثانية تحصل على FPS للفيديو. على سبيل المثال، إذا كان الفيديو يحتوي على 96 إطارًا على مدى 4 ثوانٍ، فإنّه يُحتسب 24 إطارًا في الثانية - ما يعني عرض 24 صورة كل ثانية - بينما ينتج عن 32 إطارًا على مدى 4 ثوانٍ 8 إطارات في الثانية. يمكن استخدام مكتبات Python مثل OpenCV لاستخراج البيانات الوصفية للفيديو، وحساب الإطارات، وحساب FPS تلقائيًا، مما يسهّل عملية تحليل الفيديو.

الشكل 2. 24 إطارًا في الثانية مقابل 8 إطارات في الثانية مقابل 4 إطارات في الثانية.

العوامل التي تؤثر على FPS للفيديو

ومع ذلك، لا يكفي حساب معدل الإطارات في الثانية وحده لاتخاذ القرارات التقنية عند تطوير حلول الرؤية الحاسوبية. من المهم أيضًا مراعاة العوامل المختلفة التي يمكن أن تؤثر على معدل الإطارات الفعال، مثل قدرات الأجهزة وتحسينات البرامج والظروف البيئية. 

إليك نظرة فاحصة على هذه العوامل:

  • قدرات الأجهزة: يمكن أن تحدد جودة مستشعر الكاميرا وقوة معالجة الجهاز عدد الإطارات التي يتم التقاطها كل ثانية. عادةً ما تعني الأجهزة الأفضل دعمًا لإطارات أعلى في الثانية وفيديو أكثر سلاسة.
  • تحسينات البرمجيات: تساعد برامج ترميز ومعالجة الفيديو الفعالة في استخراج الإطارات وتحليلها بسرعة. وهذا يضمن معالجة الفيديو دون أي تأخير غير ضروري.
  • الظروف البيئية: تؤثر الإضاءة والحركة في المشهد على مدى وضوح التقاط الإطارات. يمكن أن تؤدي الإضاءة الجيدة والحركة المعتدلة إلى تحسين معدل الإطارات في الثانية بينما قد تتطلب الظروف السيئة معدل إطارات في الثانية أعلى للحفاظ على الوضوح.
  • احتياجات التخزين: تلتقط الإطارات الأعلى في الثانية إطارات أكثر في الثانية، مما يؤدي إلى أحجام ملفات أكبر. وهذا يزيد من متطلبات التخزين ويتطلب معالجة أسرع للبيانات لضمان التشغيل السلس.

استكشاف FPS في تطبيقات رؤية الكمبيوتر

نماذج الذكاء الاصطناعي مثل Ultralytics YOLO11 التي تدعم مهام الرؤية الحاسوبية في الوقت الحقيقي يمكن استخدامها لتحليل مقاطع الفيديو بمعدلات إطارات عالية. هذه القدرة في الوقت الحقيقي أمر بالغ الأهمية لتطبيقات مثل القيادة الذاتية والمراقبة والروبوتات، حيث يمكن أن تؤدي حتى التأخيرات الصغيرة إلى أخطاء كبيرة. 

دعنا نستعرض بعض تطبيقات الذكاء الاصطناعي المرئي في العالم الحقيقي حيث يكون ارتفاع معدل الإطارات في الثانية ضروريًا للدقة والأداء. 

معدل إطارات أعلى لحلول المراقبة والحلول الأمنية

تستخدم أنظمة المراقبة التي تراقب المناطق ذات الكثافة المرورية العالية مثل الطرق السريعة معدل إطارات عالية في الثانية لالتقاط تفاصيل دقيقة، مما يضمن توثيق المركبات سريعة الحركة بوضوح. هذا الوضوح ضروري لأنظمة التعرف الآلي على لوحات الأرقام (ANPR) ، والتي تعتمد على لقطات عالية الجودة لتحديد المركبات بدقة.

في مثل هذه الأنظمة، يمكن استخدام نماذج مثل YOLO11 للكشف عن لوحات السيارات مباشرةً من موجز الفيديو. وبمجرد اكتشاف اللوحة، يتم استخدام نظام التعرف الضوئي على الحروف (OCR)، الذي يحول صور النص إلى أحرف يمكن قراءتها آلياً، لقراءة تفاصيل اللوحة. وتتيح هذه العملية إمكانية التعرف السريع والدقيق على المركبة، مما يعزز من إنفاذ قوانين المرور والأمن العام.

الشكل 3. استخدام YOLO11 للكشف عن لوحات السيارات.

فهم متطلبات FPS للأنظمة المستقلة

فكّر في سيارة ذاتية القيادة عند إشارة توقف، حيث تقوم بتحليل محيطها بعناية لتقرر ما إذا كان بإمكانها المضي قدماً بأمان. يجب أن تتخذ هذه السيارة قرارات فورية تقريباً، وهو ما يتطلب التقاط البيانات المرئية ومعالجتها في الوقت الفعلي. 

إذا كانت السيارة ذاتية القيادة مزوّدة بكاميرات يمكنها التقاط لقطات بمعدل إطارات في الثانية أعلى، فإنها تتلقى تدفقاً أكثر استمرارية وتفصيلاً للصور. تمكّن هذه المدخلات البصرية المحسّنة السيارة من اكتشاف العوائق والمشاة والمركبات الأخرى بسرعة. كما يتيح للسيارة إمكانية الاستجابة السريعة لأي تغييرات في بيئتها.

إذا كانت الكاميرات تعالج الصور بمعدل FPS أقل، فقد تتلقى السيارة عرضاً متقطعاً وأقل تفصيلاً. قد يؤدي ذلك إلى تأخير وقت استجابتها، مما يزيد من خطر فقدان المعلومات الهامة وربما يعرض السلامة للخطر.

العلاقة بين FPS والتحليلات الرياضية

يُعد التقاط كل حركة بدقة بالغة أمرًا بالغ الأهمية في الرياضة، حيث يمكن أن تُحدث القرارات في جزء من الثانية الفرق بين الفوز والخسارة. تسمح لنا التكنولوجيا التي تدعم إطاراً أعلى في الثانية بتسجيل كل التفاصيل الدقيقة في الحركة، ويمكن للمدربين والمحللين والرياضيين مراجعة اللعب بالحركة البطيئة دون أن يفوتهم شيء. كما أنها تساعد الحكام على اتخاذ قرارات أكثر دقة في رياضات مثل التنس وكرة القدم والكريكت من خلال توفير رؤية واضحة للحركة إطاراً بإطار.

على سبيل المثال، حللت دراسة مثيرة للاهتمام عن الكرة الطائرة كيف أن استخدام إطار في الثانية أعلى يحسن تقييم الأداء. أدت زيادة معدل الإطارات في الثانية من 30 إلى 240 إلى تحسين وضوح الحركة وتتبع الأجسام بشكل ملحوظ. كما تحسنت دقة تحليل الارتفاع أيضًا، مما ساعد المدربين على فهم وضع اليد ونقاط التلامس مع الكرة وميكانيكا القفز بشكل أكثر دقة. وعلاوة على ذلك، وجدت الدراسة أن زيادة معدل الإطارات في الثانية يقلل من ضبابية الحركة، مما يجعل تحليل الإرسال وردود الفعل الدفاعية أسهل. 

الشكل 4. مقارنة بين FPS المنخفض والمرتفع فيما يتعلق بوضوح الحركة.

عندما يكون استخدام FPS منخفضًا فعالاً في تحليلات الفيديو

لا تتطلب جميع تطبيقات رؤية الكمبيوتر تسجيل لقطات بمعدل FPS أعلى. في العديد من الحالات، يكون معدل الإطارات في الثانية الأقل كافياً لتحقيق نتائج دقيقة، وذلك حسب المهمة. فيما يلي بعض المجالات الرئيسية التي يُفضل فيها انخفاض معدل الإطارات في الثانية:

  • المعالجة والتحليل اللاحق دون اتصال بالإنترنت: بالنسبة لتطبيقات مثل مراقبة حركة المرور وتحليل الحشود، ليس من الضروري دائمًا التقاط كل إطار بمعدل FPS عالٍ في الثانية. لا يزال بإمكان الإطارات ذات الإطارات المنخفضة في الثانية توفير بيانات كافية لتحليل أنماط الحركة، مثل تدفق المركبات وكثافة المشاة واتجاهات الازدحام. من خلال تقليل الإطارات الزائدة، يقلل هذا النهج من متطلبات التخزين والحمل الحسابي مع الحفاظ على دقة التحليلات.
  • المراقبة البيئية بفاصل زمني: لتتبع التغييرات البطيئة مثل نمو النباتات أو تقدم البناء أو حركة الأنهار الجليدية، يكفي التقاط إطار كل بضع دقائق أو مرة واحدة في اليوم، مما يوثق التحولات طويلة الأجل بشكل فعال مع توفير التخزين.
  • البيئات محدودة الموارد: في مراقبة الحياة البرية والأمن عن بُعد، يساعد انخفاض معدل الإطارات في الثانية في الحفاظ على عمر البطارية والتخزين. يمكن للكاميرات التي تعمل بمعدل 5 إلى 10 إطارات في الثانية التقاط الأحداث الأساسية لفترات طويلة، مما يجعلها مثالية للتركيبات خارج الشبكة.

اختيار FPS المناسب لتطبيقات التعلُّم العميق

يتطلب اختيار FPS المثالي تحقيق التوازن بين الأداء وقيود النظام. فيما يلي بعض الاعتبارات التي يجب وضعها في الاعتبار عند تحسين FPS لتطبيقات التعلم العميق:

  • تحقيق التوازن بين الأداء والموارد: يؤدي ارتفاع معدل الإطارات في الثانية إلى تحسين الاستجابة ولكنه يزيد أيضًا من الطاقة ومتطلبات المعالجة. يمكن أن يساعد ضبط FPS بشكل ديناميكي، باستخدام استيفاء الإطارات وتحسين الأجهزة في الحفاظ على سلاسة الأداء دون تحميل النظام فوق طاقته.
  • الاحتياجات الخاصة بالتطبيق: التطبيقات المختلفة لها متطلبات FPS مختلفة. فالأجهزة التي تعمل بالبطارية يجب أن تستخدم FPS أقل للحفاظ على الطاقة، بينما تحتاج أنظمة الوقت الحقيقي مثل الطائرات بدون طيار والمركبات ذاتية القيادة إلى FPS أعلى من أجل استجابات سريعة ودقيقة.
  • الاختبار والتحسين: يجب اختبار إعدادات FPS بشكل مثالي في ظروف إضاءة وحركة مختلفة. يساعد تقييم زمن الاستجابة ومقارنة مستويات FPS جنبًا إلى جنب في تحديد أفضل توازن بين الاستجابة والجودة البصرية وكفاءة الموارد.

ابتكارات مستقبلية وتحسينات FPS لنماذج الذكاء الاصطناعي

تؤدي التطورات في مجال الذكاء الاصطناعي وتحسين الأجهزة إلى زيادة إمكانية تحقيق معدلات إطارات أعلى، حتى في البيئات محدودة الموارد. على سبيل المثال، يمكن أن تستفيد صناعات مثل السينما والرياضة والروبوتات من إدارة معدل الإطارات بشكل أكثر ذكاءً، حيث تقوم الأنظمة بضبط معدل الإطارات في الثانية بشكل ديناميكي بناءً على تعقيد الحركة وقوة المعالجة. كما يعمل استيفاء الإطارات المستند إلى الذكاء الاصطناعي على تحسين سلاسة الفيديو من خلال توليد إطارات إضافية في الوقت الفعلي.

في هذه الأثناء، تم تحقيق إنجاز جديد من NVIDIA يدفع بأداء FPS إلى أبعد من ذلك. يقدم DLSS 4 (التعلُّم العميق الفائق لأخذ العينات) توليد إطارات متعددة، والذي يستخدم الذكاء الاصطناعي للتنبؤ وإنشاء إطارات إضافية. وهذا يعزز معدلات الإطارات بما يصل إلى 8 أضعاف مع تقليل عبء العمل على النظام.

من خلال السماح للذكاء الاصطناعي بالتعامل مع جزء من العرض، يجعل DLSS 4 المرئيات أكثر سلاسة دون وضع ضغط إضافي على الأجهزة، مما يحسن الأداء والكفاءة.

الوجبات الرئيسية

FPS هو أكثر من مجرد مقياس للمرئيات السلسة؛ فهو يقود عملية اتخاذ القرار في الوقت الحقيقي في مجال الذكاء الاصطناعي والرؤية الحاسوبية. يلتقط كل إطار في الفيديو بيانات مهمة، مما يمكّن الآلات من تتبع الأجسام وتحليل الحركة والاستجابة للبيئات الديناميكية. سواء كانت سيارات ذاتية القيادة تتجنب العقبات أو أنظمة المراقبة التي تكتشف التهديدات على الفور، فإن الدقة والكفاءة في إطار الثانية الصحيحة تضمن الدقة والكفاءة.

لا يقتصر مستقبل الرؤية من بُعد على زيادة معدلات الإطارات فحسب، بل يتعلق أيضاً بتحسينها بذكاء. سيجعل هذا التطور أنظمة الرؤية الحاسوبية أسرع وأكثر ابتكارًا وكفاءة في استخدام الموارد في مختلف الصناعات.

هل تريد معرفة المزيد عن الذكاء الاصطناعي؟ استكشف مستودع GitHub الخاص بنا وانضم إلى مجتمعنا. هل أنت مستعد لبدء مشاريع الرؤية الحاسوبية الخاصة بك؟ اطلع على خيارات الترخيص لدينا. تعرّف على كيفية تحسين الرؤية الحاسوبية في مجال الرعاية الصحية واستكشف تأثير الذكاء الاصطناعي في التصنيع من خلال زيارة صفحات الحلول الخاصة بنا!

شعار الفيسبوكشعار تويترشعار LinkedInرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي