الشيك الأخضر
تم نسخ الرابط إلى الحافظة

استكشاف كيفية عمل تطبيقات الرؤية الحاسوبية

تعمّق معنا في تطبيقات الرؤية الحاسوبية. سنتعرف أيضاً على مهام الرؤية الحاسوبية المختلفة مثل اكتشاف الأجسام وتجزئتها.

عندما استكشفنا تاريخ نماذج الرؤية الحاسوبية، رأينا كيف تطورت الرؤية الحاسوبية والمسار الذي أدى إلى نماذج الرؤية المتقدمة التي لدينا اليوم. النماذج الحديثة مثل Ultralytics YOLOv8 تدعم العديد من مهام الرؤية الحاسوبية وتُستخدم في العديد من التطبيقات المثيرة. 

في هذه المقالة، سنلقي نظرة على أساسيات الرؤية الحاسوبية ونماذج الرؤية. سنغطي كيفية عملها وتطبيقاتها المتنوعة في مختلف الصناعات. إن ابتكارات الرؤية الحاسوبية موجودة في كل مكان، وتشكل عالمنا بصمت. دعونا نكتشفها واحدة تلو الأخرى! 

ما هي الرؤية الحاسوبية؟

الذكاء الاصطناعي هو مصطلح شامل يشمل العديد من التقنيات التي تهدف إلى محاكاة جزء من الذكاء البشري. أحد هذه المجالات الفرعية للذكاء الاصطناعي هو الرؤية الحاسوبية. تركز الرؤية الحاسوبية على تزويد الآلات بعيون يمكنها رؤية ومراقبة وفهم ما يحيط بها. 

تمامًا مثل الرؤية البشرية، تهدف حلول الرؤية الحاسوبية إلى تمييز الأجسام وحساب المسافات واكتشاف الحركات. ومع ذلك، على عكس البشر، الذين لديهم خبرات طويلة تساعدهم على الرؤية والفهم، تعتمد أجهزة الكمبيوتر على كميات هائلة من البيانات والكاميرات عالية الوضوح والخوارزميات المعقدة. 

الشكل 1. مقارنة الرؤية البشرية والرؤية الحاسوبية.

يمكن لأنظمة الرؤية الحاسوبية معالجة وتحليل البيانات المرئية مثل الصور ومقاطع الفيديو بسرعات ودقة مذهلة. إن القدرة على التحليل السريع والدقيق لكميات هائلة من المعلومات المرئية تجعل من الرؤية الحاسوبية أداة قوية في مختلف الصناعات، بدءاً من التصنيع إلى الرعاية الصحية.

نماذج الرؤية تدعم مهام الرؤية الحاسوبية المختلفة

نماذج الرؤية الحاسوبية هي جوهر أي تطبيق للرؤية الحاسوبية. وهي في الأساس خوارزميات حسابية مدعومة بتقنيات التعلم العميق المصممة لمنح الآلات القدرة على تفسير وفهم المعلومات المرئية. تعمل نماذج الرؤية على تمكين مهام الرؤية الحاسوبية المهمة التي تتراوح بين تصنيف الصور واكتشاف الأجسام. دعونا نلقي نظرة فاحصة على بعض هذه المهام وحالات استخدامها بمزيد من التفصيل. 

تصنيف الصور

يتضمن تصنيف الصور تصنيف الصور وتصنيفها إلى فئات أو فئات محددة مسبقًا. نموذج رؤية مثل YOLOv8 على مجموعات بيانات كبيرة من الصور المصنفة. أثناء التدريب، يتعلم النموذج التعرف على الأنماط والسمات المرتبطة بكل فئة. وبمجرد التدريب، يمكنه التنبؤ بفئة الصور الجديدة غير المرئية من خلال تحليل سماتها ومقارنتها بالأنماط المكتسبة. 

الشكل 2. مثال على تصنيف الصور.

هناك أنواع مختلفة من تصنيف الصور. على سبيل المثال، عند التعامل مع الصور الطبية، يمكنك استخدام التصنيف الثنائي لتقسيم الصور إلى مجموعتين، مثل الصور السليمة أو المريضة. نوع آخر هو التصنيف متعدد الطبقات. يمكن أن يساعد في تصنيف الصور إلى عدة مجموعات، مثل تصنيف الحيوانات المختلفة في مزرعة مثل الخنازير والماعز والأبقار. أو لنفترض أنك تريد تصنيف الحيوانات إلى مجموعات ومجموعات فرعية، مثل تصنيف الحيوانات إلى ثدييات وطيور ثم إلى أنواع أخرى مثل الأسود والنمور والنسور والعصافير، سيكون التصنيف الهرمي هو الخيار الأفضل.

اكتشاف الكائن

اكتشاف الأجسام هو عملية تحديد الأجسام وتحديد مواقعها في الصور وإطارات الفيديو باستخدام الرؤية الحاسوبية. وهي تتألف من مهمتين: تحديد موقع الأجسام، والتي ترسم مربعات محددة حول الأجسام، وتصنيف الأجسام، والتي تحدد فئة كل جسم. استناداً إلى شروح المربعات المحيطة، يمكن لنموذج الرؤية أن يتعلم التعرف على الأنماط والسمات الخاصة بكل فئة من فئات الكائنات والتنبؤ بوجود هذه الكائنات وموقعها في الصور الجديدة غير المرئية. 

الشكل 3. YOLOv8 اكتشاف الأجسام المستخدمة للكشف عن اللاعبين في ملعب كرة قدم.

للكشف عن الأجسام العديد من حالات الاستخدام في مختلف الصناعات، من الرياضة إلى علم الأحياء البحرية. فعلى سبيل المثال، في مجال البيع بالتجزئة، تستخدم تقنية Just Walk Out من أمازون تقنية Just Walk Out الخاصة بشركة أمازون اكتشاف الأشياء لأتمتة عملية الدفع من خلال تحديد العناصر التي يلتقطها العملاء. يتيح مزيج من الرؤية الحاسوبية وبيانات المستشعرات للعملاء أخذ أغراضهم والمغادرة دون الانتظار في الطابور. 

إليك نظرة فاحصة على كيفية عملها:

  • تلتقط الكاميرات المثبتة على السقف حركة العملاء في جميع أنحاء المتجر، وتتم معالجة لقطات الفيديو هذه في الوقت الفعلي بواسطة نماذج الرؤية.
  • يُستخدم اكتشاف الكائنات لاكتشاف المنتج المحدد الذي يلتقطه العميل ويضعه في سلة التسوق الخاصة به لتحديث عربة التسوق الافتراضية وفقًا لذلك.
  • تعمل مستشعرات الوزن على الأرفف على تحسين الدقة من خلال الكشف عن إزالة العناصر أو استبدالها.
  • عند خروج العميل من المتجر، يمكن استخدام تقنية الكشف عن الأجسام وتقنية التعرف على الوجه لتأكيد مغادرة العميل، ويمكن استخدام تفاصيل الدفع الخاصة به، مثل بطاقة الائتمان، لشحنه تلقائياً.

التقسيم الدلالي وتقسيم المثيل

إن التجزئة الدلالية وتجزئة النماذج هي مهام الرؤية الحاسوبية التي تساعد على تقسيم الصور إلى مقاطع ذات معنى. يصنف التجزئة الدلالية وحدات البكسل بناءً على معناها الدلالي ويعامل جميع الكائنات داخل فئة ما ككيان واحد له نفس التسمية. وهو مناسب لتصنيف الأجسام غير القابلة للعد مثل "السماء" أو "المحيط" أو مجموعات مثل "أوراق الشجر" أو "العشب".

من ناحية أخرى، يمكن لتجزئة المثيل التمييز بين المثيلات المختلفة لنفس الفئة من خلال تعيين تسمية فريدة لكل كائن تم اكتشافه. يمكنك استخدام تجزئة المثيل لتجزئة الكائنات القابلة للعد حيث يكون عدد الكائنات واستقلاليتها مهمين. وهو يسمح بتحديد وتمييز أكثر دقة.

الشكل 4. مثال على التجزئة الدلالية وتجزئة المثيل.

يمكننا أن نفهم التباين بين التجزئة الدلالية وتجزئة المثيل بشكل أوضح من خلال مثال يتعلق بالسيارات ذاتية القيادة. التجزئة الدلالية رائعة للمهام التي تتطلب فهم محتويات المشهد ويمكن استخدامها في المركبات ذاتية القيادة لتصنيف الميزات على الطريق، مثل معابر المشاة وإشارات المرور. وفي الوقت نفسه، يمكن استخدام تجزئة المثيل في المركبات ذاتية القيادة للتمييز بين المشاة والمركبات والعوائق الفردية. 

تقدير الوضعية

تقدير الوضعية هو مهمة رؤية حاسوبية تركز على اكتشاف وتتبع النقاط الرئيسية لوضعيات الأجسام في الصور أو مقاطع الفيديو. وهي تُستخدم بشكل شائع لتقدير الوضعية البشرية، حيث تشمل النقاط الرئيسية مناطق مثل الكتفين والركبتين. يساعدنا تقدير وضعية الإنسان على فهم وتمييز الأفعال والحركات التي تُعدّ ضرورية لتطبيقات مختلفة.

الشكل 5. مثال على تقدير الوضعية باستخدام YOLOv8.

يمكن استخدام تقدير الوضعية في الرياضة لتحليل كيفية تحرك الرياضيين. يستخدم دوري كرة السلة الأمريكي للمحترفين تقدير الوضعية لدراسة حركات اللاعبين وأوضاعهم أثناء المباراة. من خلال تتبع النقاط الرئيسية مثل الكتفين والمرفقين والركبتين والكاحلين، يوفر تقدير الوضعية رؤى مفصلة عن حركات اللاعبين. تساعد هذه الرؤى المدربين على تطوير استراتيجيات أفضل، وتحسين برامج التدريب، وإجراء تعديلات في الوقت الفعلي أثناء المباريات. كما يمكن أن تساعد البيانات في مراقبة إجهاد اللاعبين ومخاطر الإصابة لتحسين صحة اللاعبين وأدائهم بشكل عام.

الكشف عن كائنات المربعات المحدودة الموجهة

يستخدم الكشف عن الكائنات في المربعات المحدودة الموجهة (OBB) مستطيلات مستديرة لتحديد الكائنات في الصورة وتحديد موقعها بدقة. على عكس المربعات المحددة القياسية التي تتماشى مع محاور الصورة، يتم تدوير المستطيلات المحددة OBBs لتتناسب مع اتجاه الكائن. هذا يجعلها مفيدة بشكل خاص للأجسام التي ليست أفقية أو رأسية تمامًا. إنها رائعة في تحديد وعزل الأجسام الدوارة بدقة لمنع التداخل في البيئات المزدحمة.

الشكل 6. مثال لاكتشاف الصندوق المحدود الموجه على صورة جوية للقوارب باستخدام YOLOV8.

في المراقبة البحرية، يعد تحديد وتتبع السفن أمرًا أساسيًا للأمن وإدارة الموارد. يمكن استخدام الكشف عن ثنائي الفينيل متعدد البروم ثنائي الفينيل لتحديد موقع السفن بدقة، حتى عندما تكون مكتظة أو موجهة بزوايا مختلفة. كما يساعد في مراقبة ممرات الشحن وإدارة حركة المرور البحرية وتحسين عمليات الموانئ. كما يمكن أن يساعد أيضاً في الاستجابة للكوارث من خلال تحديد وتقييم الأضرار التي تلحق بالسفن والبنية التحتية بسرعة بعد أحداث مثل الأعاصير أو الانسكابات النفطية.

تتبع الكائنات

لقد ناقشنا حتى الآن مهام الرؤية الحاسوبية التي تتعامل مع الصور. تتبع الأجسام هو مهمة رؤية حاسوبية يمكنها تتبع جسم ما خلال إطارات الفيديو. تبدأ بتحديد الجسم في الإطار الأول باستخدام خوارزميات الكشف ثم تتبع موقعه باستمرار أثناء تحركه عبر الفيديو. يتضمن تتبع الأجسام تقنيات مثل اكتشاف الأجسام واستخراج السمات والتنبؤ بالحركة للحفاظ على دقة التتبع.

الشكل 7. استخدام YOLOv8 لتتبع الأسماك.

يمكن استخدام نماذج الرؤية مثل YOLOv8 لتتبع الأسماك في علم الأحياء البحرية. باستخدام الكاميرات تحت الماء، يمكن للباحثين مراقبة تحركات وسلوكيات الأسماك في موائلها الطبيعية. تبدأ العملية باكتشاف الأسماك الفردية في الإطارات الأولى ثم تتبع مواقعها طوال الفيديو. يساعد تتبع الأسماك العلماء على فهم أنماط الهجرة والسلوكيات الاجتماعية والتفاعلات مع البيئة. كما يدعم ممارسات الصيد المستدامة من خلال توفير رؤى حول توزيع الأسماك ووفرة الأسماك.

نظرة أخيرة على الرؤية الحاسوبية

تعمل الرؤية الحاسوبية بشكل فعال على تغيير طريقة استخدامنا للتكنولوجيا وتفاعلنا مع العالم. فمن خلال استخدام نماذج التعلّم العميق والخوارزميات المعقدة لفهم الصور ومقاطع الفيديو، تساعد الرؤية الحاسوبية الصناعات على تبسيط العديد من العمليات. تتيح مهام الرؤية الحاسوبية مثل اكتشاف الأجسام وتتبع الأجسام إمكانية ابتكار حلول لم تكن متخيلة من قبل. ومع استمرار تحسّن تكنولوجيا الرؤية الحاسوبية، فإن المستقبل يحمل الكثير من التطبيقات المبتكرة! 

لنتعلم وننمو معاً! استكشف مستودع GitHub الخاص بنا للاطلاع على مساهماتنا في الذكاء الاصطناعي. اطلع على كيفية إعادة تعريف صناعات مثل السيارات ذاتية القيادة والزراعة باستخدام الذكاء الاصطناعي. 🚀

شعار الفيسبوكشعار تويترشعار لينكد إنرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي