شيك أخضر
تم نسخ الرابط إلى الحافظة

تستخدم SharkEye Ultralytics YOLOv8 لاكتشاف الأجسام

تعرّف على كيفية استفادة SharkEye، التي تم تقديمها في معرض YOLO Vision 2024، من منصة Ultralytics YOLOv8 لاكتشاف الأجسام في الوقت الفعلي وسلامة الشاطئ.

لطالما كانت مراقبة الحيوانات في بيئاتها الطبيعية، سواء كانت ماشية ترعى في مزرعة أو أسماك القرش التي تتحرك بالقرب من الشاطئ، مهمة لسلامتها ورفاهيتها. ومع ذلك، فإن مراقبتها يدوياً ليس بالأمر السهل. فغالبًا ما يتطلب الأمر ساعات من الصبر والتركيز الدقيق، حيث يتعين على المراقبين أن يراقبوا عن كثب أي تغييرات في السلوك أو الحركة. وحتى في هذه الحالة، من السهل أن تفوتك علامات خفية ولكنها مهمة.

وبفضل تدخّل الذكاء الاصطناعي (AI)، أصبحت هذه العملية أسرع وأكثر ذكاءً وفعالية بكثير، مما يقلل من الضغط على المراقبين البشريين مع تحسين الدقة. وعلى وجه الخصوص، يمكن استخدام الرؤية الحاسوبية لتتبع الحيوانات ورصد الأخطار واتخاذ القرارات في الوقت الحقيقي. يمكن الآن إنجاز المهام التي كانت تستغرق ساعات في السابق في دقائق، مما يفتح طرقًا جديدة لفهم سلوك الحيوانات.

في فعالية YOLO Vision 2024 (YV24)، وهي فعالية سنوية مختلطة تستضيفها Ultralytics اجتمع الخبراء والمبتكرون لاستكشاف كيفية معالجة الذكاء الاصطناعي للتحديات اليومية. وشملت بعض الموضوعات التي تم عرضها التطورات في مجال الكشف عن الأجسام في الوقت الحقيقي ومراقبة الحيوانات، مما يوضح كيف يعزز الذكاء الاصطناعي السلامة والكفاءة في مختلف المجالات.

كان من أبرز ما تضمنته الفعالية حديث جيم جريفين، مؤسس مجموعة AI Master Group، حيث أوضح كيف تجعل Vision AI الشواطئ أكثر أمانًا من خلال اكتشاف أسماك القرش قبل أن تقترب كثيرًا من الشاطئ. وشرح كيف استخدموا Ultralytics YOLOv8وهو نموذج متطور للرؤية الحاسوبية لتحديد أسماك القرش بدقة في الوقت الحقيقي، حتى في الظروف الصعبة مثل الأمواج المتلاطمة والوهج والعوائق تحت الماء.

في هذه المقالة، سنلقي نظرة فاحصة على مشروع SharkEye ونشارك رؤى مثيرة للاهتمام من حديث جيم.

التعرف على SharkEye: تطبيق للرؤية الحاسوبية

بدأ جيم حديثه بالتعريف بشاطئ بادارو، وهو وجهة معروفة لركوب الأمواج في كاليفورنيا حيث يتشارك راكبو الأمواج وأسماك القرش في كثير من الأحيان نفس المياه. وسلط الضوء على التحدي الحقيقي المتمثل في اكتشاف أسماك القرش، وقال: "بالطبع، من السهل اكتشاف سمكة قرش إذا عضتك، لذا ما أردنا القيام به هو التعرف على أسماك القرش مسبقاً".

الشكل 1. جيم على خشبة المسرح في YOLO Vision 2024.

تم إنشاء SharkEye لمعالجة هذه المشكلة، بدعم من جامعة كاليفورنيا في سانتا باربرا. وصف جيم كيف تم استخدام طائرات بدون طيار مزودة بكاميرات عالية الدقة تعمل بالذكاء الاصطناعي للتحليق على ارتفاع 200 قدم فوق الماء، ومسح المحيط في الوقت الفعلي.

إذا تم اكتشاف سمكة قرش، تصل تنبيهات الرسائل النصية القصيرة إلى حوالي 80 شخصًا، بما في ذلك رجال الإنقاذ وأصحاب متاجر ركوب الأمواج وأي شخص قام بالتسجيل للحصول على التحديثات. أشار جيم إلى أن هذه الإشعارات الفورية تسمح بالاستجابة السريعة، مما يجعل مرتادي الشاطئ أكثر أماناً عند وجود سمكة قرش بالقرب من الشاطئ.

ذكر جيم أيضًا أن SharkEye يتميز بلوحة تحكم مباشرة حيث يمكن للمستخدمين رؤية إحصائيات اكتشاف أسماك القرش. على سبيل المثال، على مدار 12 أسبوعًا، حدد النظام سمكتي قرش كبيرتين و15 سمكة أصغر حجمًا، بمتوسط يزيد قليلاً عن سمكة قرش واحدة في الأسبوع.

ثم قدم بعد ذلك نيل ناثان، العالم الذي قاد الجهود وراء مشروع SharkEye. وعلى الرغم من خلفيته في الدراسات البيئية وليس في علوم الكمبيوتر، إلا أن ناثان قاد المشروع بنجاح. أكد جيم كيف أن أدوات الذكاء الاصطناعي الحديثة، مثل تلك المستخدمة في SharkEye، مصممة لتكون في متناول الجميع، مما يتيح للأفراد من خلفيات غير تقنية تطوير حلول مؤثرة.

استخدام Ultralytics YOLOv8 للكشف عن أسماك القرش

وللاستفاضة في التفاصيل، شرح جيم بالتفصيل ما يوجد تحت غطاء محرك SharkEye وكيف أن حل اكتشاف أسماك القرش لم يتضمن فقط مهمة بسيطة لاكتشاف الأجسام. كان عليه أن يتعامل مع الظروف الديناميكية وغير المتوقعة مثل الأعشاب البحرية العائمة التي يمكن بسهولة الخلط بينها وبين أسماك القرش. على عكس اكتشاف جسم ثابت، يتطلب تحديد سمكة القرش الدقة والقدرة على التكيف، مما يجعل YOLOv8 خياراً مثالياً.

ومن المزايا الأخرى لـ YOLOv8 أنه يمكن نشره على طائرة بدون طيار دون الاعتماد على الخوادم السحابية. شرح جيم كيف أتاح هذا النهج لـ SharkEye إرسال تنبيهات فورية - وهو جزء أساسي لضمان الاستجابة في الوقت المناسب في ظروف المحيطات التي لا يمكن التنبؤ بها.

اكتشاف الكائن بستة أسطر فقط من التعليمات البرمجية

بعد تسليط الضوء على كيفية عمل SharkEye والجهد التعاوني وراءه، عرض جيم عرضًا توضيحيًا مباشرًا.

بدأ جيم جريفين عرضه التوضيحي المباشر بإطلاع الجمهور على مثال مألوف - مقتطف كود "مرحبًا بالعالم" لنماذجUltralytics YOLO . من خلال ستة أسطر فقط من كود Python عرض كيف يمكن لنموذج Ultralytics YOLOv8 المدرب مسبقًا أن يكتشف الحافلة في الصورة دون عناء. 

الشكل 2. عرض توضيحي من جيم في YOLO Vision 2024.

استخدم العرض التوضيحي الخاص به نموذج YOLOv8 Nano، وهو إصدار خفيف الوزن للأجهزة منخفضة الطاقة مثل الطائرات بدون طيار. تم استخدام نفس النموذج في SharkEye للكشف عن أسماك القرش في الوقت الحقيقي. 

لتوفير المزيد من السياق، ذكر جيم أن النموذج في العرض التوضيحي تم تدريبه على COCO128، وهي مجموعة فرعية أصغر من مجموعة بيانات COCO المستخدمة على نطاق واسع . تحتوي مجموعة بيانات COCO على أكثر من 20,000 صورة عبر 80 فئة مختلفة من الكائنات. في حين أن COCO128 يعمل بشكل جيد للعروض التوضيحية السريعة، فقد أشار إلى أن SharkEye بحاجة إلى شيء أكثر قوة - مجموعة بيانات خاصة بالتطبيقات للكشف عن أسماك القرش يمكنها التعامل مع تعقيدات سيناريوهات العالم الحقيقي.

التدريب المخصص YOLOv8 لـ SharkEye 

وفقًا لجيم، لم يكن الجزء الأصعب في مشروع SharkEye هو تدريب نموذج الذكاء الاصطناعي بل جمع البيانات الصحيحة. وعلّق قائلاً: "لم يكن العمل الرئيسي لهذا المشروع هو الذكاء الاصطناعي. كان العمل الرئيسي في هذا المشروع هو تحليق تلك الطائرات بدون طيار لمدة خمس سنوات، وانتقاء الصور من مقاطع الفيديو تلك، ووضع علامات مناسبة عليها."

ووصف كيف جمع الفريق 15,000 صورة في شاطئ بادارو. كان لا بد من وضع علامات يدوية على كل صورة للتمييز بين أسماك القرش والأعشاب البحرية والأشياء الأخرى في الماء. وعلى الرغم من أن العملية كانت بطيئة ومتطلبة، إلا أنها أرست الأساس لكل ما تلاها.

الشكل 3. استخدام طائرات بدون طيار لالتقاط صور لأسماك القرش للكشف عن الأجسام في الوقت الحقيقي.

وبمجرد أن أصبحت مجموعة البيانات جاهزة، تم تدريبYOLOV8 Ultralytics YOLOV8 عليها بشكل مخصص. قال جيم: "لم يكن التدريب الفعلي هو الجزء الصعب، فقد استغرق الأمر 20 ساعة فقط على وحدات معالجة الرسومات T4 [وحدات معالجة الرسومات]." وأضاف أيضًا أنه كان من الممكن تقليل الوقت إلى أقل من خمس ساعات باستخدام أجهزة أكثر قوة، مثل وحدات معالجة الرسومات A100.

تقييم SharkEye: الدقة على الاستدعاء

بعد ذلك، ناقش جيم كيفية تقييم أداء SharkEye. وأوضح أن المقياس الرئيسي كان الدقة - مدى دقة النظام في تحديد أسماك القرش الفعلية. ومع تحقيق SharkEye دقة مذهلة بنسبة 92%، أثبت النموذج فعالية عالية في تحديد أسماك القرش بدقة وسط بيئة المحيط المعقدة.

عند التعمق في أهمية الدقة، أوضح جيم سبب أهمية الدقة أكثر من الاستدعاء في هذه الحالة. "في معظم الأحيان، يهتم الناس بالتذكر، خاصةً في مجالات مثل الرعاية الصحية حيث يمكن أن يكون فقدان حالة إيجابية أمرًا بالغ الأهمية. ولكن في هذه الحالة، لم نكن نعرف عدد أسماك القرش الموجودة هناك، لذلك كان ما يهمنا هو الدقة". ضمنت SharkEye تقليل الإنذارات الكاذبة إلى الحد الأدنى من خلال التركيز على الدقة، مما يسهل على رجال الإنقاذ وغيرهم من المستجيبين اتخاذ الإجراءات بسرعة.

الشكل 4. جيم يعرض SharkEye في معرض YOLO Vision 2024.

واختتم حديثه بمقارنة أداء الذكاء الاصطناعي بالأداء البشري، مشيراً إلى أن دقة SharkEye التي تبلغ 92% تفوق بكثير دقة الخبراء البشريين التي تبلغ 60%. وأكد على هذه الفجوة قائلاً: "هذا لأننا بشر. بغض النظر عن مدى خبرتي أو خبرتك، إذا كان علينا الجلوس أمام الشاشة طوال اليوم بحثاً عن أسماك القرش، فسنسمح لعقولنا في النهاية أن تتشتت في أذهاننا." على عكس البشر، فإن نماذج الذكاء الاصطناعي لا تتعب أو تتشتت انتباهها، مما يجعلها حلاً موثوقاً للمهام التي تتطلب مراقبة مستمرة.

Ultralytics YOLO11: أحدث إصدار من YOLO

هناك اقتباس مثير للاهتمام من حديث جيم جريفين، "ستة أسطر من التعليمات البرمجية يمكن أن تنقذ حياتك يوماً ما"، وهو اقتباس مثير للاهتمام من حديث جيم جريفين، وهو ما يجسد تماماً كيف أصبح الذكاء الاصطناعي متقدماً وسهل المنال في الوقت نفسه. وقد تم إنشاء نماذج Ultralytics YOLO مع وضع ذلك في الاعتبار، مما يجعل تقنية الرؤية الحاسوبية المتطورة في متناول المطورين والشركات من جميع الأحجام. Ultralytics YOLO11 يعتمد على ذلك من خلال استنتاجات أسرع ودقة أعلى. 

إليك نظرة سريعة على ما يميز YOLO11 عن غيره:

  • بنية معاد تصميمها: تتيح بنية العمود الفقري والرقبة المحسّنة استخلاص ميزات أفضل ودقة محسّنة.
  • سهولة الاستخدام: يمكن الوصول إليه من خلال ترميز Python أو أدوات بدون ترميز مثل Ultralytics HUB.
  • المرونة عبر المهام: يدعم YOLO11 مهام الرؤية الحاسوبية مثل اكتشاف الأجسام، وتجزئة النماذج، وتصنيف الصور، والتتبع، وتقدير الوضع، والمربعات المحدودة الموجهة (OBB).
  • دقة محسّنة: يحقق YOLO11 متوسط دقة أعلى بنسبة 22% مقارنةً بـ YOLOv8m على مجموعة بيانات COCO، مما يوفر اكتشافات أكثر دقة.

هذه الميزات تجعل YOLO11 مناسبًا تمامًا لتتبع سلوك الحيوانات في البيئات الديناميكية، سواء في المزرعة أو في البرية.

الوجبات الرئيسية

تعمل التطورات في مجال الذكاء الاصطناعي البصري على تسهيل مواجهة تحديات العالم الحقيقي من خلال توفير أدوات عملية لمختلف المجالات. على سبيل المثال، يمكن استخدام نماذج الرؤية الحاسوبية مثل YOLO11 لرصد الحيوانات وتتبعها في الوقت الحقيقي، حتى في الظروف الصعبة. 

أوضحت الكلمة الرئيسية التي ألقاها جيم جريفين في YV24 كيف يمكن استخدام YOLOv8 لحل المشاكل المعقدة بأقل قدر من الترميز. وقد أظهر مشروع SharkEye، الذي يجمع بين الطائرات بدون طيار والذكاء الاصطناعي للكشف عن أسماك القرش في الوقت الحقيقي، كيف يمكن للتكنولوجيا تحسين سلامة الشاطئ. 

لقد كانت دراسة حالة رائعة عن كيفية تمكين الذكاء الاصطناعي الذي يسهل الوصول إليه من تمكين الأشخاص من خلفيات مختلفة من ابتكار حلول فعالة. ومع استمرار تطور الذكاء الاصطناعي، فإنه يُحدث تحولاً في الصناعات ويجعل من الممكن للأفراد تسخير إمكاناته لجعل العالم مكاناً أكثر أماناً وذكاءً وكفاءة.

كن جزءاً من مجتمعنا واستكشف مستودع GitHub الخاص بنا للتعمق أكثر في الذكاء الاصطناعي. من الرؤية الحاسوبية في مجال الزراعة إلى الذكاء الاصطناعي في السيارات ذاتية القيادة، تعرّف على كيفية قيادة هذه التقنيات للابتكار. اطلع على خيارات الترخيص لدينا لبدء مشاريع الذكاء الاصطناعي اليوم!

شعار الفيسبوكشعار تويترشعار LinkedInرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي