قارن بين نماذج Ultralytics YOLOv8 و YOLOv9 و YOLOv10 و Ultralytics YOLO11 لفهم كيفية تطور هذه النماذج وتحسنها من عام 2023 إلى عام 2025.
من أتمتة المهام اليومية إلى المساعدة في اتخاذ قرارات مستنيرة في الوقت الفعلي، يعيد الذكاء الاصطناعي (AI) تشكيل مستقبل مختلف الصناعات. أحد مجالات الذكاء الاصطناعي الرائعة بشكل خاص هو الرؤية الحاسوبية، والمعروف باسم الذكاء الاصطناعي البصري. يركز هذا المجال على تمكين الآلات من تحليل البيانات المرئية وتفسيرها كما يفعل البشر.
وعلى وجه التحديد، تقود نماذج الرؤية الحاسوبية الابتكارات التي تعزز كلاً من السلامة والكفاءة. على سبيل المثال، تُستخدم هذه النماذج في السيارات ذاتية القيادة للكشف عن المشاة وفي الكاميرات الأمنية لمراقبة المباني على مدار الساعة.
بعض نماذج الرؤية الحاسوبية الأكثر شهرة هي نماذج YOLO (أنت تنظر مرة واحدة فقط)، والمعروفة بقدراتها على اكتشاف الأجسام في الوقت الحقيقي. بمرور الوقت، تحسنت نماذج YOLO حيث يقدم كل إصدار جديد أداءً أفضل ومرونة أكبر.
الإصدارات الأحدث مثل Ultralytics YOLO11 أن تتعامل مع مجموعة متنوعة من المهام، مثل تجزئة المثيلات، وتصنيف الصور، وتقدير الوضع، وتتبع الأجسام المتعددة، بدقة وسرعة ودقة أفضل من أي وقت مضى.
في هذه المقالة، سنقارن بين Ultralytics YOLOv8و YOLOv9، و YOLOv10، و Ultralytics YOLO11 لتكوين فكرة أفضل عن كيفية تطور هذه النماذج. سنحلل ميزاتها الرئيسية ونتائجها المعيارية واختلافات الأداء. لنبدأ!
يُعدّ YOLOv8 الذي أصدرته شركة Ultralytics في 10 يناير 2023، خطوة كبيرة إلى الأمام مقارنةً بنماذج YOLO السابقة. فهو مُحسَّن للكشف الدقيق في الوقت الحقيقي، ويجمع بين الأساليب التي تم اختبارها جيدًا والتحديثات المبتكرة لتحقيق نتائج أفضل.
بالإضافة إلى اكتشاف الأجسام، فهو يدعم أيضًا مهام الرؤية الحاسوبية التالية: تجزئة النماذج، وتقدير الوضع، واكتشاف الأجسام في المربعات المحدودة الموجهة (OBB)، وتصنيف الصور. ميزة أخرى مهمة في YOLOv8 هي أنه متوفر بخمسة نماذج مختلفة - النانو والصغير والمتوسط والكبير والعاشر - بحيث يمكنك اختيار التوازن الصحيح بين السرعة والدقة بناءً على احتياجاتك.
نظرًا لتعدد استخداماته وأدائه القوي، يمكن استخدام YOLOv8 في العديد من التطبيقات الواقعية، مثل أنظمة الأمن والمدن الذكية والرعاية الصحية والأتمتة الصناعية.
إليك نظرة فاحصة على بعض الميزات الرئيسية الأخرى في YOLOv8:
تم إصدار YOLOv9 في 21 فبراير 2024 من قبل تشين ياو وانغ وهونغ يوان مارك لياو من معهد علوم المعلومات، الأكاديمية الصينية في تايوان. وهو يدعم مهام مثل الكشف عن الكائنات وتجزئة المثيل.
يعتمد هذا النموذج على Ultralytics YOLOv5 ويقدم ابتكارين رئيسيين: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
يساعد PGI YOLOv9 على الاحتفاظ بالمعلومات المهمة أثناء معالجة البيانات من خلال طبقاته، مما يؤدي إلى نتائج أكثر دقة. وفي الوقت نفسه، تعمل GELAN على تحسين كيفية استخدام النموذج لطبقاته، مما يعزز الأداء والكفاءة الحسابية. بفضل هذه الترقيات، يمكن لـ YOLOv9 التعامل مع المهام في الوقت الفعلي على الأجهزة المتطورة وتطبيقات الأجهزة المحمولة، حيث تكون موارد الحوسبة محدودة في كثير من الأحيان.
إليك لمحة عن بعض الميزات الرئيسية الأخرى في YOLOv8:
تم تقديم YOLOv10 في 23 مايو 2024 من قبل باحثين من جامعة تسينغهوا ويركز على اكتشاف الأجسام في الوقت الحقيقي. وهو يعالج القيود التي كانت موجودة في إصدارات YOLO السابقة من خلال إزالة الحاجة إلى الكبح غير الأقصى (NMS)، وهي خطوة ما بعد المعالجة تُستخدم لإزالة عمليات الكشف المكررة، وتحسين تصميم النموذج العام. ينتج عن ذلك اكتشاف أسرع وأكثر كفاءة للأجسام، مع الاستمرار في تحقيق دقة فائقة.
جزء حيوي مما يجعل هذا الأمر ممكناً هو نهج التدريب المعروف باسم التعيينات المتسقة ثنائية التسمية. وهو يجمع بين استراتيجيتين: إحداهما تسمح بتعلم تنبؤات متعددة من نفس الكائن (واحد إلى متعدد) والأخرى تركز على اختيار أفضل تنبؤ واحد (واحد إلى واحد). نظرًا لأن كلتا الاستراتيجيتين تتبعان نفس قواعد المطابقة، يتعلم النموذج تجنب التكرارات من تلقاء نفسه، لذا فإن نظام التعيين الثنائي غير مطلوب.
كما تستخدم بنية YOLOv10 أيضًا العمود الفقري المحسّن لشبكة CSPNet لتعلم الميزات بشكل أكثر فعالية وعنق شبكة تجميع المسار (PAN) الذي يجمع بين المعلومات من طبقات مختلفة، مما يجعله أفضل في اكتشاف الأجسام الصغيرة والكبيرة على حد سواء. هذه التحسينات تجعل من الممكن استخدام YOLOv10 لتطبيقات العالم الحقيقي في التصنيع وتجارة التجزئة والقيادة الذاتية.
إليك بعض الميزات البارزة الأخرى في YOLOv10:
في 30 سبتمبر من هذا العام، أطلقت Ultralytics رسميًا في 30 سبتمبر جهاز YOLO11 - أحد أحدث الموديلات في سلسلة YOLO - في حدثها السنوي الهجين YOLO Vision 2024 (YV24).
أدخل هذا الإصدار تحسينات كبيرة على الإصدارات السابقة. YOLO11 أسرع وأكثر دقة وكفاءة عالية. وهو يدعم مجموعة كاملة من مهام الرؤية الحاسوبية التي يعرفها مستخدمو YOLOv8 بما في ذلك اكتشاف الأجسام، وتجزئة النماذج، وتصنيف الصور. كما أنه يحافظ على التوافق مع سير عمل YOLOv8 مما يسهل على المستخدمين الانتقال بسلاسة إلى الإصدار الجديد.
علاوةً على ذلك، تم تصميم YOLO11 لتلبية مجموعة واسعة من احتياجات الحوسبة - بدءًا من الأجهزة المتطورة خفيفة الوزن إلى الأنظمة السحابية القوية. يتوفر النموذج كإصدار مفتوح المصدر وإصدار للمؤسسات، مما يجعله قابلاً للتكيف مع حالات الاستخدام المختلفة.
إنه خيار رائع للمهام الدقيقة مثل التصوير الطبي والكشف عن الأقمار الصناعية، بالإضافة إلى تطبيقات أوسع نطاقاً في المركبات ذاتية القيادة والزراعة والرعاية الصحية.
إليك بعض الميزات الفريدة الأخرى في YOLO11:
عند استكشاف النماذج المختلفة، ليس من السهل دائماً المقارنة بينها بمجرد النظر إلى ميزاتها. وهنا يأتي دور المقارنة المعيارية. من خلال تشغيل جميع النماذج على نفس مجموعة البيانات، يمكننا قياس ومقارنة أدائها بشكل موضوعي. لنلقِ نظرة على أداء كل نموذج على مجموعة بيانات COCO.
عند المقارنة بين نماذج YOLO فإن كل إصدار جديد يجلب تحسينات ملحوظة فيما يتعلق بالدقة والسرعة والمرونة. وعلى وجه الخصوص، يُحقّق YOLO11m قفزة كبيرة هنا لأنه يستخدم معلمات أقل بنسبة 22% من YOLOv8m مما يعني أنه أخف وأسرع في التشغيل. أيضًا، على الرغم من حجمه الأصغر، إلا أنه يحقق متوسط دقة أعلى في مجموعة بيانات COCO. يقيس هذا المقياس مدى جودة اكتشاف النموذج للأجسام وتحديد مواقعها، لذا فإن متوسط الدقة الأعلى يعني تنبؤات أكثر دقة.
دعونا نستكشف كيفية أداء هذه النماذج في المواقف الواقعية.
للمقارنة بين YOLOv8 و YOLOv9 و YOLOv10 و YOLO11 تم تشغيل الأربعة على نفس فيديو حركة المرور باستخدام درجة ثقة 0.3 (يعرض النموذج الاكتشافات فقط عندما يكون واثقًا بنسبة 30% على الأقل من أنه حدد الجسم بشكل صحيح) وحجم صورة 640 للتقييم العادل. سلطت نتائج اكتشاف الأجسام وتتبعها الضوء على الاختلافات الرئيسية في دقة الاكتشاف والسرعة والدقة.
منذ الإطار الأول، التقط YOLO11 المركبات الكبيرة مثل الشاحنات التي لم يلتقطها YOLOv10. وأظهر YOLOv8 و YOLOv9 أداءً جيدًا لكنه تفاوت حسب ظروف الإضاءة وحجم الجسم. ظلت المركبات الأصغر حجماً والبعيدة تمثل تحدياً في جميع النماذج، على الرغم من أن YOLO11 أظهر تحسناً ملحوظاً في عمليات الكشف هذه أيضاً.
من حيث السرعة، عملت جميع الطرازات بين 10 و20 مللي ثانية لكل إطار، وهي سريعة بما يكفي للتعامل مع المهام في الوقت الحقيقي بمعدل يزيد عن 50 إطارًا في الثانية. من ناحية، قدم YOLOv8 و YOLOv9 اكتشافات ثابتة وموثوقة طوال الفيديو. ومن المثير للاهتمام أن YOLOv10، المصمم لوقت استجابة أقل، كان أسرع ولكنه أظهر بعض التناقضات في اكتشاف أنواع معينة من الأجسام.
من ناحية أخرى، تميزت YOLO11 بدقتها، حيث قدمت توازنًا قويًا بين السرعة والدقة. على الرغم من أن أداء أي من الطرازين لم يكن مثاليًا في كل إطار، إلا أن المقارنة جنبًا إلى جنب أظهرت بوضوح أن YOLO11 قدم أفضل أداء عام.
يعتمد اختيار نموذج لمشروع ما على متطلباته المحددة. على سبيل المثال، قد تعطي بعض التطبيقات الأولوية للسرعة، في حين قد تتطلب تطبيقات أخرى دقة أعلى أو تواجه قيود نشر تؤثر على القرار.
عامل مهم آخر هو نوع مهام الرؤية الحاسوبية التي تحتاج إلى معالجتها. إذا كنت تبحث عن مرونة أوسع في مختلف المهام، فإن YOLOv8 و YOLO11 خياران جيدان.
يعتمد اختيارك ل YOLOv8 أو YOLO11 على احتياجاتك. يعد YOLOv8 خيارًا قويًا إذا كنت جديدًا في مجال الرؤية الحاسوبية وتقدر مجتمعًا أكبر، والمزيد من البرامج التعليمية، والتكاملات الشاملة مع الجهات الخارجية.
من ناحية أخرى، إذا كنت تبحث عن أداء متطور مع دقة وسرعة أفضل، فإن YOLO11 هو الخيار الأفضل، على الرغم من أنه يأتي مع مجتمع أصغر وعدد أقل من عمليات التكامل نظرًا لكونه إصدارًا أحدث.
من Ultralytics YOLOv8 إلى Ultralytics YOLO11 يعكس تطور سلسلة نماذج YOLO دفعة ثابتة نحو نماذج رؤية حاسوبية أكثر ذكاءً. يجلب كل إصدار من YOLO ترقيات ذات مغزى من حيث السرعة والدقة والدقة.
مع استمرار تقدم الرؤية الحاسوبية، تقدم هذه النماذج حلولاً موثوقة لتحديات العالم الحقيقي، بدءاً من اكتشاف الأجسام وصولاً إلى الأنظمة المستقلة. يُظهر التطوير المستمر لنماذج YOLO مدى التقدم الذي حققه هذا المجال ومدى التقدم الذي يمكن أن نتوقعه في المستقبل.
لمعرفة المزيد عن الذكاء الاصطناعي، تفضل بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. اكتشف التطورات في مختلف المجالات، بدءاً من الذكاء الاصطناعي المرئي في التصنيع إلى الرؤية الحاسوبية في مجال الرعاية الصحية. اطلع على خيارات الترخيص لدينا لبدء مشاريع الذكاء الاصطناعي المرئي اليوم.