اكتشف قوة اكتشاف الأجسام - تعرف على الأجسام في الصور أو مقاطع الفيديو وحدد موقعها باستخدام نماذج متطورة مثل YOLO. استكشف تطبيقات العالم الحقيقي!
يُعدّ اكتشاف الكائنات مهمة أساسية في مجال الرؤية الحاسوبية (CV) تتضمن تحديد وجود كائن أو أكثر وموقعه ونوعه داخل صورة أو فيديو. على عكس تصنيف الصور، الذي يعيّن تصنيفًا واحدًا لصورة كاملة، فإن اكتشاف الكائنات يحدد بدقة كل مثيل كائن باستخدام مربع محدّد ويضع له تصنيفًا للفئة. تسمح هذه الإمكانية للآلات بفهم المشاهد المرئية بدقة أكبر، مما يعكس الإدراك البصري البشري بشكل أقرب.
عادةً ما يجمع اكتشاف الكائنات بين مهمتين أساسيتين: تصنيف الكائنات (تحديد "ما" الكائن الموجود) وتحديد موقع الكائن (تحديد "مكان" الكائن). تعتمد الأنظمة الحديثة للكشف عن الأجسام اعتمادًا كبيرًا على التعلّم العميق (DL)، وخاصةً الشبكات العصبية التلافيفية (CNNs). يتم تدريب هذه الشبكات على مجموعات كبيرة من البيانات، مثل مجموعة بيانات COCO الشهيرة، لتعلّم السمات والأنماط المرتبطة بفئات الكائنات المختلفة. يعالج النموذج صورة مُدخَلة ويخرج قائمة من المربعات المحددة، كل منها مع تسمية فئة مرتبطة بها (على سبيل المثال، "سيارة" أو "شخص") ودرجة ثقة. غالبًا ما يُقاس أداء هذه النماذج باستخدام مقاييس مثل التقاطع على الاتحاد (IoU) ومتوسط متوسط الدقة (mAP).
من المهم التمييز بين اكتشاف الأجسام ومهام الرؤية الحاسوبية الأخرى ذات الصلة:
تنقسم نماذج اكتشاف الكائنات بشكل عام إلى فئتين:
يعد اكتشاف الكائنات أمرًا بالغ الأهمية للعديد من التطبيقات في مختلف الصناعات:
يتضمن تطوير نماذج الكشف عن الكائنات استخدام أدوات ومنصات متخصصة. أطر عمل مثل PyTorch و TensorFlow لبنات البناء. توفر مكتبات مثل OpenCV وظائف الرؤية الحاسوبية الأساسية. توفر Ultralytics أحدث ما توصلت إليه Ultralytics YOLO ومنصة Ultralytics HUB، مما يبسط عملية تدريب النماذج المخصصة وإدارة مجموعات البيانات ونشر الحلول بكفاءة. يتطلب التدريب الفعال للنماذج في كثير من الأحيان ضبطاً دقيقاً للمعايير الفائقة واستراتيجيات زيادة البيانات.