مسرد المصطلحات

اكتشاف الكائن

اكتشف قوة اكتشاف الأجسام - تعرف على الأجسام في الصور أو مقاطع الفيديو وحدد موقعها باستخدام نماذج متطورة مثل YOLO. استكشف تطبيقات العالم الحقيقي!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

يُعدّ اكتشاف الكائنات مهمة أساسية في مجال الرؤية الحاسوبية (CV) تتضمن تحديد وجود كائن أو أكثر وموقعه ونوعه داخل صورة أو فيديو. على عكس تصنيف الصور، الذي يعيّن تصنيفًا واحدًا لصورة كاملة، فإن اكتشاف الكائنات يحدد بدقة كل مثيل كائن باستخدام مربع محدّد ويضع له تصنيفًا للفئة. تسمح هذه الإمكانية للآلات بفهم المشاهد المرئية بدقة أكبر، مما يعكس الإدراك البصري البشري بشكل أقرب.

كيف يعمل اكتشاف الكائنات

عادةً ما يجمع اكتشاف الكائنات بين مهمتين أساسيتين: تصنيف الكائنات (تحديد "ما" الكائن الموجود) وتحديد موقع الكائن (تحديد "مكان" الكائن). تعتمد الأنظمة الحديثة للكشف عن الأجسام اعتمادًا كبيرًا على التعلّم العميق (DL)، وخاصةً الشبكات العصبية التلافيفية (CNNs). يتم تدريب هذه الشبكات على مجموعات كبيرة من البيانات، مثل مجموعة بيانات COCO الشهيرة، لتعلّم السمات والأنماط المرتبطة بفئات الكائنات المختلفة. يعالج النموذج صورة مُدخَلة ويخرج قائمة من المربعات المحددة، كل منها مع تسمية فئة مرتبطة بها (على سبيل المثال، "سيارة" أو "شخص") ودرجة ثقة. غالبًا ما يُقاس أداء هذه النماذج باستخدام مقاييس مثل التقاطع على الاتحاد (IoU) ومتوسط متوسط الدقة (mAP).

اكتشاف الكائنات مقابل المهام ذات الصلة

من المهم التمييز بين اكتشاف الأجسام ومهام الرؤية الحاسوبية الأخرى ذات الصلة:

  • تصنيف الصور: يعين تسمية واحدة لصورة كاملة (على سبيل المثال، "تحتوي هذه الصورة على قطة"). لا يوفر معلومات عن موقع الكائن (الكائنات).
  • تجزئة الصور: يصنف كل بكسل في الصورة. يعيّن التجزئة الدلالية تسمية فئة لكل بكسل (على سبيل المثال، يتم تصنيف جميع البكسلات التي تنتمي إلى السيارات على أنها "سيارة")، بينما يميّز تجزئة المثيل بين الحالات المختلفة من نفس الفئة (على سبيل المثال، تسمية "سيارة 1" و"سيارة 2"). يوفر التجزئة معلومات مكانية أكثر تفصيلاً من المربعات المحدِّدة للكائنات.

أنواع نماذج الكشف عن الكائنات

تنقسم نماذج اكتشاف الكائنات بشكل عام إلى فئتين:

التطبيقات الواقعية

يعد اكتشاف الكائنات أمرًا بالغ الأهمية للعديد من التطبيقات في مختلف الصناعات:

الأدوات والتدريب

يتضمن تطوير نماذج الكشف عن الكائنات استخدام أدوات ومنصات متخصصة. أطر عمل مثل PyTorch و TensorFlow لبنات البناء. توفر مكتبات مثل OpenCV وظائف الرؤية الحاسوبية الأساسية. توفر Ultralytics أحدث ما توصلت إليه Ultralytics YOLO ومنصة Ultralytics HUB، مما يبسط عملية تدريب النماذج المخصصة وإدارة مجموعات البيانات ونشر الحلول بكفاءة. يتطلب التدريب الفعال للنماذج في كثير من الأحيان ضبطاً دقيقاً للمعايير الفائقة واستراتيجيات زيادة البيانات.

قراءة الكل