مسرد المصطلحات

اكتشاف الكائن

اكتشف قوة اكتشاف الأجسام - تعرف على الأجسام في الصور أو مقاطع الفيديو وحدد موقعها باستخدام نماذج متطورة مثل YOLO. استكشف تطبيقات العالم الحقيقي!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

يُعدّ اكتشاف الكائنات مهمة أساسية في مجال الرؤية الحاسوبية (CV) تتضمن تحديد وجود كائن أو أكثر وموقعه ونوعه داخل صورة أو فيديو. على عكس تصنيف الصور، الذي يعيّن تسمية واحدة للصورة بأكملها (على سبيل المثال، "قطة")، فإن اكتشاف الكائنات يحدد بدقة كل مثيل للكائن باستخدام مربع محدد ويضع له تسمية فئة (على سبيل المثال، "قطة" عند الإحداثيات س، ص، عرض، ارتفاع). تسمح هذه الإمكانية للآلات بفهم المشاهد المرئية بمزيد من التفصيل، مما يحاكي الإدراك البصري البشري بشكل أقرب ويتيح تفاعلات أكثر تعقيدًا مع البيئة. إنها تقنية أساسية وراء العديد من تطبيقات الذكاء الاصطناعي الحديثة.

كيف يعمل اكتشاف الكائنات

عادةً ما يجمع اكتشاف الكائنات بين مهمتين أساسيتين: تصنيف الكائنات (تحديد "ما" الكائن الموجود) وتحديد موقع الكائن (تحديد "مكان" وجود الكائن، عادةً عن طريق إحداثيات الصندوق المحيط). تعتمد الأنظمة الحديثة للكشف عن الأجسام اعتمادًا كبيرًا على التعلّم العميق (DL)، وخاصةً الشبكات العصبية التلافيفية (CNNs). يتم تدريب هذه الشبكات على مجموعات بيانات كبيرة ومشروحة، مثل مجموعة بيانات COCO الشهيرة أو Open Images V7، لتعلم السمات والأنماط المرئية المرتبطة بفئات الكائنات المختلفة.

أثناء العملية (المعروفة باسم الاستدلال)، يعالج النموذج المُدرّب صورة مُدخَلة أو إطار فيديو. يقوم بإخراج قائمة بالأجسام المحتملة، حيث يتم تمثيل كل منها بصندوق محدّد، وتسمية الفئة المتوقعة (على سبيل المثال، "سيارة"، "شخص"، "كلب")، ودرجة ثقة تشير إلى يقين النموذج بشأن الاكتشاف. وغالباً ما تُستخدم تقنيات مثل القمع غير الأقصى (NMS) لتحسين هذه المخرجات عن طريق إزالة المربعات الزائدة والمتداخلة لنفس الكائن. وعادةً ما يتم تقييم أداء هذه النماذج باستخدام مقاييس مثل التقاطع على الاتحاد (IoU) ومتوسط متوسط الدقة (mAP).

اكتشاف الكائنات مقابل المهام ذات الصلة

من المهم التمييز بين اكتشاف الأجسام ومهام الرؤية الحاسوبية الأخرى ذات الصلة:

  • تصنيف الصور: يعين تسمية واحدة لصورة كاملة (على سبيل المثال، "تحتوي هذه الصورة على كلب"). لا يحدد موقع الكائن (الكائنات).
  • تجزئة الصور: يصنف كل بكسل في الصورة، مما يؤدي إلى إنشاء خريطة مفصلة لحدود الكائن. هذا الأمر أكثر دقة من المربعات المحددة للكشف عن الكائنات.
    • التقسيم الدلالي: يعيّن تسمية فئة لكل بكسل (على سبيل المثال، جميع البكسلات التي تنتمي إلى "سيارات" يتم تصنيفها "سيارة"). لا يميز بين الحالات المختلفة من نفس الفئة.
    • تجزئة المثيل: يعيّن تسمية فئة لكل بكسل ويميّز بين المثيلات الفردية من نفس الفئة (على سبيل المثال، "سيارة 1" و"سيارة 2"). يجمع بين الكشف والتجزئة.
  • تتبع الكائنات: ينطوي على اكتشاف الأجسام في إطارات الفيديو المتتالية وتعيين معرّف فريد لكل جسم لتتبع حركته بمرور الوقت. يعتمد ذلك على اكتشاف الأجسام.

أنواع نماذج الكشف عن الكائنات

تنقسم نماذج اكتشاف الأجسام بشكل عام إلى فئتين رئيسيتين، تختلفان في المقام الأول في نهجها ومقايضات السرعة/الدقة:

التطبيقات الواقعية

يُعد اكتشاف الأجسام تقنية أساسية تتيح العديد من التطبيقات في مختلف الصناعات:

  1. الأنظمة ذاتية القيادة: ضرورية للسيارات ذاتية القيادة والروبوتات، مما يسمح للمركبات والروبوتات بإدراك محيطها من خلال اكتشاف المشاة والمركبات الأخرى والعوائق وإشارات المرور وعناصر محددة للتفاعل. تعتمد شركات مثل Tesla وWaymo اعتماداً كبيراً على الاكتشاف القوي للأشياء.
  2. الأمن والمراقبة: تُستخدم في أنظمة الإنذار الأمني للكشف عن المتسللين، ومراقبة الحشود(الذكاء الاصطناعي البصري في إدارة الحشود)، وتحديد الأجسام المهجورة، وتعزيز كفاءة المراقبة في الأماكن العامة والممتلكات الخاصة.
  3. تحليلات البيع بالتجزئة: تعمل على تشغيل تطبيقات مثل أنظمة الدفع الآلي، وإدارة المخزون القائمة على الذكاء الاصطناعي، ومراقبة الأرفف (الكشف عن العناصر غير المتوفرة في المخزون)، وتحليل أنماط حركة العملاء.
  4. الرعاية الصحية: يُطبَّق في تحليل الصور الطبية للكشف عن الحالات الشاذة مثل الأورام(استخدام YOLO11 للكشف عن الأورام) أو الآفات في الأشعة السينية والتصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي، ومساعدة أطباء الأشعة في التشخيص(الأشعة: الذكاء الاصطناعي).
  5. الزراعة: تمكين تقنيات الزراعة الدقيقة، مثل الكشف عن الآفات والأمراض والحشائش الضارة وعدّ الثمار(الرؤية الحاسوبية في الزراعة)، ومراقبة صحة المحاصيل(الذكاء الاصطناعي في حلول الزراعة).
  6. التصنيع: يُستخدم لمراقبة الجودة من خلال الكشف عن العيوب في المنتجات على خطوط التجميع(فحص الجودة في التصنيع)، وضمان السلامة من خلال مراقبة المناطق الخطرة، وأتمتة المهام الروبوتية.

الأدوات والتدريب

يتضمن تطوير نماذج اكتشاف الكائنات ونشرها أدوات وتقنيات مختلفة. أطر التعلم العميق الشائعة مثل PyTorch و TensorFlow المكتبات التأسيسية. توفر مكتبات الرؤية الحاسوبية مثل OpenCV وظائف معالجة الصور الأساسية.

توفر شركة Ultralytics أحدث ما توصلت إليه Ultralytics YOLO بما في ذلك YOLOv8 و YOLO11المُحسّنة للسرعة والدقة. تعمل منصة Ultralytics HUB على تبسيط سير العمل بشكل أكبر، حيث توفر أدوات لإدارة مجموعات البيانات، وتدريب النماذج المخصصة، وإجراء ضبط المعلمات الفائقة، وتسهيل نشر النماذج. وغالبًا ما يستفيد التدريب الفعال للنماذج من استراتيجيات وتقنيات زيادة البيانات مثل نقل التعلّم باستخدام أوزان مُدرّبة مسبقًا من مجموعات بيانات مثل ImageNet.

قراءة الكل