مسرد المصطلحات

تجزئة المثيل

اكتشف كيف تعمل تقنية تجزئة المثيل على تحسين اكتشاف الكائنات بدقة على مستوى البكسل، مما يتيح أقنعة الكائنات التفصيلية لتطبيقات الذكاء الاصطناعي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تجزئة المثيل هي تقنية متطورة للرؤية الحاسوبية (CV) تحدد الكائنات داخل الصورة وترسم الحدود الدقيقة لكل مثيل على مستوى البكسل. على عكس الطرق التي تضع مربعات حول الكائنات فقط، يوفر تجزئة المثيل فهمًا أكثر تفصيلاً للمشهد من خلال إنشاء قناع فريد لكل كائن تم اكتشافه، حتى لو كان ينتمي إلى نفس الفئة. تُعد هذه القدرة ضرورية لتطبيقات الذكاء الاصطناعي المتقدمة، حيث تُعد معرفة الشكل والحجم والمدى المكاني للأجسام المميزة أمرًا ضروريًا، خاصةً عندما تتداخل الأجسام.

كيفية عمل تجزئة المثيل

تقوم نماذج تجزئة المثيل بتحليل الصورة لتحديد موقع الكائنات المحتملة أولاً، ثم التنبؤ، لكل كائن تم اكتشافه، بالبكسلات التي تنتمي إلى ذلك المثيل المحدد. غالبًا ما تستخدم الأساليب التقليدية، مثل بنية شبكة R-CNN ذات القناع المؤثر، عملية من مرحلتين: أولاً، تقوم بإجراء اكتشاف الكائنات لإنشاء مقترحات المربع المحدود، وثانيًا، تقوم بإنشاء قناع تجزئة داخل كل مربع مقترح. وعلى الرغم من فعالية هذه الأساليب، إلا أنها قد تكون صعبة من الناحية الحسابية.

الأساليب الأكثر حداثة، بما في ذلك نماذج مثل Ultralytics YOLOغالبًا ما تستخدم خطوط أنابيب أحادية المرحلة. تتنبأ هذه النماذج في نفس الوقت بالمربعات الحدية وتسميات الفئات وأقنعة النماذج في مسار واحد من خلال الشبكة العصبية (NN)، مما يؤدي إلى تحسينات كبيرة في السرعة، مما يجعلها مناسبة للاستدلال في الوقت الفعلي. يتطلب تدريب هذه النماذج مجموعات بيانات كبيرة تحتوي على شروح على مستوى البكسل، مثل مجموعة بيانات COCO المستخدمة على نطاق واسع، وتحديداً شروح التجزئة الخاصة بها. تتضمن العملية عادةً تقنيات التعلم العميق (DL) ، والاستفادة من الشبكات العصبية التلافيفية (CNNs) لتعلم السمات البصرية المعقدة.

تجزئة المثيل مقابل المهام ذات الصلة

من المهم التفريق بين تجزئة المثيل ومهام تجزئة الصور الأخرى:

  • اكتشاف الأجسام: يحدد وجود الكائنات وموقعها باستخدام المربعات المحدودة ولكنه لا يوفر معلومات عن الشكل. يذهب تجزئة المثيل إلى أبعد من ذلك من خلال تحديد وحدات البكسل الدقيقة لكل كائن.
  • التقسيم الدلالي: يعين تسمية فئة لكل بكسل في الصورة (على سبيل المثال، "سيارة"، "شخص"، "طريق"). ومع ذلك، فإنه لا يميز بين الحالات المختلفة لنفس الفئة. جميع السيارات، على سبيل المثال، ستكون جزءًا من نفس فئة "سيارة". يمكنك قراءة المزيد في هذا الدليل لتجزئة المثيل مقابل التجزئة الدلالية.
  • التجزئة الشاملة: يجمع بين التجزئة الدلالية وتجزئة المثيل. فهو يعيّن تسمية فئة لكل بكسل (مثل التجزئة الدلالية) ويحدد أيضًا كل مثيل كائن بشكل فريد (مثل تجزئة المثيل).

يركز تجزئة المثيلات على وجه التحديد على اكتشاف مثيلات الكائنات الفردية وتحديدها، مما يوفر دقة عالية فيما يتعلق بحدود الكائنات والفصل بينها.

تطبيقات تجزئة المثيل

إن القدرة على تحديد وعزل الكائنات الفردية بدقة تجعل من تجزئة النماذج أمرًا لا يقدر بثمن في العديد من المجالات:

  • القيادة الذاتية: تعتمد السيارات ذاتية القيادة على تجزئة المثيل لإدراك محيطها بدقة. ويُعد التمييز بين المركبات الفردية والمشاة وراكبي الدراجات والعوائق، حتى في المشاهد المزدحمة أو المتداخلة، أمراً بالغ الأهمية للملاحة الآمنة واتخاذ القرارات. تستخدم شركات مثل Waymo هذه التقنيات على نطاق واسع.
  • تحليل الصور الطبية: في علم الأشعة وعلم الأمراض، يساعد تجزئة المثيل في تحديد هياكل معينة مثل الأورام أو الأعضاء أو الخلايا في عمليات المسح(التصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي وغيرها). تساعد هذه الدقة على مستوى البكسل في التشخيص وقياس حجم الورم وتخطيط العمليات الجراحية وتتبع تطور المرض. على سبيل المثال، يُظهر استخدام YOLO11 للكشف عن الأورام هذا التطبيق في السياق الأوسع للذكاء الاصطناعي في مجال الرعاية الصحية.
  • الروبوتات: تحتاج الروبوتات التي تقوم بمهام مثل الإمساك أو التلاعب في بيئات غير منظمة إلى تحديد وتحديد موقع الأشياء الفردية بدقة. يسمح تجزئة المثيل للروبوتات بفهم الشكل والحدود الدقيقة للأشياء من أجل التفاعل الناجح، وهو ما يتم استكشافه بشكل أكبر في الذكاء الاصطناعي في الروبوتات.
  • تحليل صور الأقمار الصناعية: تُستخدم لرسم خرائط مفصلة للغطاء الأرضي، ورصد الامتداد العمراني من خلال تحديد المباني الفردية، أو تتبع أجسام معينة مثل السفن أو المركبات. يدعم هذا المستوى من التفاصيل المراقبة البيئية وإدارة الموارد وجمع المعلومات الاستخبارية. استكشف تقنيات تحليل صور الأقمار الصناعية العامة.
  • المراقبة الزراعية: يساعد في إحصاء النباتات أو الفاكهة الفردية، وتقييم صحة المحاصيل على أساس كل نبات، أو تحديد أنواع معينة من الأعشاب الضارة للتدخل المستهدف، مما يساهم في الزراعة الدقيقة.

تجزئة المثيل مع Ultralytics YOLO

توفر Ultralytics أحدث النماذج القادرة على إجراء تجزئة فعالة للنماذج. نماذج مثل YOLOv8 و YOLO11 مصممة لتقديم أداءٍ عالٍ في مختلف مهام الرؤية الحاسوبية، بما في ذلك تجزئة النماذج(راجع تفاصيل مهمة التجزئة). يمكن للمستخدمين الاستفادة من النماذج المدربة مسبقًا أو إجراء ضبط دقيق على مجموعات البيانات المخصصة باستخدام أدوات مثل منصة Ultralytics HUB، التي تبسّط سير عمل التعلم الآلي (ML) بدءًا من إدارة البيانات إلى نشر النموذج. وللتنفيذ العملي، تتوفر موارد مثل البرامج التعليمية حول التجزئة باستخدام نماذج Ultralytics YOLOv8 المدربة مسبقًا أو أدلة حول عزل كائنات التجزئة. يمكنك أيضًا تعلم كيفية استخدام Ultralytics YOLO11 للتجزئة على سبيل المثال. الأطر الشائعة مثل PyTorch و TensorFlow الشائعة لتطوير هذه النماذج ونشرها.

قراءة الكل