مسرد المصطلحات

التقسيم الدلالي

اكتشف قوة التجزئة الدلالية - قم بتصنيف كل بكسل في الصور لفهم المشهد بدقة. استكشف التطبيقات والأدوات الآن!

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التجزئة الدلالية هي مهمة أساسية في الرؤية الحاسوبية تتضمن تعيين تسمية فئة محددة لكل بكسل واحد داخل الصورة. وخلافاً لمهام الرؤية الأخرى التي قد تحدد الأجسام أو تصنف الصورة بأكملها، فإن التجزئة الدلالية توفر فهماً كثيفاً على مستوى البكسل لمحتوى المشهد. وهذا يعني أنه لا يكتشف وجود سيارة فحسب، بل يحدد بدقة وحدات البكسل التي تنتمي إلى فئة السيارة، ويميزها عن وحدات البكسل التي تنتمي إلى الطريق أو السماء أو المشاة.

ما هو التقسيم الدلالي؟

يتمثل الهدف الأساسي من التجزئة الدلالية في تقسيم الصورة إلى مناطق ذات معنى تتوافق مع فئات الكائنات المختلفة. على سبيل المثال، في صورة تحتوي على العديد من السيارات والمشاة والأشجار، يقوم نموذج التجزئة الدلالية بتسمية جميع وحدات البكسل التي تشكل أي سيارة "سيارة"، وجميع وحدات البكسل لأي مشاة "مشاة"، وجميع وحدات البكسل لأي شجرة "شجرة". يعامل جميع حالات نفس فئة الكائن بشكل متطابق. يتناقض هذا مع تصنيف الصور، الذي يعيّن تسمية واحدة للصورة بأكملها، ومع اكتشاف الأجسام، الذي يرسم مربعات محدّدة حول الأجسام المكتشفة ولكنه لا يحدّد شكلها بالضبط.

عادةً ما يتم تدريب نماذج التجزئة الدلالية باستخدام تقنيات التعلّم تحت الإشراف، مما يتطلب مجموعات بيانات ذات شروح مفصلة على مستوى البكسل. عادةً ما يكون الناتج عبارة عن خريطة تجزئة، وهي صورة تتوافق فيها قيمة (أو لون) كل بكسل مع تسمية فئته المتوقعة.

الاختلافات الرئيسية عن مهام التقسيم الأخرى

من المهم التمييز بين التجزئة الدلالية والمهام ذات الصلة:

  • تجزئة المثيل: بينما يقوم التقسيم الدلالي بتسمية جميع وحدات البكسل التي تنتمي إلى فئة "السيارة" بنفس التصنيف، فإن تقسيم المثيل يذهب إلى أبعد من ذلك. فهو يحدد ويجزئ كل مثيل فردي لكائن على حدة. لذا، ستحصل ثلاث سيارات مختلفة في صورة ما على قناع تجزئة فريد لكل منها، على الرغم من أنها تنتمي جميعها إلى فئة "سيارة". يمكنك تعلم كيفية استخدام Ultralytics YOLO لتجزئة المثيل.
  • التجزئة الشاملة: تجمع هذه المهمة بين التجزئة الدلالية وتجزئة المثيل. فهي تقوم بتعيين تسمية فئة لكل بكسل (مثل التجزئة الدلالية) وتحدد أيضًا كل مثيل كائن بشكل فريد (مثل تجزئة المثيل)، مما يوفر فهمًا موحدًا للمشهد.

تطبيقات التقسيم الدلالي

يعد الفهم التفصيلي للمشهد الذي يوفره التجزئة الدلالية أمرًا بالغ الأهمية للعديد من التطبيقات الواقعية:

  1. القيادة الذاتية: تعتمد السيارات ذاتية القيادة بشكل كبير على التجزئة الدلالية لفهم محيطها. من خلال تصنيف وحدات البكسل إلى فئات مثل "الطريق" و"الرصيف" و"المشاة" و"المركبة" و"العائق"، يمكن لنظام القيادة الذاتية اتخاذ قرارات مستنيرة بشأن الملاحة والسلامة.
  2. تحليل الصور الطبية: في مجال الرعاية الصحية، يساعد التجزئة الدلالية في تحليل الفحوصات الطبية مثل التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب. ويمكن أن يحدد بدقة الأعضاء أو الأنسجة أو التشوهات مثل الأورام، مما يساعد الأطباء في التشخيص وتخطيط العلاج ومراقبة تطور المرض. على سبيل المثال، يمكن استخدام نماذجUltralytics YOLO للكشف عن الأورام.
  3. تحليل صور الأقمار الصناعية: تُستخدم لتصنيف أنواع الغطاء الأرضي (مثل الغابات والمياه والمناطق الحضرية)، ورصد إزالة الغابات، ورسم خرائط الامتداد الحضري، أو تقييم صحة المحاصيل في الزراعة الدقيقة. يوفر الذكاء الاصطناعي البصري العديد من الفوائد للزراعة.
  4. الروبوتات: تمكين الروبوتات من إدراك بيئتها بتفاصيل أكبر، وهو أمر ضروري لمهام مثل التلاعب بالأشياء والملاحة في البيئات المعقدة. تعرف على المزيد حول دمج الرؤية الحاسوبية في الروبوتات.

النماذج والأدوات

غالبًا ما يستخدم التجزئة الدلالية نماذج التعلّم العميق، لا سيما الشبكات العصبية التلافيفية (CNNs). وتُعد البنى مثل الشبكات التلافيفية الكاملة (FCN) وشبكة U-Net من الخيارات الشائعة. النماذج الحديثة مثل Ultralytics YOLOv8 أيضًا قدرات قوية لمهام التجزئة. توفر أدوات مثل Ultralytics HUB منصات للتدريب وإدارة مجموعات البيانات مثل COCO ونشر نماذج التجزئة بكفاءة.

قراءة الكل