اكتشف قوة التجزئة الدلالية - قم بتصنيف كل بكسل في الصور لفهم المشهد بدقة. استكشف التطبيقات والأدوات الآن!
التجزئة الدلالية هي مهمة أساسية في الرؤية الحاسوبية تتضمن تعيين تسمية فئة محددة لكل بكسل واحد داخل الصورة. وخلافاً لمهام الرؤية الأخرى التي قد تحدد الأجسام أو تصنف الصورة بأكملها، فإن التجزئة الدلالية توفر فهماً كثيفاً على مستوى البكسل لمحتوى المشهد. وهذا يعني أنه لا يكتشف وجود سيارة فحسب، بل يحدد بدقة وحدات البكسل التي تنتمي إلى فئة السيارة، ويميزها عن وحدات البكسل التي تنتمي إلى الطريق أو السماء أو المشاة.
يتمثل الهدف الأساسي من التجزئة الدلالية في تقسيم الصورة إلى مناطق ذات معنى تتوافق مع فئات الكائنات المختلفة. على سبيل المثال، في صورة تحتوي على العديد من السيارات والمشاة والأشجار، يقوم نموذج التجزئة الدلالية بتسمية جميع وحدات البكسل التي تشكل أي سيارة "سيارة"، وجميع وحدات البكسل لأي مشاة "مشاة"، وجميع وحدات البكسل لأي شجرة "شجرة". يعامل جميع حالات نفس فئة الكائن بشكل متطابق. يتناقض هذا مع تصنيف الصور، الذي يعيّن تسمية واحدة للصورة بأكملها، ومع اكتشاف الأجسام، الذي يرسم مربعات محدّدة حول الأجسام المكتشفة ولكنه لا يحدّد شكلها بالضبط.
عادةً ما يتم تدريب نماذج التجزئة الدلالية باستخدام تقنيات التعلّم تحت الإشراف، مما يتطلب مجموعات بيانات ذات شروح مفصلة على مستوى البكسل. عادةً ما يكون الناتج عبارة عن خريطة تجزئة، وهي صورة تتوافق فيها قيمة (أو لون) كل بكسل مع تسمية فئته المتوقعة.
من المهم التمييز بين التجزئة الدلالية والمهام ذات الصلة:
يعد الفهم التفصيلي للمشهد الذي يوفره التجزئة الدلالية أمرًا بالغ الأهمية للعديد من التطبيقات الواقعية:
غالبًا ما يستخدم التجزئة الدلالية نماذج التعلّم العميق، لا سيما الشبكات العصبية التلافيفية (CNNs). وتُعد البنى مثل الشبكات التلافيفية الكاملة (FCN) وشبكة U-Net من الخيارات الشائعة. النماذج الحديثة مثل Ultralytics YOLOv8 أيضًا قدرات قوية لمهام التجزئة. توفر أدوات مثل Ultralytics HUB منصات للتدريب وإدارة مجموعات البيانات مثل COCO ونشر نماذج التجزئة بكفاءة.