مسرد المصطلحات

التجزئة الشاملة

اكتشف كيف يوحد التجزئة البانوبتيكية بين التجزئة الدلالية وتجزئة المثيل لفهم المشهد بدقة على مستوى البكسل في تطبيقات الذكاء الاصطناعي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

التجزئة الشاملة هي تقنية رؤية حاسوبية متقدمة مصممة لتحقيق فهم كامل ومفصل للمشهد المرئي على مستوى البكسل. وهي تجمع بشكل فريد بين نقاط القوة في طريقتين رئيسيتين أخريين للتجزئة: التجزئة الدلالية وتجزئة المثيل. والهدف الأساسي من التجزئة البانوبتيكية هو تعيين كل من تسمية فئة (مثل "سيارة" أو "شخص" أو "طريق" أو "سماء") ومعرف مثيل (للتمييز بين الأجسام المختلفة من نفس الفئة) لكل بكسل في الصورة، مما يوفر تفسيرًا ثريًا وموحدًا للمشهد.

فهم النهج الموحد

لفهم التجزئة الشاملة، من المفيد مقارنتها بالمهام ذات الصلة. يحدد اكتشاف الكائنات الكائن ات باستخدام المربعات المحدودة ولكنه يفتقر إلى التفاصيل على مستوى البكسل. يصنّف التجزئة الدلالية كل بكسل إلى فئة (على سبيل المثال، يتم تصنيف جميع السيارات إلى "سيارة")، لكنه لا يميز بين الأجسام الفردية ضمن نفس الفئة. يعالج تجزئة المثيل هذا الأمر من خلال اكتشاف وتجزئة كل مثيل كائن مميز (على سبيل المثال، سيارة 1، سيارة 2)، ولكنه يركز عادةً على الكائنات التي يمكن عدها ("الأشياء") وقد يتجاهل مناطق الخلفية ("أشياء" مثل العشب أو السماء أو الطريق).

يعمل التقسيم الشامل على سد هذه الفجوة من خلال توفير فهم أكثر شمولية للمشهد. فهو يعيّن تصنيفًا دلاليًا لكل بكسل، سواءً كان ينتمي إلى فئة "الأشياء" (الأشياء التي يمكن عدها مثل المركبات والمشاة والحيوانات) أو فئة "الأشياء" (المناطق غير المتبلورة مثل الطرق والجدران والسماء). والأهم من ذلك، بالنسبة للبكسلات التي تنتمي إلى فئات "الأشياء"، فإنه يقوم أيضًا بتعيين معرّف مثيل فريد، يفصل كل كائن عن غيره من نفس النوع. يضمن هذا التصنيف الشامل عدم ترك أي بكسل دون تصنيف، مما يوفر تحليلًا كاملاً للصورة.

كيف يعمل التقسيم البانوبتيكي

تعتمد نماذج التجزئة الشاملة عادةً على بنيات التعلم العميق. وغالباً ما تستخدم هذه النماذج مستخرج ميزات مشتركة (شبكة أساسية) متبوعة برؤوس أو فروع متخصصة تتنبأ بالتسميات الدلالية لجميع وحدات البكسل وأقنعة المثيل لفئات "الأشياء". يتم بعد ذلك دمج مخرجات هذه الفروع أو دمجها بذكاء لإنتاج خريطة التجزئة الشاملة النهائية، حيث يكون لكل بكسل تسمية دلالية ومعرف مثيل إن أمكن.

التطبيقات الواقعية

يُعد الفهم الشامل للمشهد الذي يوفره التجزئة البانوبتيكية ذا قيمة كبيرة في مختلف المجالات:

  • القيادة الذاتية: بالنسبة للسيارات ذاتية القيادة، فإن التمييز بين المركبات المختلفة والمشاة (الحالات) مع فهم الطريق والأرصفة وإشارات المرور والسماء (السياق الدلالي) أمر حيوي للملاحة الآمنة. تعتمد شركات مثل Waymo وتقنيات مثل Tesla Autopilot اعتماداً كبيراً على إدراك المشهد المتطور.
  • التصوير الطبي: في تحليل الصور الطبية، يمكن للتقسيم البانوبتيكي أن يحدد بدقة الخلايا أو الأورام الفردية (الحالات) ويحددها مع تصنيف الأنسجة المحيطة والبنى الخلفية (التسميات الدلالية) في الوقت نفسه، مما يساعد في التشخيص وتخطيط العلاج. تركز مجموعات البيانات مثل PanNuke على هذا النوع من التجزئة النووية.
  • الروبوتات والواقع المعزز: إن فهم البيئة الكاملة، بما في ذلك الأجسام الفردية وسياق الخلفية، أمر بالغ الأهمية للروبوتات التي تتفاعل مع المساحات المعقدة ولتراكب المعلومات الرقمية بدقة في تطبيقات الواقع المعزز. يستفيد مجال الروبوتات بشكل كبير من رسم الخرائط البيئية التفصيلية.

التجزئة الشاملة باستخدام Ultralytics

في حين أن التجزئة الشاملة مهمة معقدة، فإن التطورات في نماذج مثل Ultralytics YOLO تتخطى حدود أداء التجزئة. نماذج مثل Ultralytics YOLOv8 قدرات قوية لمهام تجزئة الصور ذات الصلة، مما يشكل أساسًا لبناء أنظمة إدراك أكثر تعقيدًا. يمكن للمستخدمين الاستفادة من من منصات مثل Ultralytics HUB لتبسيط سير العمل، بما في ذلك نماذج التدريب على مجموعات البيانات المخصصة واستكشاف خيارات نشر النماذج المختلفة.

قراءة الكل