يُعد التجزئة الدلالية مهمة حاسوبية حاسوبية هامة للرؤية تتضمن تصنيف كل بكسل في الصورة إلى فئات أو فئات محددة مسبقًا. وخلافًا لمهام الرؤية الحاسوبية الأخرى، يوفر التجزئة الدلالية تنبؤًا كثيفًا، حيث يقوم بتعيين تصنيف لكل بكسل، مما يتيح فهمًا دقيقًا للمشهد. تتخطى هذه التقنية مجرد اكتشاف الأجسام؛ فهي تحدد وتصنف الأجسام نفسها، مما يوفر تفسيرًا أكثر ثراءً لمحتوى الصورة.
ما هو التقسيم الدلالي؟
يهدف التقسيم الدلالي إلى فهم وتسمية كل بكسل في الصورة وفقًا لما يمثله. وهذا يتجاوز التصنيف الأساسي للصور، الذي يتنبأ فقط بتسمية واحدة للصورة بأكملها، واكتشاف الكائنات، الذي يرسم مربعات محددة حول الكائنات. في المقابل، يحدد التقسيم الدلالي حدود الكائن بدقة على مستوى البكسل. على سبيل المثال، في صورة لمشهد شارع، لا يقتصر التجزئة الدلالية على تحديد السيارات والمشاة والطرقات فحسب، بل يحدد أيضًا الشكل الدقيق لكل سيارة ومشاة وسطح الطريق، مع تصنيف كل بكسل على أنه ينتمي إلى إحدى هذه الفئات.
يجعل هذا التصنيف على مستوى البكسل من التصنيف الدلالي أداة قوية للتطبيقات التي تتطلب فهمًا تفصيليًا للمشهد. إنه شكل من أشكال التعلّم تحت الإشراف، حيث يتم تدريب النماذج على مجموعات بيانات ذات شروح على مستوى البكسل. ويكون الناتج عبارة عن صورة مجزأة حيث يتوافق كل جزء منها مع فئة كائن معين. نماذج متقدمة مثل Ultralytics YOLOv8ونموذج أي شيء مجزأ (SAM ) يمكن استخدامها لمهام التجزئة الدلالية الفعالة والدقيقة.
تطبيقات التقسيم الدلالي
للتقسيم الدلالي مجموعة واسعة من التطبيقات في مختلف الصناعات:
- القيادة الذاتية: في السيارات ذاتية القيادة، يعد التقسيم الدلالي ضرورياً لفهم المشهد. فهو يساعد المركبات على التفريق بين الطرق والأرصفة والمشاة وإشارات المرور والمركبات الأخرى، مما يتيح الملاحة واتخاذ القرارات بشكل أكثر أماناً. على سبيل المثال، يضمن تجزئة أسطح الطرق بدقة بقاء السيارة ضمن علامات المسارات، بينما يساعد تحديد المشاة وراكبي الدراجات على منع وقوع الحوادث. تعرّف على المزيد حول الذكاء الاصطناعي في السيارات ذاتية القيادة.
- تحليل الصور الطبية: في مجال الرعاية الصحية، يُستخدم التجزئة الدلالية على نطاق واسع في تحليل الصور الطبية. يمكن أن يساعد في تحديد وتعيين المناطق ذات الأهمية في الفحوصات الطبية مثل الأشعة المقطعية والتصوير بالرنين المغناطيسي والأشعة السينية. على سبيل المثال، يمكن استخدامه لتجزئة الأورام والأعضاء وغيرها من الهياكل التشريحية، مما يساعد في التشخيص وتخطيط العلاج ومراقبة تطور المرض. اكتشف كيفية استخدامUltralytics YOLO للكشف عن الأورام في التصوير الطبي.
- تحليل صور الأقمار الصناعية والجوية: يلعب التجزئة الدلالية دورًا حاسمًا في تحليل صور الأقمار الصناعية والجوية. ويمكن استخدامه لتصنيف الغطاء الأرضي والتخطيط الحضري والرصد البيئي. ومن خلال تجزئة الصور إلى فئات مثل المباني والغابات والمسطحات المائية والطرق، فإنه يوفر بيانات قيّمة للتنمية الحضرية ومراقبة الزراعة والاستجابة للكوارث. اكتشف كيف تحلل الرؤية الحاسوبية صور الأقمار الصناعية.
- الزراعة والزراعة الدقيقة: في الزراعة، يمكن استخدام التجزئة الدلالية في تحليل المحاصيل والغطاء النباتي. فهو يساعد في التمييز بين المحاصيل والأعشاب الضارة، وتقييم صحة النبات، ومراقبة الظروف الحقلية. وهذا يتيح تقنيات الزراعة الدقيقة وتحسين استخدام الموارد وتحسين غلة المحاصيل. تعرّف على أهم فوائد استخدام الذكاء الاصطناعي البصري في الزراعة.
التجزئة الدلالية مقابل الكشف عن الكائنات وتجزئة المثيل
على الرغم من أن التجزئة الدلالية واكتشاف الكائنات وتجزئة النماذج كلها مهام رؤية حاسوبية تركز على فهم المشهد، إلا أنها تختلف في مخرجاتها ومستوى التفاصيل.
- اكتشاف الأجسام: يحدد الأجسام في الصورة ويحدد موقعها باستخدام المربعات المحدودة. يحدد ماهية الأجسام ومكانها، ولكن ليس شكلها الدقيق أو تفاصيلها على مستوى البكسل. على سبيل المثال، قد يكتشف "سيارة" ويرسم مربعًا حول كل سيارة في مشهد الشارع.
- التقسيم الدلالي: يصنف كل بكسل في الصورة إلى فئات محددة مسبقًا، مما يوفر فهمًا للمشهد على مستوى البكسل. يخبرنا بما يمثله كل بكسل. يميّز بين الفئات، ولكن لا يميّز بين الحالات الفردية من نفس الفئة. على سبيل المثال، يقوم بتصنيف جميع بكسلات السيارات على أنها "سيارة" وجميع بكسلات الطرق على أنها "طريق"، بغض النظر عن عدد السيارات أو الطرق الموجودة.
- تجزئة المثيل: يجمع بين جوانب كل من اكتشاف الكائنات والتجزئة الدلالية. يكتشف كل مثيل كائن في الصورة ويجزئ كل مثيل على حدة. فهو لا يحدد فقط ما هي الكائنات وأين توجد الكائنات فحسب، بل يميّز أيضًا بين المثيلات الفردية من نفس فئة الكائن. على سبيل المثال، يقوم بتجزئة كل سيارة في مشهد شارع على حدة، حتى لو كانت تنتمي إلى نفس فئة "السيارة".
باختصار، يوفر التجزئة الدلالية تصنيفًا تفصيليًا للصور على مستوى البكسل، وهو أمر بالغ الأهمية للتطبيقات التي تحتاج إلى فهم دقيق للمشهد. تعمل أدوات مثل Ultralytics HUB على تبسيط عملية تدريب نماذج التجزئة الدلالية ونشرها، مما يجعل هذه التقنية القوية أكثر سهولة.