مسرد المصطلحات

يو-نت

اكتشف U-Net، بنية CNN القوية للتجزئة الدلالية. تعرّف على تطبيقاتها في التصوير الطبي والأقمار الصناعية والتصوير المستقل.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

شبكة U-Net هي نوع متخصص من بنية الشبكة العصبية التلافيفية، وهي مصممة في المقام الأول لتجزئة الصور الدلالية. وهي تتفوق في تحليل الصور الطبية الحيوية ولكنها وجدت تطبيقات في مختلف المجالات الأخرى التي تتطلب تصنيفًا دقيقًا على مستوى البكسل. وعلى عكس الشبكات التلافيفية القياسية المستخدمة في تصنيف الصور، فإن شبكة U-Net مصممة لالتقاط كل من السياق والموقع الدقيق، مما يجعلها فعالة للغاية في مهام مثل تحديد الحدود والمناطق في الصور.

شرح بنية شبكة U-Net

تتميز بنية شبكة U-Net بشكلها على شكل حرف U، وتتألف من مشفر (مسار متقلص) وفك تشفير (مسار متوسع).

  • مسار التشفير (التعاقد): هذا المسار عبارة عن شبكة تلافيف نموذجية تطبق عمليات التلافيف والتجميع الأقصى بشكل متكرر. وهو يلتقط سياق الصورة عن طريق تصغير عينات خرائط السمات واستخراج خرائط السمات. تقوم كل خطوة بتصغير عينات خرائط الميزات مع مضاعفة عدد الميزات.

  • مسار وحدة فك التشفير (التوسيع): مسار وحدة فك التشفير متماثل مع وحدة التشفير ويقوم بإجراء عمليات التوسيع. ويستخدم التلافيف المنقولة لزيادة دقة خرائط الميزات، مما يؤدي إلى تحديد مكان وجود الميزة في الصورة بشكل فعال. في كل خطوة، يتم رفع عينات خرائط الميزات إلى أعلى، ويتم تقليل عدد الميزات إلى النصف.

  • تخطي الاتصالات: من الابتكارات الرئيسية في U-Net استخدام وصلات التخطي. تربط هذه الوصلات مباشرةً بين الطبقات المتناظرة في مساري المشفر وفك التشفير. فهي تدمج خرائط ميزات عالية الدقة من أداة التشفير مع خرائط الميزات المعززة من وحدة فك الترميز. يسمح ذلك لوحدة فك الترميز بتعلم تجميع المواقع الدقيقة باستخدام المعلومات السياقية من وحدة التشفير، وهو أمر بالغ الأهمية للتجزئة الدقيقة.

تسمح هذه البنية لشبكة U-Net بأداء جيد مع بيانات تدريب محدودة، وهو سيناريو شائع في التصوير الطبي والمجالات المتخصصة الأخرى. تُعد وصلات التخطي ضرورية لاستعادة المعلومات المكانية المفقودة أثناء تقليل العينات، مما يؤدي إلى أقنعة تجزئة أكثر دقة وتفصيلاً.

تطبيقات شبكة U-Net

إن بنية U-Net تجعلها مناسبة بشكل خاص للمهام التي تتطلب تحديداً دقيقاً للتوطين والتجزئة التفصيلية. وتشمل بعض التطبيقات البارزة ما يلي:

  • تحليل الصور الطبية: هذا هو المكان الذي تم فيه تطوير U-Net في البداية وشهد اعتماده على نطاق واسع. يتم استخدامه لتجزئة الأعضاء والأنسجة والآفات في الصور الطبية مثل التصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب وصور الفحص المجهري. على سبيل المثال، يمكن لشبكة U-Net المساعدة في الكشف عن الأورام وتعداد الخلايا والتخطيط الجراحي من خلال تحديد المناطق المهمة بدقة. استكشف تطبيقات الذكاء الاصطناعي في تحليل الصور الطبية لمزيد من الأمثلة في مجال الرعاية الصحية.

  • تحليل صور الأقمار الصناعية والجوية: تُعد U-Net ذات قيمة أيضًا في تحليل صور الأقمار الصناعية والجوية لمهام مثل التخطيط الحضري والرصد البيئي والاستجابة للكوارث. ويمكنه تجزئة المباني والطرق والغابات والمسطحات المائية من الصور عالية الدقة، مما يوفر بيانات مهمة للتحليل الجغرافي وإدارة الموارد. ويمكن أن يكون ذلك حاسماً في تطبيقات مثل رصد إزالة الغابات أو تقييم الأضرار بعد الكوارث الطبيعية. تعرف على المزيد حول تحليل صور الأقمار الصناعية وتطبيقاتها المتنوعة.

  • القيادة الذاتية: في حين أن اكتشاف الأجسام أمر بالغ الأهمية للمركبات ذاتية القيادة، فإن التجزئة الدلالية التي توفرها بنيات مثل U-Net توفر فهماً أعمق للمشهد. يمكن لشبكة U-Net تقسيم مشاهد الطرق إلى فئات مثل الطرق والأرصفة والمركبات والمركبات والمشاة، مما يوفر سياقاً بيئياً شاملاً للملاحة الآمنة. تعرّف على المزيد حول الذكاء الاصطناعي في السيارات ذاتية القيادة وكيفية مساهمة التجزئة في إدراك السيارة.

  • مراقبة الجودة الصناعية: في مجال التصنيع، يمكن تطبيق U-Net للفحص البصري الآلي. ويمكنه تجزئة العيوب أو الحالات الشاذة أو مكونات محددة في صور المنتجات، مما يضمن الجودة والاتساق في خطوط الإنتاج. اكتشف كيف تعمل الرؤية الحاسوبية على تحسين عمليات التصنيع ومراقبة الجودة.

شبكة U-Net مقابل البنى الأخرى

في حين أن U-Net مصممة للتجزئة الدلالية، فإن البنى الأخرى مثل Ultralytics YOLO تُستخدم في المقام الأول للكشف عن الكائنات. يهدف الكشف عن الكائنات إلى تحديد الكائنات داخل الصورة وتحديد موقعها باستخدام المربعات المحددة، في حين أن التجزئة الدلالية تصنف كل بكسل في الصورة إلى فئات محددة مسبقًا.

  • اكتشاف الكائنات (على سبيل المثال، YOLO): يركز على تحديد الكائنات الفردية ورسم مربعات محددة حولها. يجيب على أسئلة "ماذا" و"أين" حول الأجسام في الصورة. Ultralytics YOLO تشتهر نماذج بسرعتها وكفاءتها في مهام اكتشاف الأجسام، مما يجعلها مناسبة للتطبيقات في الوقت الفعلي. استكشف Ultralytics YOLOv8 للحصول على أحدث إمكانيات اكتشاف الأجسام.

  • التقسيم الدلالي (مثل U-Net): يهدف إلى تصنيف كل بكسل في الصورة، وتعيينه إلى فئة محددة. يوفر فهمًا مفصلاً على مستوى البكسل للمشهد، ويجيب عن أسئلة "ماذا يوجد في كل بكسل". تتفوق U-Net في السيناريوهات التي تتطلب حدودًا دقيقة وأقنعة مفصلة للمناطق داخل الصور، مما يجعلها مثالية للتصوير الطبي وتصوير الأقمار الصناعية.

وعلى الرغم من اختلاف هذه المهام، إلا أنها يمكن أن تكون متكاملة. على سبيل المثال، في القيادة الذاتية، قد يؤدي اكتشاف الأجسام في القيادة الذاتية إلى تحديد المركبات والمشاة، في حين يمكن أن يؤدي التقسيم الدلالي، باستخدام بنية شبيهة بشبكة U-Net، إلى تحديد المناطق القابلة للقيادة وعلامات الطرق.

الأدوات والأطر الخاصة بشبكة U-Net

غالبًا ما ينطوي تطوير نماذج U-Net وتنفيذها على استخدام أطر عمل التعلم العميق مثل PyTorch و TensorFlow. توفر هذه الأطر الأدوات والوظائف اللازمة لبناء الشبكات العصبية وتدريبها ونشرها. يمكن أيضًا استخدام مكتبات مثل OpenCV لمهام المعالجة المسبقة للصور ومهام ما بعد المعالجة بالاقتران مع نماذج U-Net.

إن بنية U-Net وفعاليتها في التصنيف على مستوى البكسل تجعلها أداة قيّمة في مجال الرؤية الحاسوبية، لا سيما في التطبيقات التي تتطلب فهمًا تفصيليًا للصور وتجزئتها. ومع استمرار تقدم التعلّم العميق، من المتوقع أن تظل شبكة U-Net ومتغيراتها حاسمة في مهام تحليل الصور في مجالات متنوعة.

قراءة الكل