استكشف بنية U-Net لتقسيم الصور بدقة. تعرف على كيفية قيام تصميمها المتماثل الفريد ووصلاتها المباشرة بتعزيز الذكاء الاصطناعي الطبي وتحليل الأقمار الصناعية.
U-Net هي بنية مميزة في مجال التعلم العميق مصممة خصيصًا لمهام تقسيم الصور بدقة. تم تطويرها في الأصل لتحليل الصور الطبية الحيوية، وأصبحت هذه الشبكة العصبية التلافيفية (CNN) معيارًا لأي تطبيق يتطلب تصنيفًا على مستوى البكسل. على عكس التصنيف القياسي للصور الذي يعطي تسمية واحدة للصورة بأكملها، تصنف U-Net كل بكسل على حدة، مما يسمح للنموذج بتحديد الشكل والموقع الدقيقين للأشياء. قدرتها على العمل بفعالية مع بيانات تدريب محدودة تجعلها ذات قيمة عالية في المجالات المتخصصة التي تندر فيها مجموعات البيانات الكبيرة.
اسم "U-Net" مشتق من شكله المتماثل الذي يشبه الحرف U. تتكون البنية من مسارين رئيسيين: مسار انكماشي (مشفر) ومسار توسعي (مفكك). يستوعب المسار المتقلص سياق الصورة عن طريق تقليل أبعادها المكانية، على غرار العمود الفقري القياسي في نماذج الرؤية الأخرى. يقوم المسار الموسع بفعالية برفع دقة خريطة الميزات لاستعادة حجم الصورة الأصلي من أجل تحديد الموقع بدقة.
من الخصائص المميزة لشبكة U-Net استخدام الوصلات المباشرة. تعمل هذه الوصلات على سد الفجوة بين المشفّر والمفكك، حيث تنقل الميزات عالية الدقة من المسار المتقلص مباشرة إلى المسار المتوسع. تسمح هذه الآلية للشبكة بدمج المعلومات السياقية مع المعلومات المكانية التفصيلية، مما يمنع فقدان التفاصيل الدقيقة التي غالبًا ما تحدث أثناء تقليل الدقة. تساعد هذه البنية في التخفيف من مشكلات مثل مشكلة التدرج المتلاشي، مما يضمن تعلمًا قويًا .
على الرغم من أن شبكة U-Net نشأت في المجال الطبي، إلا أن تعدد استخداماتها أدى إلى اعتمادها في مختلف الصناعات.
من المهم التمييز بين U-Net ومصطلحات الرؤية الحاسوبية الأخرى. يقوم U-Net بإجراء التقسيم الدلالي، الذي يعامل عدة كائنات من نفس الفئة (مثل سيارتين مختلفتين) ككيان واحد (قناع فئة "السيارة"). في المقابل، يحدد تقسيم المثيلات و يفصل كل مثيل كائن فردي.
توفر البنى الحديثة، مثل نماذج التجزئة YOLO26 ، بديلاً أسرع وفي الوقت الفعلي عن U-Net التقليدي للعديد من التطبيقات الصناعية. في حين أن U-Net يتفوق في مجال الأبحاث الطبية بفضل دقته في التعامل مع مجموعات البيانات الصغيرة، غالباً ما يُفضل استخدام التجزئة YOLO للنشر على الأجهزة الطرفية حيث تعتبر سرعة الاستدلال أمراً بالغ الأهمية.
بالنسبة للمستخدمين الذين يرغبون في أداء مهام التجزئة بكفاءة، توفر الأطر الحديثة أدوات مبسطة. يمكنك استخدام Ultralytics لتعليق مجموعات بيانات التجزئة وتدريب النماذج دون الحاجة إلى برمجة مكثفة.
فيما يلي مثال موجز عن كيفية تشغيل الاستدلال باستخدام نموذج تقسيم مُدرب مسبقًا من
ultralytics الحزمة:
from ultralytics import YOLO
# Load a YOLO26 segmentation model (a fast alternative for segmentation tasks)
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate segmentation masks
results = model.predict("path/to/image.jpg", save=True)
# Process the results (e.g., access masks)
for result in results:
masks = result.masks # Access the segmentation masks object
للحصول على أفضل أداء من U-Net أو بنية تقسيم مماثلة، غالبًا ما يستخدم الممارسون زيادة البيانات. تساعد تقنيات مثل الدوران والتحجيم والتشوهات المرنة النموذج على تعلم الثبات ومنع التكيف المفرط، وهو أمر مهم بشكل خاص عندما تكون بيانات التدريب محدودة.
علاوة على ذلك، فإن تحديد دالة الخسارة الصحيحة أمر حيوي. تشمل الخيارات الشائعة معامل Dice أو الخسارة البؤرية، التي تتعامل مع عدم التوازن بين الفئات بشكل أفضل من الانتروبيا المتقاطعة القياسية، مما يضمن تركيز النموذج علىclassify . لمعرفة المزيد عن التاريخ والتفاصيل الفنية، يمكنك قراءة دليلنا التفصيلي عن بنية U-Net.