اكتشف قوة تجزئة الصور باستخدام Ultralytics YOLO . استكشف الدقة على مستوى البكسل وأنواعها وتطبيقاتها وحالات استخدام الذكاء الاصطناعي في العالم الحقيقي.
تجزئة الصور هي تقنية أساسية في الرؤية الحاسوبية (CV) تتضمن تقسيم صورة رقمية إلى عدة مناطق أو قطاعات متميزة. الهدف الأساسي هو تعيين تسمية فئة لكل بكسل في الصورة، مما يؤدي بشكل أساسي إلى تبسيط تمثيل الصورة إلى شيء أكثر وضوحًا وأسهل في التحليل بالنسبة للآلات. على عكس اكتشاف الأجسام، الذي يحدد الأجسام باستخدام مربعات مستطيلة الشكل، يوفر تجزئة الصور فهماً أكثر دقة على مستوى البكسل لمحتوى الصورة، ويحدد الشكل الدقيق للأجسام. هذه الدقة ضرورية للمهام التي تتطلب وعياً مكانياً مفصلاً.
تعمل خوارزميات تجزئة الصور من خلال فحص الصورة بكسل تلو الآخر وتجميع وحدات البكسل التي تشترك في خصائص معينة - مثل اللون أو الكثافة أو الملمس أو الموقع المكاني - في شرائح. اعتمدت الأساليب المبكرة على تقنيات مثل تحديد العتبة ونمو المنطقة والتجميع(K-Means وDBSCAN). ومع ذلك، تستفيد الأساليب الحديثة بشكل كبير من التعلّم العميق (DL)، وخاصةً الشبكات العصبية التلافيفية (CNNs). تتعلم هذه الشبكات العصبية السمات الهرمية المعقدة مباشرةً من بيانات التدريب لإجراء التصنيف على مستوى البكسل. الناتج النموذجي هو قناع تجزئة، وهي صورة تتوافق فيها قيمة كل بكسل مع تسمية الفئة التي ينتمي إليها، مما يبرز بصريًا الحدود الدقيقة للأشياء أو المناطق. أطر عمل مثل PyTorch و TensorFlow لبناء هذه النماذج وتدريبها.
يمكن أن تختلف مهام تجزئة الصور بناءً على كيفية التعامل مع الكائنات والفئات:
يتيح التحليل التفصيلي الذي يوفره تجزئة الصور العديد من التطبيقات:
Ultralytics YOLO مثل YOLOv8 و YOLO11توفر أحدث أداء لمهام التجزئة على سبيل المثال، وتوازن بين السرعة والدقة للاستدلال في الوقت الحقيقي. يعمل إطار Ultralytics على تبسيط عملية تدريب نماذج التجزئة المخصصة على مجموعات البيانات مثل COCO أو مجموعات البيانات المتخصصة مثل أجزاء السيارات أو تجزئة الشقوق. توفر أدوات مثل Ultralytics HUB منصة مبسطة لإدارة مجموعات البيانات، ونماذج التدريب(التدريب السحابي متاح)، ونشرها. يمكنك استكشاف وثائق مهمة التجزئة للحصول على تفاصيل التنفيذ أو اتباع أدلة مثل التجزئة باستخدام نماذج YOLOv8 المدربة مسبقًا أو تجزئة الصور باستخدام YOLO11 على Google Colab.