مسرد المصطلحات

تجزئة الصور

اكتشف قوة تجزئة الصور باستخدام Ultralytics YOLO . استكشف الدقة على مستوى البكسل وأنواعها وتطبيقاتها وحالات استخدام الذكاء الاصطناعي في العالم الحقيقي.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تجزئة الصور هي تقنية أساسية في الرؤية الحاسوبية (CV) تتضمن تقسيم صورة رقمية إلى عدة مناطق أو قطاعات متميزة. الهدف الأساسي هو تعيين تسمية فئة لكل بكسل في الصورة، مما يؤدي بشكل أساسي إلى تبسيط تمثيل الصورة إلى شيء أكثر وضوحًا وأسهل في التحليل بالنسبة للآلات. على عكس اكتشاف الأجسام، الذي يحدد الأجسام باستخدام مربعات مستطيلة الشكل، يوفر تجزئة الصور فهماً أكثر دقة على مستوى البكسل لمحتوى الصورة، ويحدد الشكل الدقيق للأجسام. هذه الدقة ضرورية للمهام التي تتطلب وعياً مكانياً مفصلاً.

كيفية عمل تجزئة الصور

تعمل خوارزميات تجزئة الصور من خلال فحص الصورة بكسل تلو الآخر وتجميع وحدات البكسل التي تشترك في خصائص معينة - مثل اللون أو الكثافة أو الملمس أو الموقع المكاني - في شرائح. اعتمدت الأساليب المبكرة على تقنيات مثل تحديد العتبة ونمو المنطقة والتجميع(K-Means وDBSCAN). ومع ذلك، تستفيد الأساليب الحديثة بشكل كبير من التعلّم العميق (DL)، وخاصةً الشبكات العصبية التلافيفية (CNNs). تتعلم هذه الشبكات العصبية السمات الهرمية المعقدة مباشرةً من بيانات التدريب لإجراء التصنيف على مستوى البكسل. الناتج النموذجي هو قناع تجزئة، وهي صورة تتوافق فيها قيمة كل بكسل مع تسمية الفئة التي ينتمي إليها، مما يبرز بصريًا الحدود الدقيقة للأشياء أو المناطق. أطر عمل مثل PyTorch و TensorFlow لبناء هذه النماذج وتدريبها.

أنواع تجزئة الصور

يمكن أن تختلف مهام تجزئة الصور بناءً على كيفية التعامل مع الكائنات والفئات:

  • التقسيم الدلالي: يعين كل بكسل إلى فئة محددة مسبقًا (على سبيل المثال، "سيارة"، "طريق"، "سماء"). لا يميز بين الحالات المختلفة لنفس فئة الكائن. جميع السيارات، على سبيل المثال، تشترك في نفس التسمية.
  • تجزئة المثيل: يذهب إلى خطوة أبعد من التجزئة الدلالية من خلال تحديد وتعيين كل مثيل كائن فردي داخل الصورة. ستحصل كل سيارة منفصلة على معرّف أو قناع فريد، حتى لو كانت تنتمي إلى نفس الفئة. هذا مفيد بشكل خاص عندما يكون من الضروري عد أو تتبع الكائنات الفردية.
  • التجزئة الشاملة: يجمع بين التجزئة الدلالية وتجزئة المثيل. فهو يعيّن تسمية فئة لكل بكسل (مثل التجزئة الدلالية) ويحدد بشكل فريد كل مثيل كائن (مثل تجزئة المثيل). يوفر فهماً شاملاً وموحداً للمشهد.

التمييز بين تجزئة الصور والمصطلحات ذات الصلة

  • تجزئة الصور مقابل اكتشاف الكائنات: يرسم الكشف عن الكائنات مربعات محدّدة حول الكائنات، مع الإشارة إلى موقعها وفئتها. يوفر تجزئة الصور قناعًا على مستوى البكسل يحدد الشكل الدقيق لكل كائن أو منطقة، مما يوفر تفاصيل أكثر من المربع البسيط.
  • تجزئة الصور مقابل تصنيف الصور: يقوم تصنيف الصور بتعيين تسمية واحدة للصورة بأكملها (على سبيل المثال، "تحتوي على قطة"). أما تجزئة الصور فيقوم بتعيين تسمية لكل بكسل داخل الصورة، وتحديد كائنات أو مناطق متعددة وأشكالها.
  • تجزئة الصور مقابل التعرف على الصور: التعرّف على الصور هو مصطلح أوسع نطاقًا للمهام التي يقوم فيها الذكاء الاصطناعي بتحديد الأشياء والأشخاص والأماكن وما إلى ذلك في الصور. تجزئة الصور هو نوع محدد من التعرف على الصور يركز على التقسيم على مستوى البكسل.

التطبيقات الواقعية

يتيح التحليل التفصيلي الذي يوفره تجزئة الصور العديد من التطبيقات:

تجزئة الصور و Ultralytics YOLO

Ultralytics YOLO مثل YOLOv8 و YOLO11توفر أحدث أداء لمهام التجزئة على سبيل المثال، وتوازن بين السرعة والدقة للاستدلال في الوقت الحقيقي. يعمل إطار Ultralytics على تبسيط عملية تدريب نماذج التجزئة المخصصة على مجموعات البيانات مثل COCO أو مجموعات البيانات المتخصصة مثل أجزاء السيارات أو تجزئة الشقوق. توفر أدوات مثل Ultralytics HUB منصة مبسطة لإدارة مجموعات البيانات، ونماذج التدريب(التدريب السحابي متاح)، ونشرها. يمكنك استكشاف وثائق مهمة التجزئة للحصول على تفاصيل التنفيذ أو اتباع أدلة مثل التجزئة باستخدام نماذج YOLOv8 المدربة مسبقًا أو تجزئة الصور باستخدام YOLO11 على Google Colab.

قراءة الكل