شيك أخضر
تم نسخ الرابط إلى الحافظة

استخدام معززات البونتمنتات لتنويع بياناتك

تعرّف على كيفية استخدام Albumentations للتعزيزات عند تدريب Ultralytics YOLO11 المخصص لتحسين أداء النموذج مع بيانات التدريب المتنوعة.

عند بناء حل للرؤية الحاسوبية، يمكن أن يكون جمع مجموعة متنوعة من الصور لتدريب نماذج الذكاء الاصطناعي للرؤية جزءًا مهمًا من العملية. وغالباً ما يتطلب الأمر الكثير من الوقت والمال، وفي بعض الأحيان، لا تزال الصور التي يتم جمعها غير متنوعة بما يكفي لتتعلم النماذج بشكل فعال.

على سبيل المثال، نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 يمكن تدريبها بشكل مخصص على مجموعات بيانات الصور لمختلف مهام الرؤية الحاسوبية المتعلقة بتطبيقات مختلفة. البيانات المتنوعة هي المفتاح لأنها تساعد النموذج على التعميم بشكل أفضل، مما يسمح له بالتعرف على الأشياء والأنماط في مجموعة واسعة من سيناريوهات العالم الحقيقي.

إذا كنت تعاني من نقص في البيانات المتنوعة، يمكن أن تكون تقنيات زيادة بيانات الصور حلاً رائعاً. يمكن أن تساعد طرق مثل التدوير والتقليب وتعديل السطوع في زيادة تنوع مجموعة البيانات الخاصة بك، مما يحسن قدرة النموذج على التعامل مع مجموعة أوسع من الظروف.

لهذا السبب تدعم Ultralytics تكاملاً لزيادة بيانات الصور. باستخدام Albumentations، وهي أداة شائعة تقدم مجموعة من التحويلات، يمكنك إنشاء بيانات مرئية متنوعة. يعمل هذا التكامل على تبسيط عملية تدريب YOLO11 من خلال زيادة صور التدريب تلقائيًا، مما يؤدي إلى تحسين أداء النموذج. 

في هذه المقالة، سنستكشف في هذه المقالة كيفية استخدام تكامل Albumentations وفوائده وتأثيره على تدريب النماذج.

ما هي البومنتات؟

يمكن لنماذج الرؤية الحاسوبية أن تتعلم من مجموعة كبيرة من الصور عالية الجودة للتعرف على الأشياء في بيئات مختلفة. قد يكون جمع مجموعات البيانات الكبيرة من مصادر العالم الحقيقي بطيئاً ومكلفاً وغير فعال. لتبسيط هذه المهمة، يمكنك استخدام زيادة بيانات الصور لإنشاء أشكال جديدة من الصور الموجودة، مما يساعد النماذج على التعلم من سيناريوهات مختلفة دون جمع المزيد من البيانات.

على وجه التحديد، يمكنك الاستفادة من Albumentations، وهي مكتبة مفتوحة المصدر تم تقديمها لزيادة كفاءة بيانات الصور في عام 2018. وهي تدعم مجموعة متنوعة من العمليات، بدءًا من التغييرات الهندسية البسيطة مثل التدوير والانعكاسات إلى تعديلات أكثر تعقيدًا مثل السطوع والتباين وإضافة الضوضاء.

الشكل 1. أمثلة على أنواع مختلفة من تعزيزات بيانات الصور.

الملامح الرئيسية لـ Albumentations

يُعرف برنامج Albumentations بأدائه العالي، مما يعني أنه يمكنه معالجة الصور بسرعة وكفاءة. وهو مبني على مكتبات مُحسَّنة مثل OpenCV و NumPy، ويتعامل مع مجموعات البيانات الكبيرة بأقل وقت معالجة ممكن، مما يجعله مثاليًا لزيادة البيانات بسرعة أثناء تدريب النموذج.

فيما يلي بعض الميزات الرئيسية الأخرى لـ Albumentations:

  • مجموعة واسعة من التحويلات: توفر Albumentations أكثر من 70 نوعاً من التحويلات المعززة. تساعد هذه الاختلافات النماذج على تعلم اكتشاف الأجسام على الرغم من التغيرات في الإضاءة أو الزوايا أو الخلفيات.
  • مُحسَّن للسرعة: يستخدم تقنيات تحسين متقدمة مثل SIMD (تعليمات واحدة وبيانات متعددة)، والتي تعالج نقاط بيانات متعددة في وقت واحد لتسريع عملية زيادة الصور والتعامل مع مجموعات البيانات الكبيرة بكفاءة.
  • ثلاثة مستويات من التعزيزات: تعمل على تحسين البيانات بثلاث طرق. على سبيل المثال، تقوم عمليات التعزيز على مستوى البكسل بتعديل السطوع والألوان دون تغيير الكائنات. وفي الوقت نفسه، تقوم عمليات التعزيز على المستوى المكاني بتعديل موضع الكائنات مع الحفاظ على التفاصيل الرئيسية، وتمزج عمليات التعزيز على مستوى المزج بين أجزاء من صور مختلفة لإنشاء عينات جديدة.

لماذا يجب عليك استخدام تكامل Albumentations؟

قد تتساءل: هناك العديد من الطرق لتطبيق التعزيزات على مجموعة البيانات، ويمكنك حتى إنشاء أدواتك الخاصة باستخدام أدوات مثل OpenCV. إذن، لماذا تختار تكاملًا يدعم مكتبة مثل Albumentations؟

قد يستغرق إنشاء التعزيزات يدويًا باستخدام أدوات مثل OpenCV الكثير من الوقت ويتطلب بعض الخبرة. قد يكون من الصعب أيضًا ضبط التحويلات للحصول على أفضل النتائج. يجعل تكامل Albumentations هذه العملية أسهل. فهو يوفر العديد من التحويلات الجاهزة للاستخدام والتي يمكن أن توفر لك الوقت والجهد عند إعداد مجموعة البيانات الخاصة بك.

سبب آخر لاختيار تكامل Albumentations هو أنه يعمل بسلاسة مع خط أنابيبتدريب نموذج Ultralytics . إنه يجعل من الأسهل بكثير تدريب YOLO11 المخصص، حيث يتم تطبيق التعزيزات تلقائيًا أثناء التدريب. إنه يبسط العملية، بحيث يمكنك التركيز أكثر على تحسين نموذجك بدلاً من التعامل مع إعداد البيانات. 

الشروع في استخدام تكامل Albumentations

ومن المثير للاهتمام أن استخدام عمليات تكامل Albumentations لتدريب YOLO11 أكثر وضوحاً مما قد يبدو. فبمجرد إعداد المكتبات الصحيحة، يطبق التكامل تلقائيًا عمليات تعزيز بيانات الصور أثناء التدريب. يساعد النموذج على التعلم من أشكال مختلفة من الصور باستخدام نفس مجموعة البيانات.

بعد ذلك، دعنا نتعرف على كيفية تثبيت تكامل Albumentations واستخدامه عند تدريب YOLO11 المخصص.

تثبيت حزمة Ultralytics Python و Albumentations

قبل تطبيق التعزيزات، يجب تثبيت كل من حزمةUltralytics Python و Albumentations. لقد تم بناء التكامل بحيث تعمل كلتا المكتبتين معًا بسلاسة افتراضيًا، لذا لا داعي للقلق بشأن التكوينات المعقدة.

يمكن إكمال عملية التثبيت بأكملها في بضع دقائق فقط باستخدام أمر pip واحد، وهو أداة إدارة حزم لتثبيت مكتبات Python كما هو موضح في الصورة أدناه. 

الشكل 2. تركيب Ultralytics وألبومنتاتيشن.

بمجرد تثبيت Albumentations، يطبق وضع تدريب نموذج Ultralytics تلقائيًا عمليات تعزيز الصور أثناء التدريب. إذا لم يتم تثبيت Albumentations، فلن يتم تطبيق هذه التعزيزات. لمزيد من التفاصيل، يمكنك الرجوع إلى وثائق Ultralytics الرسمية.

تدريب YOLO11 بمساعدة تكامل البومينتيشنز

دعونا نتعرف بشكل أفضل على ما يحدث تحت غطاء محرك السيارة في تكامل Albumentations. 

إليك نظرة عن كثب على التعزيزات التي يتم تطبيقها خلال تدريب YOLO11 :

  • الضبابية: يضيف هذا التحويل ضبابية طفيفة إلى الصورة. يساعد النموذج على اكتشاف الأجسام حتى عندما تكون خارج نطاق التركيز.
  • الضبابية المتوسطة: يقلل من التشويش العشوائي مع الحفاظ على حواف الأجسام في الصورة. وهذا يسهل على النموذج اكتشاف الأجسام في البيئات المعقدة.
  • تدرج الرمادي: من خلال تحويل الصورة إلى اللونين الأبيض والأسود، يمكن أن تساعد هذه الزيادة النموذج في التركيز على الأشكال والأنسجة بدلاً من الألوان.
  • CLAHE (معادلة المدرج التكراري التكيفي المحدود التباين): تعمل هذه المعادلة على تعزيز التباين في الصور، خاصةً في المناطق المظلمة للغاية أو التي يصعب رؤيتها، كما هو الحال في ظروف الإضاءة المنخفضة أو الضبابية. وهذا يجعل الأجسام في تلك المناطق أكثر وضوحاً ويسهل على النموذج تحديدها.
الشكل 3. مثال على زيادة التدرج الرمادي المطبقة على صورة قطة.

تطبيقات YOLO11 وتكامل البومينتيشنز

إذا كنت تقوم بتدريب YOLO11 بشكل مخصص لتطبيق معين، يمكن أن يساعد تكامل البومنتات في تحسين أداء النموذج من خلال التكيف مع الظروف المختلفة. دعنا نناقش بعض التطبيقات الواقعية والتحديات التي يمكن لهذا التكامل حلها.

تحسين التصوير الطبي

يساعد الذكاء الاصطناعي البصري في مجال الرعاية الصحية الأطباء على تحليل الصور الطبية بدقة أكبر للمساعدة في التشخيص وتحسين رعاية المرضى. في الواقع، تستخدم حوالي خُمس مؤسسات الرعاية الصحية بالفعل حلول الذكاء الاصطناعي. 

ومع ذلك، فإن إنشاء حلول الرؤية الحاسوبية هذه يأتي مع مجموعة من التحديات الخاصة به. يمكن أن تختلف عمليات الفحص الطبي بشكل كبير بين المستشفيات، متأثرة بعوامل مثل اختلاف المعدات والإعدادات وحتى خبرة الفنيين. يمكن أن تؤثر التباينات في السطوع والتباين والتعرض على اتساق ودقة نماذج الرؤية بالذكاء الاصطناعي، مما يجعل من الصعب عليها أن تؤدي بشكل موثوق في بيئات مختلفة.

وهنا يصبح دمج أدوات مثل Albumentations ضرورياً. من خلال توليد إصدارات معززة متعددة من نفس الفحص، تُمكّن Albumentations النموذج من التعلم من مجموعة متنوعة من صفات الصور. وهذا يساعد النموذج على أن يصبح أكثر قوة، مما يسمح له باكتشاف الأمراض بدقة عبر الصور عالية الجودة ومنخفضة الجودة على حد سواء. 

الشكل 4. صور الأشعة السينية المعززة.

تعزيز الأمن والمراقبة

من التطبيقات الأخرى المثيرة للاهتمام للذكاء الاصطناعي المرئي في مجال الأمن والمراقبة. يمكن أن يساعد اكتشاف الأجسام في الوقت الحقيقي فرق الأمن في تحديد التهديدات المحتملة بسرعة. 

يتمثل أحد الشواغل الرئيسية المتعلقة بهذا التطبيق في أن كاميرات المراقبة تلتقط لقطات تحت ظروف إضاءة مختلفة على مدار اليوم، ويمكن أن تؤثر هذه الظروف بشكل كبير على كيفية فهم النموذج لهذه الصور. يمكن لعوامل مثل البيئات ذات الإضاءة المنخفضة أو الوهج أو ضعف الرؤية أن تجعل من الصعب على نماذج الرؤية الحاسوبية اكتشاف الأجسام أو التعرف على التهديدات المحتملة باستمرار.

يساعد تكامل البومنتات من خلال تطبيق التحويلات لمحاكاة ظروف الإضاءة المختلفة. يتيح ذلك للنموذج تعلم اكتشاف الأجسام في كل من البيئات ذات الإضاءة الساطعة والمنخفضة على حد سواء، مما يجعله أكثر موثوقية ويحسن أوقات الاستجابة في الظروف الصعبة.

إعادة تعريف تدفقات عمل البيع بالتجزئة وتجربة العملاء

إن الانسكاب في ممر سوبر ماركت، أو كلب يركض في المتجر، أو طفل يطرق على شاشة عرض المنتجات، ما هي إلا أمثلة قليلة على الأحداث اليومية التي يمكن أن تكون حالات متطورة للذكاء الاصطناعي البصري في بيئات البيع بالتجزئة . يتم استخدام الرؤية الحاسوبية بشكل متزايد لتحسين تجربة العملاء من خلال تتبع سلوك المتسوقين، ومراقبة حركة السير على الأقدام، وتحديد المنتجات على الرفوف. ومع ذلك، قد يكون من الصعب على أنظمة الذكاء الاصطناعي فهم هذه المواقف في العالم الحقيقي ومعالجتها بدقة.

في حين أنه لا يمكن تمثيل كل سيناريو في مجموعة بيانات الرؤية الحاسوبية، إلا أن تكامل البومنتات يساعد من خلال زيادة البيانات لتغطية العديد من المواقف المحتملة، مثل الإضاءة غير المتوقعة أو الزوايا غير العادية أو العوائق. يساعد ذلك نماذج الرؤية الحاسوبية على التكيف مع مختلف الظروف، وتحسين قدرتها على التعامل مع الحالات غير المتوقعة وإجراء تنبؤات دقيقة في بيئات البيع بالتجزئة الديناميكية.

الوجبات الرئيسية

يمكن أن يكون جمع بيانات واقعية متنوعة لتدريب النماذج أمراً معقداً، لكن البومنتات تجعل الأمر أسهل من خلال إنشاء تنويعات في الصور تساعد النماذج على التكيف مع الظروف المختلفة. 

يعمل تكامل Albumentations المدعوم من Ultralytics على تبسيط عملية تطبيق هذه التعزيزات أثناء تدريب YOLO11 المخصص. ويؤدي ذلك إلى تحسين جودة مجموعة البيانات، مما يعود بالنفع على مجموعة واسعة من الصناعات من خلال إنتاج نماذج ذكاء اصطناعي بصري أكثر دقة وموثوقية.

انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي، واطلع على خيارات الترخيص لدينا لبدء مشاريعك في مجال الذكاء الاصطناعي في الرؤية. هل أنت مهتم بابتكارات مثل الذكاء الاصطناعي في التصنيع أو الرؤية الحاسوبية في القيادة الذاتية؟ تفضل بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد. 

شعار الفيسبوكشعار تويترشعار LinkedInرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي