الشيك الأخضر
تم نسخ الرابط إلى الحافظة

استكشاف توسيم البيانات لمشاريع الرؤية الحاسوبية

اقرأ بحثنا المتعمق الشامل حول تصنيف البيانات فيما يتعلق بمشاريع الرؤية الحاسوبية وتعرف على كيفية تصنيف البيانات المرئية وسبب أهميتها.

يركز الذكاء الاصطناعي (AI) على منح الآلات قدرات شبيهة بقدرات البشر، وإحدى الطرق الأكثر شيوعًا للقيام بذلك هي التعلم تحت الإشراف. وبعبارة أخرى، يمكن أن يساعد تعليم نماذج الذكاء الاصطناعي من خلال عرض أمثلة مصنفة عليها على التعلم من الأنماط وتحسين المهام. إنه مشابه جداً لكيفية تعلم البشر من التجربة. إذن، كيف يتم إنشاء هذه الأمثلة المصنفة؟

تتضمن التعليقات التوضيحية للبيانات وضع علامات على البيانات أو وضع علامات على البيانات لمساعدة خوارزميات التعلم الآلي على فهمها. في الرؤية الحاسوبية، يعني ذلك وضع علامات على الصور أو مقاطع الفيديو للتعرف على الأشياء أو الإجراءات أو المشاهد وتصنيفها بدقة. يعد وضع العلامات على البيانات أمرًا حيويًا لأن نجاح نموذج الذكاء الاصطناعي يعتمد بشكل كبير على جودة البيانات الموسومة التي تم تدريبه عليها.

تشير الدراسات إلى أن أكثر من 80% من وقت مشروع الذكاء الاصطناعي يتم إنفاقه في إدارة البيانات، بدءًا من جمعها وتجميعها إلى تنظيفها وتسميتها. وهذا يوضح مدى أهمية الشرح التوضيحي للبيانات في تطوير نماذج الذكاء الاصطناعي. إن استخدام البيانات المشروحة عالية الجودة يجعل من الممكن لنماذج الذكاء الاصطناعي أداء مهام مثل التعرف على الوجه واكتشاف الأشياء بدقة أكبر وموثوقية أكبر في مواقف العالم الحقيقي.

لماذا يعد التعليق التوضيحي للبيانات ضرورياً

يشكل التعليق التوضيحي للبيانات أساس مدى جودة أداء نموذج الرؤية الحاسوبية. البيانات المصنفة هي الحقيقة الأساسية التي يستخدمها النموذج للتعلم والتنبؤ. تعتبر بيانات الحقيقة الأرضية أساسية لأنها تمثل العالم الحقيقي الذي يحاول النموذج فهمه. بدون هذا الأساس الموثوق به، سيكون نموذج الذكاء الاصطناعي مثل سفينة تبحر بدون بوصلة. 

الشكل 1. الحقيقة الأرضية مقابل التنبؤ.

تساعد التسمية الدقيقة هذه النماذج على فهم ما تراه وتؤدي إلى اتخاذ قرارات أفضل. إذا كانت البيانات ضعيفة التسمية أو غير متناسقة، فإن النموذج سيواجه صعوبة في اتخاذ تنبؤات وقرارات صحيحة، تماماً مثل الطالب الذي يتعلم من كتب مدرسية غير صحيحة. بفضل البيانات المشروحة، يمكن للنموذج تعلّم مهام مثل تصنيف الصور وتجزئة النماذج وتقدير وضعية الأجسام في الصور ومقاطع الفيديو. 

أفضل الموارد لمجموعات البيانات

قبل إنشاء مجموعة بيانات جديدة تمامًا ووضع علامات دقيقة على الصور ومقاطع الفيديو، من الجيد أن ترى ما إذا كان بإمكانك استخدام مجموعات البيانات الموجودة مسبقًا لمشروعك. هناك العديد من المستودعات الرائعة مفتوحة المصدر حيث يمكنك الوصول إلى مجموعات بيانات عالية الجودة مجاناً. ومن أشهرها ما يلي:

الشكل 2. أمثلة على البيانات في مجموعة بيانات COCO.

عند اختيار مجموعة البيانات، من المهم أن تأخذ بعين الاعتبار عوامل مثل مدى ملاءمتها لمشروعك، وحجم مجموعة البيانات، وتنوعها، وجودة التسميات. تأكد أيضًا من مراجعة شروط ترخيص مجموعة البيانات لتجنب أي تداعيات قانونية، وتحقق مما إذا كانت البيانات منسقة بطريقة تناسب سير عملك وأدواتك.

يعد إنشاء مجموعة بيانات مخصصة خيارًا رائعًا إذا كانت مجموعات البيانات الموجودة لا تناسب احتياجاتك تمامًا. يمكنك جمع الصور باستخدام أدوات مثل كاميرات الويب أو الطائرات بدون طيار أو الهواتف الذكية، اعتماداً على ما يتطلبه مشروعك. من الناحية المثالية، يجب أن تكون مجموعة البيانات المخصصة الخاصة بك متنوعة ومتوازنة وممثلة حقاً للمشكلة التي تحاول حلها. قد يعني ذلك التقاط صور في ظروف إضاءة مختلفة، ومن زوايا مختلفة، وفي بيئات متعددة.

إذا كنت قادرًا فقط على جمع عدد أقل من الصور أو مقاطع الفيديو، فإن زيادة البيانات هي تقنية مفيدة. وهي تتضمن توسيع مجموعة البيانات الخاصة بك عن طريق تطبيق تحويلات مثل التدوير أو التقليب أو تعديلات الألوان على الصور الموجودة. فهو يزيد من حجم مجموعة بياناتك ويجعل نموذجك أكثر قوة وقدرة على التعامل مع الاختلافات في البيانات. باستخدام مزيج من مجموعات البيانات مفتوحة المصدر، ومجموعات البيانات المخصصة، والبيانات المعززة، يمكنك تعزيز أداء نماذج الرؤية الحاسوبية الخاصة بك بشكل كبير.

أنواع تقنيات التعليقات التوضيحية للصور

قبل البدء في التعليق على الصور، من المهم أن تكون على دراية بأنواع التعليقات التوضيحية المختلفة. سيساعدك ذلك على اختيار النوع المناسب لمشروعك. بعد ذلك، سنلقي نظرة على بعض الأنواع الرئيسية للتعليقات التوضيحية. 

الصناديق المحدودة

المربعات المحددة هي أكثر أنواع التعليقات التوضيحية شيوعًا في الرؤية الحاسوبية. وهي عبارة عن مربعات مستطيلة تُستخدم لتحديد موقع كائن ما في الصورة. تُعرّف هذه المربعات بإحداثيات زواياها، وتساعد نماذج الذكاء الاصطناعي على تحديد الأجسام وتحديد موقعها. تُستخدم المربعات المحددة بشكل أساسي في اكتشاف الأجسام.

الشكل 3. مثال على المربعات المحدودة.

أقنعة التجزئة

في بعض الأحيان، يجب اكتشاف كائن ما بدقة أكبر من مجرد رسم مربع محدد حوله. قد تكون مهتمًا بحدود الكائنات في الصورة. في هذه الحالة، تتيح لك أقنعة التجزئة تحديد الكائنات المعقدة. أقنعة التجزئة هي تمثيل أكثر تفصيلاً على مستوى البكسل. 

يمكن استخدام هذه الأقنعة في التجزئة الدلالية وتجزئة المثيل. يتضمن التجزئة الدلالية تصنيف كل بكسل في الصورة وفقًا للكائن أو المنطقة التي يمثلها، مثل المشاة أو السيارة أو الطريق أو الرصيف. ومع ذلك، فإن تجزئة المثيل يذهب إلى أبعد من ذلك من خلال تحديد وفصل كل كائن على حدة، مثل التمييز بين كل سيارة في الصورة، حتى لو كانت جميعها من نفس النوع.

الشكل 4. مثال على التجزئة الدلالية (يسار) وأقنعة تجزئة المثيل (يمين).

مكعبات ثلاثية الأبعاد

تتشابه المكعبات ثلاثية الأبعاد مع المربعات المحدودة، وما يجعلها فريدة من نوعها هو أن المكعبات ثلاثية الأبعاد تضيف معلومات العمق وتوفر تمثيلًا ثلاثي الأبعاد للجسم. تسمح هذه المعلومات الإضافية للأنظمة بفهم شكل الأجسام وحجمها وموضعها في مساحة ثلاثية الأبعاد. وغالباً ما تُستخدم المكعبات ثلاثية الأبعاد في السيارات ذاتية القيادة لقياس مسافة الأجسام من السيارة.

الشكل 5. مثال على المكعبات ثلاثية الأبعاد.

النقاط الرئيسية والمعالم البارزة

نوع آخر مثير للاهتمام من التعليقات التوضيحية هو النقاط الرئيسية، حيث يتم تمييز نقاط محددة مثل العيون أو الأنوف أو المفاصل على الأجسام. تأخذ المعالم خطوة أبعد من ذلك من خلال ربط هذه النقاط لالتقاط بنية وحركة الأشكال الأكثر تعقيدًا، مثل الوجوه أو أوضاع الجسم. تُستخدم هذه الأنواع من التعليقات التوضيحية في تطبيقات مثل التعرف على الوجه والتقاط الحركة والواقع المعزز. كما أنها تحسن دقة نماذج الذكاء الاصطناعي في مهام مثل التعرف على الإيماءات أو تحليل الأداء الرياضي.

الشكل 6. مثال على النقاط الرئيسية.

كيفية التعليق التوضيحي للبيانات باستخدام LabelImg

والآن بعد أن ناقشنا الأنواع المختلفة من التعليقات التوضيحية، دعنا نفهم كيف يمكنك وضع تعليقات توضيحية للصور باستخدام أداة شائعة، LabelImg. LabelImg هي أداة مفتوحة المصدر تجعل التعليقات التوضيحية للصور بسيطة، ويمكن استخدامها لإنشاء مجموعات بيانات بتنسيق YOLO (أنت تنظر مرة واحدة فقط). إنه خيار رائع للمبتدئين الذين يعملون على مشاريع صغيرة Ultralytics YOLOv8 .

إعداد LabelImg بسيط ومباشر. أولاً، تأكد أولاً من تثبيت Python 3 على جهاز الكمبيوتر الخاص بك. بعد ذلك، يمكنك تثبيت LabelImg بأمر سريع. 


pip3 install labelImg

بمجرد تثبيته، يمكنك بدء تشغيل الأداة باستخدام الأمر:


labelImg

يعمل LabelImg على منصات متعددة، بما في ذلك ويندوز وماك ولينكس. إذا واجهت أي مشاكل أثناء التثبيت، يمكن لمستودع LabelImg الرسمي أن يزودك بتعليمات أكثر تفصيلاً.

الشكل 7. استخدام LabelImg للتعليق التوضيحي للصور.

بمجرد تشغيل الأداة، اتبع هذه الخطوات البسيطة لبدء تصنيف صورك:

  • قم بإعداد فئاتك: ابدأ بتحديد قائمة الأصناف (الفئات) التي تريد وضع تعليقات توضيحية عليها في ملف باسم "predefined_classes.txt". يتيح هذا الملف للبرنامج معرفة الكائنات التي ستضع عليها تعليقات توضيحية في صورك.
  • قم بالتبديل إلى تنسيق YOLO : بشكل افتراضي، يستخدم LabelImg تنسيق PASCAL VOC، ولكن إذا كنت تعمل مع YOLO ، فستحتاج إلى تبديل التنسيقات. ما عليك سوى النقر فوق الزر "PascalVOC" على شريط الأدوات للتبديل إلى YOLO.
  • ابدأ التعليق التوضيحي: استخدم خياري "فتح" أو "OpenDIR" لتحميل صورك. ثم ارسم المربعات المحدودة حول الكائنات التي تريد وضع تعليقات توضيحية عليها وقم بتعيين تسمية الفئة الصحيحة. بعد تسمية كل صورة، احفظ عملك. سينشئ LabelImg ملفًا نصيًا بنفس اسم صورتك، يحتوي على التسميات التوضيحية YOLO .
  • الحفظ والمراجعة: يتم حفظ التعليقات التوضيحية في ملف .txt بتنسيق YOLO . يحفظ البرنامج أيضًا ملف "classes.txt" الذي يسرد جميع أسماء الفصول الدراسية.

استراتيجيات توسيم البيانات الفعالة

لجعل عملية تصنيف البيانات أكثر سلاسة، هناك بعض الاستراتيجيات الرئيسية التي يجب وضعها في الاعتبار. على سبيل المثال، تعد المبادئ التوجيهية الواضحة للتعليق التوضيحي أمرًا بالغ الأهمية. فبدونها، قد يفسر الشارحون المختلفون مهمة ما بشكل مختلف. 

لنفترض أن المهمة هي وضع تعليقات توضيحية للطيور في الصور ذات المربعات المحدودة. قد يقوم أحد الشارحين بتسمية الطائر بأكمله، بينما قد يقوم آخر بتسمية الرأس أو الأجنحة فقط. قد يؤدي هذا النوع من التناقض إلى إرباك النموذج أثناء التدريب. من خلال توفير تعريفات واضحة، مثل "تسمية الطائر بأكمله بما في ذلك الأجنحة والذيل"، إلى جانب أمثلة وتعليمات للحالات الصعبة، يمكنك التأكد من أن البيانات موسومة بدقة واتساق.

تعتبر عمليات فحص الجودة المنتظمة مهمة أيضًا للحفاظ على معايير عالية. من خلال وضع معايير مرجعية واستخدام مقاييس محددة لمراجعة العمل، يمكنك الحفاظ على دقة البيانات وتحسين العملية من خلال التغذية الراجعة المستمرة. 

توسيم البيانات باختصار

التعليق التوضيحي للبيانات هو مفهوم بسيط يمكن أن يكون له تأثير كبير على نموذج رؤية الكمبيوتر الخاص بك. سواء أكنت تستخدم أدوات مثل LabelImg للتعليق على الصور أو تدريب النماذج على مجموعات البيانات مفتوحة المصدر، فإن فهم تصنيف البيانات أمر أساسي. يمكن أن تساعد استراتيجيات وضع العلامات على البيانات في تبسيط العملية بأكملها وجعلها أكثر كفاءة. يمكن أن يؤدي تخصيص الوقت الكافي لتحسين نهج التعليقات التوضيحية إلى نتائج ذكاء اصطناعي أفضل وأكثر موثوقية.

استمر في استكشاف وتوسيع مهاراتك! ابق على اتصال مع مجتمعنا لمواصلة التعلم عن الذكاء الاصطناعي! اطّلع على مستودع GitHub الخاص بنا لاكتشاف كيفية استخدامنا للذكاء الاصطناعي لإنشاء حلول مبتكرة في صناعات مثل التصنيع والرعاية الصحية. 🚀

شعار الفيسبوكشعار تويترشعار لينكد إنرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي