التعرف على الصور
اكتشف كيف يُمكِّن الذكاء الاصطناعي الذكاء الاصطناعي من تصنيف المرئيات وفهمها، مما يؤدي إلى الابتكار في مجالات الرعاية الصحية وتجارة التجزئة والأمن وغيرها.
التعرّف على الصور هو مجال واسع من مجالات الرؤية الحاسوبية التي تمكّن الآلات من تحديد وتفسير الأشياء والأشخاص والأماكن والأفعال داخل الصور أو مقاطع الفيديو الرقمية. إنها تقنية أساسية تدعم تطبيقات لا حصر لها، بدءاً من فتح هاتفك باستخدام وجهك إلى تمكين المركبات ذاتية القيادة من التنقل في البيئات المعقدة. تستخدم تقنية التعرّف على الصور في جوهرها خوارزميات التعلم الآلي (ML) والتعلم العميق (DL) لتحليل وحدات البكسل واستخراج أنماط ذات معنى، ومحاكاة قدرة الإنسان على فهم المعلومات المرئية.
التعرف على الصور مقابل المهام ذات الصلة
على الرغم من استخدامه في كثير من الأحيان بالتبادل، إلا أن التعرف على الصور هو مصطلح عام يشمل العديد من المهام الأكثر تحديدًا. ومن المهم تمييزه عن مجالاته الفرعية:
- تصنيف الصور: هذا هو أبسط أشكال التعرف على الصور. وهو يتضمن تعيين تسمية واحدة لصورة كاملة من مجموعة محددة مسبقًا من الفئات. على سبيل المثال، قد يصنف النموذج الصورة على أنها تحتوي على "قطة" أو "كلب" أو "سيارة". ويكون الناتج عبارة عن تسمية واحدة للصورة بأكملها.
- اكتشاف الكائنات: وهي مهمة أكثر تقدماً، لا يقتصر الكشف عن الكائنات على تصنيف الكائنات داخل الصورة فحسب، بل يحدد موقعها أيضاً، وعادةً ما يتم ذلك من خلال رسم مربع محدد حول كل منها. تستخدم السيارة ذاتية القيادة، على سبيل المثال، اكتشاف الأجسام لتحديد المشاة والمركبات الأخرى وإشارات المرور وتحديد موقعها.
- تجزئة الصور: تذهب هذه المهمة إلى أبعد من ذلك من خلال تحديد وحدات البكسل الدقيقة التي تنتمي إلى كل كائن في الصورة. فهي تُنشئ قناعاً مفصلاً لكل كائن، وهو أمر بالغ الأهمية للتطبيقات التي تتطلب فهماً عميقاً لشكل الكائن وحدوده، كما هو الحال في تحليل الصور الطبية.
كيف يعمل التعرف على الصور
تعمل الشبكات العصبية التلافيفية، وهي نوع من الشبكات العصبية الفعالة بشكل خاص في معالجة البيانات الشبيهة بالشبكات مثل الصور، على التعرف على الصور الحديثة في الغالب بواسطة الشبكات العصبية التلافيفية (CNNs). تتضمن العملية عادةً ما يلي:
- جمع البيانات: يتم جمع مجموعة بيانات كبيرة من الصور المصنفة. ومن الأمثلة الشهيرة على ذلك ImageNet و COCO.
- تدريب النموذج: يتم تدريب شبكة CNN على مجموعة البيانات هذه. أثناء التدريب، تتعلم الشبكة أثناء التدريب تحديد الأنماط - من الحواف والقوام البسيط إلى أجزاء الجسم المعقدة - من خلال عملية تسمى استخراج السمات. يتم تعديل أوزان النموذج لتقليل الفرق بين تنبؤاته والتسميات الحقيقية الأرضية.
- الاستدلال: بمجرد التدريب، يمكن للنموذج إجراء تنبؤات على صور جديدة غير مرئية. تسمى عملية تطبيق النموذج المدرّب هذه بالاستدلال.
التطبيقات الواقعية
أصبح التعرف على الصور جزءاً لا يتجزأ من العديد من الصناعات:
- الرعاية الصحية: في مجال الذكاء الاصطناعي في الرعاية الصحية، يساعد التعرف على الصور أخصائيي الأشعة على اكتشاف الأورام والكسور وغيرها من الحالات الشاذة في الأشعة السينية والتصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب. على سبيل المثال، يمكن تدريب النماذج على مجموعات بيانات من الصور الطبية لتحديد أورام الدماغ بدقة عالية، مما يساعد الأطباء في إجراء تشخيصات أسرع.
- البيع بالتجزئة: يستخدم بائعو التجزئة خاصية التعرف على الصور لإدارة المخزون من خلال وجود كاميرات تراقب الرفوف لاكتشاف وقت نفاد المنتجات. ومن التطبيقات الشائعة الأخرى ميزات البحث المرئي على مواقع التجارة الإلكترونية، والتي تسمح للعملاء بتحميل صورة للعثور على منتجات مماثلة. يمكنك معرفة المزيد حول هذا الأمر على صفحتنا الخاصة بالذكاء الاصطناعي في البيع بالتجزئة.
الأدوات والتدريب
غالبًا ما يتضمن تطوير تطبيقات التعرف على الصور استخدام مكتبات وأطر عمل متخصصة. وتشمل التقنيات الرئيسية ما يلي: