اكتشف قوة اكتشاف الأجسام: تحديد الأجسام في الصور وتحديد موقعها وتصنيفها بدقة. استكشف الأدوات والمفاهيم والاستخدامات الواقعية!
اكتشاف الأجسام هي تقنية رؤية حاسوبية تسمح لأنظمة الذكاء الاصطناعي بتحديد الأجسام داخل صورة أو مقطع فيديو وتحديد موقعها. وتتجاوز هذه التقنية مجرد تصنيف الصورة؛ فهي تحدد الموقع الدقيق للأجسام وترسم مربعات محددة حولها، مما يوفر كلاً من "ماذا" و"أين" الأجسام في المشهد المرئي. تُعد هذه القدرة أساسية للعديد من تطبيقات الذكاء الاصطناعي، مما يمكّن الآلات من إدراك العالم المرئي والتفاعل معه بطريقة تحاكي الرؤية البشرية.
يتضمن اكتشاف الأجسام العديد من المفاهيم المهمة التي تعتبر حاسمة لفهم كيفية عمل هذه الأنظمة. المربعات المحددة هي عبارة عن إطارات مستطيلة مرسومة حول الأجسام المكتشفة، مما يوفر تمثيلاً مرئيًا واضحًا لموقعها. هناك مقياس رئيسي آخر هو مقياس التقاطع على الاتحاد (IoU)، والذي يقيس التداخل بين المربع المحدد المتوقع والمربع المحدد الحقيقي، مما يساعد على تقييم دقة الكشف. بالإضافة إلى ذلك، يتم استخدام متوسط متوسط الدقة (mAP) لتقييم الأداء العام لنماذج اكتشاف الأجسام من خلال النظر في كل من الدقة والاستدعاء عبر فئات متعددة.
هناك نوعان أساسيان من بنيات الكشف عن الأجسام: كاشفات المرحلة الواحدة وكاشفات المرحلتين. صُممت أجهزة الكشف ذات المرحلة الواحدة، مثل Ultralytics YOLO ، من أجل السرعة والكفاءة، حيث تعالج الصورة بأكملها في مسار واحد للتنبؤ بالمربعات المحدودة واحتمالات الفئة في وقت واحد. وهذا يجعلها مثالية للتطبيقات في الوقت الفعلي حيث تكون المعالجة السريعة ضرورية. على النقيض من ذلك، تقوم أجهزة الكشف على مرحلتين أولاً بإنشاء مقترحات المناطق ثم تصنيف هذه المناطق، وعادةً ما توفر دقة أعلى ولكن على حساب سرعات معالجة أبطأ.
على الرغم من أن اكتشاف الأجسام تقنية قوية، إلا أنه من المهم تمييزها عن مهام الرؤية الحاسوبية ذات الصلة. يتضمن تصنيف الصور تعيين تسمية واحدة لصورة كاملة، تشير إلى الكائن أو المشهد الأساسي الموجود في الصورة. يذهب التقسيم الدلالي إلى أبعد من ذلك من خلال تصنيف كل بكسل في الصورة إلى فئات محددة مسبقًا، مما يوفر خريطة مفصلة للمشهد. ومع ذلك، يجمع الكشف عن الكائنات بين جوانب كليهما من خلال عدم الاكتفاء بتصنيف كائنات متعددة داخل الصورة فحسب، بل أيضًا تحديد موقعها بدقة باستخدام مربعات محددة.
للكشف عن الكائنات مجموعة واسعة من التطبيقات في مختلف الصناعات، مما يحول طريقة عمل الشركات ويعزز الحياة اليومية. فيما يلي مثالان بارزان:
في صناعة السيارات، يعد اكتشاف الأجسام أمراً بالغ الأهمية لتطوير السيارات ذاتية القيادة. تعتمد السيارات ذاتية القيادة على الكشف عن الأجسام لتحديد وتتبع المشاة والمركبات الأخرى وإشارات المرور وإشارات الطرق في الوقت الفعلي. وهذا يمكّن السيارة من التنقل بأمان واتخاذ قرارات مدروسة، مثل وقت الفرملة أو التسارع أو تغيير المسار. يُعد الاكتشاف الدقيق والسريع للأجسام أمراً ضرورياً لضمان سلامة أنظمة القيادة الذاتية وموثوقيتها. تعرّف على المزيد حول الذكاء الاصطناعي في السيارات ذاتية القيادة.
يُحدث الكشف عن الكائنات أيضاً ثورة في صناعة البيع بالتجزئة من خلال أتمتة العمليات المختلفة وتحسينها. على سبيل المثال، في عملية الدفع الآلي للبيع بالتجزئة، يمكن لأنظمة الكشف عن الأشياء في متاجر التجزئة تحديد المنتجات عند وضعها في عربة التسوق، وتحديث نظام الفوترة تلقائيًا وتبسيط عملية الدفع. لا يؤدي ذلك إلى تحسين تجربة العميل من خلال تقليل أوقات الانتظار فحسب، بل يحسن أيضًا إدارة المخزون ويقلل من الأخطاء. وبالإضافة إلى ذلك، يمكن استخدام اكتشاف الأشياء لمراقبة الرفوف، مما يضمن تخزين المنتجات وعرضها بشكل صحيح.
تتوفر عدة أدوات وأطر عمل لتطوير ونشر نماذج الكشف عن الكائنات. Ultralytics YOLOUltralytics YOLO هو إطار عمل رائد معروف بتوازنه بين السرعة والدقة، مما يجعله مناسبًا لمجموعة واسعة من التطبيقات. تم تصميم نماذج مثل YOLOv8 لتكون سهلة الاستخدام وفعالة، مما يسمح للمطورين بتدريب ونشر نماذج للكشف عن الأجسام في الوقت الفعلي بسهولة. بالإضافة إلى ذلك، يوفر OpenCV مكتبة شاملة من الدوال لمعالجة الصور والفيديو، وهي ضرورية لبناء تطبيقات قوية للكشف عن الأجسام.
بالنسبة لأولئك الذين يتطلعون إلى استكشاف اكتشاف الكائنات دون الحاجة إلى ترميز واسع النطاق، يقدم Ultralytics HUB منصة بدون كود للتدريب ونشر النماذج. وهذا يجعلها متاحة للمستخدمين ذوي المستويات المختلفة من الخبرة التقنية للاستفادة من قوة اكتشاف الكائنات في مشاريعهم.