اكتشف سرعة وكفاءة أجهزة الكشف عن الأجسام ذات المرحلة الواحدة لتطبيقات الذكاء الاصطناعي في الوقت الحقيقي مثل القيادة الذاتية وتحليلات البيع بالتجزئة.
في مجال الكشف عن الأجسام، تعد أجهزة الكشف عن الأجسام ذات المرحلة الواحدة فئة من الخوارزميات المصممة لتحديد الأجسام داخل الصورة وتحديد موقعها في تمريرة أمامية واحدة من خلال شبكة عصبية. على عكس كاشفات الأجسام ذات المرحلتين، والتي تقترح أولاً مناطق الاهتمام ثم تقوم بتصنيفها، تعمل كاشفات المرحلة الواحدة على تبسيط العملية من خلال التنبؤ بالمربعات المحدودة واحتمالات الفئة في نفس الوقت. يعزز هذا النهج الموحد السرعة والكفاءة بشكل كبير، مما يجعل أجهزة الكشف ذات المرحلة الواحدة مناسبة بشكل خاص للتطبيقات في الوقت الفعلي حيث تكون المعالجة السريعة أمرًا بالغ الأهمية.
تتميز أجهزة الكشف عن الأجسام ذات المرحلة الواحدة ببنيتها الانسيابية، والتي تتكون عادةً من شبكة عصبية واحدة تعالج الصورة بأكملها مرة واحدة. يُلغي هذا التصميم الحاجة إلى خطوة اقتراح منطقة منفصلة، مما يؤدي إلى تسريع أوقات الاستدلال. تقوم الشبكة بإخراج مجموعة من المربعات المحدودة إلى جانب احتمالات فئتها المقابلة، مما يؤدي إلى التنبؤ مباشرةً بموقع وفئة الأجسام داخل الصورة.
الميزة الأساسية لأجهزة الكشف ذات المرحلة الواحدة هي سرعتها. فمن خلال معالجة الصورة في مسار واحد، يمكنها تحقيق أداء في الوقت الحقيقي أو شبه الحقيقي، مما يجعلها مثالية لتطبيقات مثل تحليل الفيديو والقيادة الذاتية وأنظمة المراقبة المباشرة. بالإضافة إلى ذلك، غالبًا ما تُترجم بنيتها الأبسط إلى متطلبات حسابية أقل، مما يتيح النشر على الأجهزة محدودة الموارد مثل الهواتف المحمولة أو الأنظمة المدمجة.
اكتسبت العديد من بنيات اكتشاف الأجسام ذات المرحلة الواحدة شهرة في هذا المجال. من بين أكثرها تأثيرًا Ultralytics YOLO (أنت تنظر مرة واحدة فقط). Ultralytics YOLO مشهور بسرعته ودقته الاستثنائية، مما يجعله خيارًا شائعًا للعديد من التطبيقات في العالم الحقيقي. تشمل البنى الأخرى البارزة الأخرى ذات المرحلة الواحدة SSD (كاشف اللقطة الواحدة متعدد الصناديق) وشبكية الشبكية (RetinaNet)، ولكل منها نقاط قوتها ومفاضلاتها الخاصة من حيث السرعة والدقة والتعقيد.
تستخدم أجهزة الكشف عن الأجسام ذات المرحلة الواحدة عادةً شبكة عصبونية التلافيف الكاملة (CNN) لمعالجة الصورة المدخلة. تستخرج الشبكة العصبية ذات المرحلة الواحدة الملامح من الصورة وتغذيها إلى رأس الكشف، وهو المسؤول عن التنبؤ بالمربعات المحدودة واحتمالات الفئة. يتكون رأس الاكتشاف عادةً من عدة طبقات تلافيفية تعمل على خرائط السمات التي تنتجها الشبكة العصبية المتشابكة.
يكون ناتج رأس الكشف عبارة عن مجموعة من خرائط الخصائص، حيث تتوافق كل خلية مع منطقة معينة في صورة الإدخال. تتنبأ كل خلية بمربعات حدود متعددة، إلى جانب احتمالات الفئة المرتبطة بها ودرجات الثقة. يتم بعد ذلك تنقيح هذه التنبؤات باستخدام تقنيات مثل الكبح غير الأقصى (NMS) لإزالة المربعات الزائدة أو المتداخلة واختيار التنبؤات الأكثر ثقة.
إن سرعة وكفاءة أجهزة الكشف عن الأجسام ذات المرحلة الواحدة تجعلها مناسبة تمامًا لمجموعة واسعة من التطبيقات الواقعية. وفيما يلي مثالان ملموسان:
في حين تتفوق أجهزة الكشف ذات المرحلة الواحدة في السرعة والكفاءة، غالبًا ما توفر أجهزة الكشف عن الأجسام ذات المرح لتين دقة أعلى، خاصةً للأجسام الأصغر أو المشاهد المعقدة. تقوم أجهزة الكشف ذات المرحلتين، مثل Faster R-CNN، أولاً بإنشاء مقترحات المناطق ثم تصنيف هذه المناطق في خطوة منفصلة. تسمح هذه العملية المكونة من خطوتين بتحديد موقع الكائن وتصنيفه بشكل أكثر دقة ولكنها تأتي على حساب زيادة التعقيد الحسابي وأوقات الاستدلال الأبطأ.
يعتمد الاختيار بين أجهزة الكشف ذات المرحلة الواحدة وأجهزة الكشف ذات المرحلتين على متطلبات التطبيق المحددة. بالنسبة للتطبيقات في الوقت الحقيقي حيث تكون السرعة أمرًا بالغ الأهمية، غالبًا ما تكون أجهزة الكشف ذات المرحلة الواحدة مفضلة. بالنسبة للمهام التي تتطلب أعلى دقة وحيث يكون وقت المعالجة أقل أهمية، قد تكون أجهزة الكشف ذات المرحلتين أكثر ملاءمة.
تمثل أجهزة الكشف عن الأجسام ذات المرحلة الواحدة تقدماً كبيراً في مجال الرؤية الحاسوبية، حيث تقدم مزيجاً مقنعاً من السرعة والكفاءة. إن قدرتها على معالجة الصور بتمريرة واحدة من خلال شبكة عصبية تجعلها مثالية للتطبيقات في الوقت الحقيقي في مختلف الصناعات. مع استمرار تقدم الأبحاث، يمكننا أن نتوقع المزيد من التحسينات في دقة وأداء أجهزة الكشف ذات المرحلة الواحدة، مما يعزز دورها في المشهد المتطور باستمرار للذكاء الاصطناعي والتعلم الآلي. استكشف أحدث ما توصل إليه العلم في مجال اكتشاف الأجسام من خلال زيارة Ultralytics YOLO الصفحة. يمكنك أيضًا معرفة المزيد عن بنيات الكشف عن الكائنات لاكتساب فهم أوسع للمجال. وللحصول على فهم شامل لمصطلحات الذكاء الاصطناعي والرؤية الحاسوبية، يمكنك الرجوع إلى مسرد المصطلحاتUltralytics .