استكشف أجهزة الكشف عن الكائنات أحادية المرحلة للذكاء الاصطناعي عالي السرعة في الوقت الفعلي. تعرف على كيفية تقديم Ultralytics دقة وكفاءة فائقة للذكاء الاصطناعي المتطور ونشره.
أجهزة الكشف عن الأجسام أحادية المرحلة هي فئة قوية من بنى التعلم العميق المصممة لأداء مهام الكشف عن الأجسام بسرعة وكفاءة استثنائيتين. على عكس أجهزة الكشف عن الأجسام التقليدية ثنائية المرحلة، التي تقسم عملية الكشف إلى خطوات منفصلة لاقتراح المنطقة والتصنيف اللاحق، فإن النماذج أحادية المرحلة تحلل الصورة بأكملها في مسار واحد. من خلال تأطير الكشف كمشكلة انحدار مباشرة، تقوم هذه الشبكات في وقت واحد بتوقع إحداثيات الصندوق المحيط واحتمالات الفئة مباشرة من وحدات البكسل المدخلة. يقلل هذا النهج المبسط بشكل كبير من العبء الحسابي، مما يجعل أجهزة الكشف أحادية المرحلة الخيار المفضل للتطبيقات التي تتطلب استنتاجًا ونشرًا في الوقت الفعلي على أجهزة الذكاء الاصطناعي المتطورة ذات الموارد المحدودة.
تتمحور بنية الكاشف أحادي المرحلة عادةً حول شبكة عصبية تلافيفية (CNN) تعمل كعمود فقري لاستخراج الميزات. عندما تمر الصورة عبر الشبكة، يُنشئ النموذج شبكة من خرائط الميزات التي تشفر المعلومات المكانية والدلالية.
اعتمدت التطبيقات المبكرة، مثل Single Shot MultiBox Detector (SSD)، على مربعات ربط محددة مسبقًا بمقاييس مختلفة لتحديد مواقع الكائنات. ومع ذلك، فإن التطورات الحديثة مثل Ultralytics YOLO11 و YOLO26 المتطورة قد تحولت إلى حد كبير نحو تصميمات خالية من المربعات المرجعية. هذه البنى الأحدث تتنبأ بمراكز الكائنات وأحجامها مباشرة، مما يلغي الحاجة إلى ضبط المعلمات الفائقة المعقدة المرتبطة بالمربعات المرجعية. يتكون الناتج النهائي من متجهات إحداثيات لتحديد الموقع و درجة ثقة تمثل مدى يقين النموذج بشأن الكائن المكتشف.
يساعد التمييز بين هاتين الفئتين الرئيسيتين في اختيار الأداة المناسبة لمهمة معينة:
كفاءة أجهزة الكشف أحادية المرحلة دفعت إلى اعتمادها على نطاق واسع في مختلف الصناعات التي تتطلب استجابة فورية:
يعد تنفيذ كاشف أحادي المرحلة أمرًا سهلاً باستخدام واجهات برمجة التطبيقات الحديثة عالية المستوى. لضمان دقة النتائج، غالبًا ما تتنبأ النماذج بعدة مربعات محتملة، والتي يتم ترشيحها بعد ذلك باستخدام تقنيات مثل القمع غير الأقصى (NMS) استنادًا إلى عتبات التقاطع فوق الاتحاد (IoU) ، على الرغم من أن النماذج الأحدث من طرف إلى طرف مثل YOLO26 تتعامل مع هذا الأمر بشكل أصلي.
يوضح Python التالي Python كيفية تحميل أحدث نموذج YOLO26 وإجراء الاستدلال على صورة:
from ultralytics import YOLO
# Load the YOLO26 model, the latest natively end-to-end one-stage detector
model = YOLO("yolo26n.pt")
# Run inference on an image URL to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes and labels
results[0].show()
ركز تطور أجهزة الكشف أحادية المرحلة على التغلب على المفاضلة بين "الدقة والسرعة". تم إدخال تقنيات مثل Focal Loss لمعالجة عدم التوازن بين الفئات أثناء التدريب، مما يضمن تركيز النموذج علىclassify بدلاً من الخلفية الوفيرة . علاوة على ذلك، يتيح دمج شبكات Feature Pyramid Networks (FPN) لهذه النماذج detect بمقاييس مختلفة بفعالية.
اليوم، يمكن للباحثين والمطورين تدريب هذه البنى المتقدمة بسهولة على مجموعات بيانات مخصصة باستخدام أدوات مثل Ultralytics التي تبسط سير العمل من تعليق البيانات إلى نشر النموذج. سواء كان ذلك في مجال الزراعة أو الرعاية الصحية، فإن إمكانية الوصول إلى أجهزة الكشف أحادية المرحلة تساهم في إتاحة قدرات الرؤية الحاسوبية القوية للجميع.