تعرّف على YOLO-World، وهو نموذج مبتكر للكشف عن الكائنات يمكنه تحديد الكائنات من خلال المطالبات النصية. استكشف كيفية عمل YOLO-World وتطبيقاته، واحصل على تدريب عملي من خلال مثال برمجي سريع.
غالبا ما تتضمن مشاريع رؤية الكمبيوتر قضاء الكثير من الوقت في التعليق على البيانات وتدريب نماذج الكشف عن الكائنات . ولكن ، قد يكون هذا قريبا شيئا من الماضي. إصدار مختبر الذكاء الاصطناعي من تينسنت YOLO-World ، نموذج للكشف عن الكائنات في الوقت الفعلي ، مفتوح المفردات ، في 31 يناير 2024. YOLO-World هو نموذج بدون لقطة ، مما يعني أنه يمكنك تشغيل استدلالات اكتشاف الكائنات على الصور دون الحاجة إلى تدريبها.
تتمتع نماذج اللقطة الصفرية بالقدرة على تغيير الطريقة التي نتعامل بها مع تطبيقات رؤية الكمبيوتر. في هذه المدونة ، سنستكشف كيف YOLO-World Works واستخداماته المحتملة ومشاركة مثال عملي على التعليمات البرمجية لتبدأ.
يمكنك تمرير مطالبة صورة ونص تصف الكائنات التي تبحث عنها من خلال YOLO-نموذج العالم. على سبيل المثال ، إذا كنت مهتما بالعثور على "شخص يرتدي قميصا أحمر" داخل صورة ، YOLO-العالم يأخذ هذه المدخلات ويحصل على العمل.
تجمع الهندسة المعمارية الفريدة للنموذج بين ثلاثة عناصر رئيسية:
ال YOLO يقوم الكاشف بمسح صورة الإدخال الخاصة بك لتحديد الكائنات المحتملة. يحول برنامج تشفير النص وصفك إلى تنسيق يمكن للنموذج فهمه. ثم يتم دمج هذين الدفقين من المعلومات من خلال RepVL-PAN باستخدام اندماج متعدد المستويات عبر الطرائق. يتيح YOLO-العالم بدقة الكشف وتحديد موقع الكائنات الموصوفة في مطالبتك داخل الصورة.
واحدة من أكبر مزايا استخدام YOLO-العالم هو أنك لست مضطرا لتدريب النموذج لفئة معينة. لقد تعلمت بالفعل من أزواج من الصور والنصوص ، لذلك فهي تعرف كيفية العثور على الأشياء بناء على الأوصاف. يمكنك تجنب ساعات من جمع البيانات والتعليق على البيانات والتدريب على وحدات معالجة الرسومات باهظة الثمن وما إلى ذلك.
فيما يلي بعض الفوائد الأخرى لاستخدام YOLO-عالم:
YOLO- يمكن استخدام النماذج العالمية لمجموعة متنوعة من التطبيقات. دعنا نستكشف بعضها.
يتم فحص المنتجات المصنعة على خط التجميع بصريا بحثا عن العيوب قبل تعبئتها. غالبا ما يتم اكتشاف العيوب يدويا ، الأمر الذي يستغرق وقتا ويمكن أن يؤدي إلى أخطاء. يمكن أن تسبب هذه الأخطاء مشاكل مثل ارتفاع التكاليف والحاجة إلى الإصلاحات أو الاستدعاءات. للمساعدة في ذلك ، تم إنشاء كاميرات خاصة للرؤية الآلية وأنظمة الذكاء الاصطناعي لإجراء هذه الفحوصات.
YOLO- النماذج العالمية هي تقدم كبير في هذا المجال. يمكنهم العثور على عيوب في المنتجات حتى عندما لا يتم تدريبهم على هذه المشكلة المحددة باستخدام قدراتهم الصفرية. على سبيل المثال ، يمكن لمصنع تصنيع زجاجات المياه التعرف بسهولة بين زجاجة مختومة بشكل صحيح بغطاء زجاجة مقابل زجاجة حيث تم تفويت غطاء أو خلل في الاستخدام YOLO-عالم.
YOLO- تسمح النماذج العالمية للروبوتات بالتفاعل مع البيئات غير المألوفة. بدون تدريبهم على أشياء محددة قد تكون موجودة في الغرفة ، لا يزال بإمكانهم تحديد الأشياء الموجودة. لذلك ، لنفترض أن الروبوت يدخل غرفة لم يكن فيها من قبل. مع أ YOLO- نموذج العالم ، لا يزال بإمكانه التعرف على الأشياء وتحديدها مثل الكراسي أو الطاولات أو المصابيح ، على الرغم من أنه لم يتم تدريبه بشكل خاص على هذه العناصر.
بالإضافة إلى اكتشاف الأشياء ، YOLO-يمكن للعالم أيضا تحديد ظروف تلك الأشياء ، وذلك بفضل ميزة "الاكتشاف السريع". على سبيل المثال ، في الروبوتات الزراعية ، يمكن استخدامه لتحديد الثمار الناضجة مقابل الثمار غير الناضجة عن طريق برمجة الروبوت لاكتشافها.
تتضمن صناعة السيارات العديد من الأجزاء المتحركة ، و YOLO-العالم يمكن استخدامها لتطبيقات السيارات المختلفة. على سبيل المثال ، عندما يتعلق الأمر بصيانة السيارات ، YOLO- قدرة العالم على التعرف على مجموعة واسعة من الكائنات دون وضع علامات يدوية أو تدريب مسبق مكثف مفيد للغاية. YOLO- يمكن استخدام العالم لتحديد قطع غيار السيارات التي تحتاج إلى استبدال. يمكنه حتى أتمتة مهام مثل فحوصات الجودة أو اكتشاف العيوب أو القطع المفقودة في السيارات الجديدة.
تطبيق آخر هو اكتشاف الأجسام صفر طلقة في السيارات ذاتية القيادة. YOLO- يمكن لقدرات الكشف عن الطلقات الصفرية في العالم تحسين قدرة السيارة ذاتية القيادة على اكتشاف وتصنيف الأشياء على الطريق ، مثل المشاة وإشارات المرور والمركبات الأخرى ، في الوقت الفعلي. من خلال القيام بذلك ، يمكن أن يساعد في اكتشاف العقبات ومنع الحوادث من أجل رحلة أكثر أمانا.
يعد تحديد الأشياء على الرفوف في متاجر البيع بالتجزئة جزءا مهما من تتبع المخزون والحفاظ على المخزون وأتمتة العمليات. Ultralytics YOLO- قدرة العالم على التعرف على مجموعة واسعة من الكائنات دون وضع العلامات اليدوية أو التدريب المسبق المكثف مفيد للغاية لإدارة المخزون.
على سبيل المثال ، في إدارة المخزون ، YOLO- يمكن للعالم تحديد العناصر الموجودة على الرف وتصنيفها بسرعة ، مثل العلامات التجارية المختلفة لمشروبات الطاقة. يمكن لمتاجر البيع بالتجزئة الاحتفاظ بمخزون دقيق وإدارة مستويات المخزون بكفاءة وتسهيل عمليات سلسلة التوريد.
جميع التطبيقات فريدة من نوعها وتظهر مدى انتشارها YOLO-العالم يمكن استخدامها. بعد ذلك ، دعنا نتدرب على YOLO-العالم وإلقاء نظرة على مثال الترميز.
كما ذكرنا من قبل ، YOLO- يمكن استخدام العالم للكشف عن أجزاء مختلفة من السيارة للصيانة. يتضمن تطبيق رؤية الكمبيوتر الذي يكتشف أي إصلاحات مطلوبة التقاط صورة للسيارة ، وتحديد أجزاء السيارة ، وفحص كل جزء من السيارة بحثا عن التلف ، والتوصية بالإصلاحات. سيستخدم كل جزء من هذا النظام تقنيات وأساليب الذكاء الاصطناعي مختلفة. لغرض الإرشادات التفصيلية لهذه التعليمات البرمجية ، دعنا نركز على الجزء عند اكتشاف قطع غيار السيارات.
مع YOLO-العالم ، يمكنك تحديد قطع غيار السيارات المختلفة في صورة في أقل من 5 دقائق. يمكنك توسيع هذا الرمز لتجربة تطبيقات مختلفة باستخدام YOLO-العالم كذلك! للبدء ، سنحتاج إلى تثبيت النقطة Ultralytics الحزمة كما هو موضح أدناه.
لمزيد من الإرشادات وأفضل الممارسات المتعلقة بعملية التثبيت ، تحقق من Ultralytics دليل التثبيت . أثناء تثبيت الحزم المطلوبة ل YOLOv8، إذا واجهت أي صعوبات، فألق نظرة على دليل المشكلات الشائعة للحصول على حلول ونصائح.
بمجرد تثبيت الحزمة المطلوبة ، يمكننا تنزيل صورة من الإنترنت لتشغيل استنتاجاتنا عليها. سنستخدم الصورة أدناه.
بعد ذلك ، سنقوم باستيراد الحزمة المطلوبة ، وتهيئة نموذجنا ، وتعيين الفئات التي نبحث عنها في صورة الإدخال الخاصة بنا. هنا ، نحن مهتمون بالفئات التالية: السيارة ، العجلة ، باب السيارة ، مرآة السيارة ، ولوحة الترخيص.
سنستخدم بعد ذلك طريقة التنبؤ ، مع توفير مسار الصورة جنبا إلى جنب مع معلمات الحد الأقصى لعدد الاكتشافات ، وعتبات التقاطع عبر الاتحاد (IoU) والثقة (conf) لتشغيل استدلال على الصورة. أخيرا ، يتم حفظ الكائنات المكتشفة في ملف باسم "result.jpg".
سيتم حفظ صورة الإخراج التالية في ملفاتك.
إذا كنت تفضل معرفة ما YOLO-العالم يمكن الاستغناء عن الترميز ، يمكنك الذهاب إلى YOLO-World Demo page ، قم بتحميل صورة إدخال ، وأدخل الفئات المخصصة.
اقرأ صفحة المستندات على YOLO-World لمعرفة كيفية حفظ النموذج مع الفئات المخصصة بحيث يمكن استخدامه مباشرة لاحقا دون إدخال فئات مخصصة بشكل متكرر.
إذا ألقيت نظرة على صورة الإخراج مرة أخرى ، فستلاحظ أنه لم يتم اكتشاف "باب السيارة" المخصص للفئة. على الرغم من إنجازاتها العظيمة ، YOLO-العالم له قيود معينة. لمكافحة هذه القيود واستخدام YOLO-نموذج العالم بشكل فعال ، من المهم استخدام الأنواع الصحيحة من المطالبات النصية.
إليك بعض الأفكار حول هذا الموضوع:
العام YOLO- نماذج العالم ، يمكن تحويلها إلى أداة قوية من خلال قدراتها المتقدمة في الكشف عن الأشياء ، فهي توفر كفاءة ودقة كبيرة وتساعد على أتمتة المهام المختلفة عبر التطبيقات المختلفة ، مثل مثال تحديد قطع غيار السيارات التي ناقشناها عمليا.
لا تتردد في استكشاف مستودع GitHub الخاص بنا لمعرفة المزيد حول مساهماتنا في رؤية الكمبيوتر الذكاء الاصطناعي. إذا كنت مهتما بكيفية قيام الذكاء الاصطناعي بإعادة تشكيل قطاعات مثل تكنولوجيا الرعاية الصحية ، فراجع صفحات الحلول الخاصة بنا. الاحتمالات مع الابتكارات مثل YOLO-العالم يبدو أنه لا نهاية له!