الشيك الأخضر
تم نسخ الرابط إلى الحافظة

الحصول على التدريب العملي مع YOLO-عالم

تعرّف على YOLO-World، وهو نموذج مبتكر للكشف عن الكائنات يمكنه تحديد الكائنات من خلال المطالبات النصية. استكشف كيفية عمل YOLO-World وتطبيقاته، واحصل على تدريب عملي من خلال مثال برمجي سريع.

غالبا ما تتضمن مشاريع رؤية الكمبيوتر قضاء الكثير من الوقت في التعليق على البيانات وتدريب نماذج الكشف عن الكائنات . ولكن ، قد يكون هذا قريبا شيئا من الماضي. إصدار مختبر الذكاء الاصطناعي من تينسنت YOLO-World ، نموذج للكشف عن الكائنات في الوقت الفعلي ، مفتوح المفردات ، في 31 يناير 2024. YOLO-World هو نموذج بدون لقطة ، مما يعني أنه يمكنك تشغيل استدلالات اكتشاف الكائنات على الصور دون الحاجة إلى تدريبها.

تتمتع نماذج اللقطة الصفرية بالقدرة على تغيير الطريقة التي نتعامل بها مع تطبيقات رؤية الكمبيوتر. في هذه المدونة ، سنستكشف كيف YOLO-World Works واستخداماته المحتملة ومشاركة مثال عملي على التعليمات البرمجية لتبدأ.

نظرة خاطفة على YOLO-عالم

يمكنك تمرير مطالبة صورة ونص تصف الكائنات التي تبحث عنها من خلال YOLO-نموذج العالم. على سبيل المثال ، إذا كنت مهتما بالعثور على "شخص يرتدي قميصا أحمر" داخل صورة ، YOLO-العالم يأخذ هذه المدخلات ويحصل على العمل.

تجمع الهندسة المعمارية الفريدة للنموذج بين ثلاثة عناصر رئيسية:

  • كاشف يعتمد على Ultralytics YOLOv8 نموذج الكشف عن الكائنات ، لتحليل المحتوى المرئي للصورة
  • برنامج تشفير نصي تم تدريبه مسبقا بواسطة CLIP من OpenAI ، مصمم خصيصا لفهم موجه النص الخاص بك. 
  • شبكة ، شبكة تجميع مسار لغة الرؤية (RepVL-PAN) ، والتي تدمج بيانات الصورة المعالجة مع البيانات النصية.

ال YOLO يقوم الكاشف بمسح صورة الإدخال الخاصة بك لتحديد الكائنات المحتملة. يحول برنامج تشفير النص وصفك إلى تنسيق يمكن للنموذج فهمه. ثم يتم دمج هذين الدفقين من المعلومات من خلال RepVL-PAN باستخدام اندماج متعدد المستويات عبر الطرائق. يتيح YOLO-العالم بدقة الكشف وتحديد موقع الكائنات الموصوفة في مطالبتك داخل الصورة.

مثال على النتائج من YOLO-عالم.

فوائد الاختيار YOLO-عالم

واحدة من أكبر مزايا استخدام YOLO-العالم هو أنك لست مضطرا لتدريب النموذج لفئة معينة. لقد تعلمت بالفعل من أزواج من الصور والنصوص ، لذلك فهي تعرف كيفية العثور على الأشياء بناء على الأوصاف. يمكنك تجنب ساعات من جمع البيانات والتعليق على البيانات والتدريب على وحدات معالجة الرسومات باهظة الثمن وما إلى ذلك.

فيما يلي بعض الفوائد الأخرى لاستخدام YOLO-عالم:

  • الأداء في الوقت الحقيقي - YOLO-العالم يدعم الأداء في الوقت الحقيقي تماما مثل الأصلي YOLO معمار. إنه مثالي للتطبيقات التي تتطلب اكتشافا فوريا للأشياء مثل المركبات المستقلة وأنظمة المراقبة.
  • تجزئة المثيل - YOLO- يمكن للعالم تحديد الأشياء وفصلها بدقة في الصور ، حتى لو لم يتم تدريس هذه الأشياء على وجه التحديد أثناء تدريبها.
  • كفاءة- YOLO-يجمع العالم بين الدقة العالية والكفاءة الحسابية ، مما يجعله عمليا لتطبيقات العالم الحقيقي. تجعل بنيته الانسيابية الكشف السريع عن الأشياء ممكنا دون مطالب مفرطة على قوة المعالجة

تطبيقات YOLO-عالم

YOLO- يمكن استخدام النماذج العالمية لمجموعة متنوعة من التطبيقات. دعنا نستكشف بعضها.

مراقبة الجودة في التصنيع

يتم فحص المنتجات المصنعة على خط التجميع بصريا بحثا عن العيوب قبل تعبئتها. غالبا ما يتم اكتشاف العيوب يدويا ، الأمر الذي يستغرق وقتا ويمكن أن يؤدي إلى أخطاء. يمكن أن تسبب هذه الأخطاء مشاكل مثل ارتفاع التكاليف والحاجة إلى الإصلاحات أو الاستدعاءات. للمساعدة في ذلك ، تم إنشاء كاميرات خاصة للرؤية الآلية وأنظمة الذكاء الاصطناعي لإجراء هذه الفحوصات. 

YOLO- النماذج العالمية هي تقدم كبير في هذا المجال. يمكنهم العثور على عيوب في المنتجات حتى عندما لا يتم تدريبهم على هذه المشكلة المحددة باستخدام قدراتهم الصفرية. على سبيل المثال ، يمكن لمصنع تصنيع زجاجات المياه التعرف بسهولة بين زجاجة مختومة بشكل صحيح بغطاء زجاجة مقابل زجاجة حيث تم تفويت غطاء أو خلل في الاستخدام YOLO-عالم.

مثال على فحص غطاء الزجاجة.

الروبوتات

YOLO- تسمح النماذج العالمية للروبوتات بالتفاعل مع البيئات غير المألوفة. بدون تدريبهم على أشياء محددة قد تكون موجودة في الغرفة ، لا يزال بإمكانهم تحديد الأشياء الموجودة. لذلك ، لنفترض أن الروبوت يدخل غرفة لم يكن فيها من قبل. مع أ YOLO- نموذج العالم ، لا يزال بإمكانه التعرف على الأشياء وتحديدها مثل الكراسي أو الطاولات أو المصابيح ، على الرغم من أنه لم يتم تدريبه بشكل خاص على هذه العناصر.

بالإضافة إلى اكتشاف الأشياء ، YOLO-يمكن للعالم أيضا تحديد ظروف تلك الأشياء ، وذلك بفضل ميزة "الاكتشاف السريع". على سبيل المثال ، في الروبوتات الزراعية ، يمكن استخدامه لتحديد الثمار الناضجة مقابل الثمار غير الناضجة عن طريق برمجة الروبوت لاكتشافها.

الذكاء الاصطناعي في صناعة السيارات

تتضمن صناعة السيارات العديد من الأجزاء المتحركة ، و YOLO-العالم يمكن استخدامها لتطبيقات السيارات المختلفة. على سبيل المثال ، عندما يتعلق الأمر بصيانة السيارات ، YOLO- قدرة العالم على التعرف على مجموعة واسعة من الكائنات دون وضع علامات يدوية أو تدريب مسبق مكثف مفيد للغاية. YOLO- يمكن استخدام العالم لتحديد قطع غيار السيارات التي تحتاج إلى استبدال. يمكنه حتى أتمتة مهام مثل فحوصات الجودة أو اكتشاف العيوب أو القطع المفقودة في السيارات الجديدة.

تطبيق آخر هو اكتشاف الأجسام صفر طلقة في السيارات ذاتية القيادة. YOLO- يمكن لقدرات الكشف عن الطلقات الصفرية في العالم تحسين قدرة السيارة ذاتية القيادة على اكتشاف وتصنيف الأشياء على الطريق ، مثل المشاة وإشارات المرور والمركبات الأخرى ، في الوقت الفعلي. من خلال القيام بذلك ، يمكن أن يساعد في اكتشاف العقبات ومنع الحوادث من أجل رحلة أكثر أمانا. 

مثال على اكتشاف الأشياء على الطريق.

إدارة المخزون لمتاجر البيع بالتجزئة

يعد تحديد الأشياء على الرفوف في متاجر البيع بالتجزئة جزءا مهما من تتبع المخزون والحفاظ على المخزون وأتمتة العمليات. Ultralytics YOLO- قدرة العالم على التعرف على مجموعة واسعة من الكائنات دون وضع العلامات اليدوية أو التدريب المسبق المكثف مفيد للغاية لإدارة المخزون. 

على سبيل المثال ، في إدارة المخزون ، YOLO- يمكن للعالم تحديد العناصر الموجودة على الرف وتصنيفها بسرعة ، مثل العلامات التجارية المختلفة لمشروبات الطاقة. يمكن لمتاجر البيع بالتجزئة الاحتفاظ بمخزون دقيق وإدارة مستويات المخزون بكفاءة وتسهيل عمليات سلسلة التوريد. 

جميع التطبيقات فريدة من نوعها وتظهر مدى انتشارها YOLO-العالم يمكن استخدامها. بعد ذلك ، دعنا نتدرب على YOLO-العالم وإلقاء نظرة على مثال الترميز.

رمز المشي من خلال

كما ذكرنا من قبل ، YOLO- يمكن استخدام العالم للكشف عن أجزاء مختلفة من السيارة للصيانة. يتضمن تطبيق رؤية الكمبيوتر الذي يكتشف أي إصلاحات مطلوبة التقاط صورة للسيارة ، وتحديد أجزاء السيارة ، وفحص كل جزء من السيارة بحثا عن التلف ، والتوصية بالإصلاحات. سيستخدم كل جزء من هذا النظام تقنيات وأساليب الذكاء الاصطناعي مختلفة. لغرض الإرشادات التفصيلية لهذه التعليمات البرمجية ، دعنا نركز على الجزء عند اكتشاف قطع غيار السيارات.

مع YOLO-العالم ، يمكنك تحديد قطع غيار السيارات المختلفة في صورة في أقل من 5 دقائق. يمكنك توسيع هذا الرمز لتجربة تطبيقات مختلفة باستخدام YOLO-العالم كذلك! للبدء ، سنحتاج إلى تثبيت النقطة Ultralytics الحزمة كما هو موضح أدناه.

# Install ultralytics package
pip install ultralytics

لمزيد من الإرشادات وأفضل الممارسات المتعلقة بعملية التثبيت ، تحقق من Ultralytics دليل التثبيت . أثناء تثبيت الحزم المطلوبة ل YOLOv8، إذا واجهت أي صعوبات، فألق نظرة على دليل المشكلات الشائعة للحصول على حلول ونصائح.

بمجرد تثبيت الحزمة المطلوبة ، يمكننا تنزيل صورة من الإنترنت لتشغيل استنتاجاتنا عليها. سنستخدم الصورة أدناه.

صورة الإدخال لدينا.

بعد ذلك ، سنقوم باستيراد الحزمة المطلوبة ، وتهيئة نموذجنا ، وتعيين الفئات التي نبحث عنها في صورة الإدخال الخاصة بنا. هنا ، نحن مهتمون بالفئات التالية: السيارة ، العجلة ، باب السيارة ، مرآة السيارة ، ولوحة الترخيص.

# Import YOLOWorld class from ultralytics module
from ultralytics import YOLOWorld

# Initialize the model with pre-trained weights
model = YOLOWorld('yolov8s-world')

# Set the classes you'd like to find in your image
model.set_classes(["car", "wheel", "car door", "car mirror", "license plate"])

سنستخدم بعد ذلك طريقة التنبؤ ، مع توفير مسار الصورة جنبا إلى جنب مع معلمات الحد الأقصى لعدد الاكتشافات ، وعتبات التقاطع عبر الاتحاد (IoU) والثقة (conf) لتشغيل استدلال على الصورة. أخيرا ، يتم حفظ الكائنات المكتشفة في ملف باسم "result.jpg".

# Run object detection for your custom classes on your image
results = model.predict('path_to_your_image.jpg', max_det=100, iou=0.01, conf=0.01)

# Save the results
results[0].save(filename='result.jpg')

سيتم حفظ صورة الإخراج التالية في ملفاتك.

صورة الإخراج لدينا.

إذا كنت تفضل معرفة ما YOLO-العالم يمكن الاستغناء عن الترميز ، يمكنك الذهاب إلى YOLO-World Demo page ، قم بتحميل صورة إدخال ، وأدخل الفئات المخصصة. 

اقرأ صفحة المستندات على YOLO-World لمعرفة كيفية حفظ النموذج مع الفئات المخصصة بحيث يمكن استخدامه مباشرة لاحقا دون إدخال فئات مخصصة بشكل متكرر.

هل لاحظت أنه لم يتم اكتشاف أبواب السيارة؟

إذا ألقيت نظرة على صورة الإخراج مرة أخرى ، فستلاحظ أنه لم يتم اكتشاف "باب السيارة" المخصص للفئة. على الرغم من إنجازاتها العظيمة ، YOLO-العالم له قيود معينة. لمكافحة هذه القيود واستخدام YOLO-نموذج العالم بشكل فعال ، من المهم استخدام الأنواع الصحيحة من المطالبات النصية. 

إليك بعض الأفكار حول هذا الموضوع:

  • YOLOقد لا يحتاج العالم إلى مستويات ثقة عالية للتنبؤات الدقيقة ، لذا فإن تقليل عتبات الثقة يمكن أن يحسن معدلات الكشف.
  • أضف فصولا لا تهتم بها. سيساعد ذلك في تحسين اكتشاف الكائن الأساسي عن طريق تقليل الإيجابيات الخاطئة للكائنات الثانوية.
  • يمكن أن يؤدي اكتشاف الأجسام الكبيرة أولا قبل التركيز على التفاصيل الأصغر إلى تحسين دقة الكشف.
  • اذكر الألوان في فصولك لاكتشاف الكائنات بناء على إشارات الألوان.
  • يمكن أن يساعد وصف أحجام الكائنات في المطالبات أيضا YOLO-العالم تحديد كائنات محددة بشكل أكثر دقة.
  • يمكن لطرق ما بعد المعالجة ، مثل تصفية التنبؤات حسب الحجم أو ضبط مستويات الثقة لكل فئة ، تحسين نتائج اكتشاف الكائنات بشكل أكبر.

الحدود لا حصر لها

العام YOLO- نماذج العالم ، يمكن تحويلها إلى أداة قوية من خلال قدراتها المتقدمة في الكشف عن الأشياء ، فهي توفر كفاءة ودقة كبيرة وتساعد على أتمتة المهام المختلفة عبر التطبيقات المختلفة ، مثل مثال تحديد قطع غيار السيارات التي ناقشناها عمليا.

لا تتردد في استكشاف مستودع GitHub الخاص بنا لمعرفة المزيد حول مساهماتنا في رؤية الكمبيوتر الذكاء الاصطناعي. إذا كنت مهتما بكيفية قيام الذكاء الاصطناعي بإعادة تشكيل قطاعات مثل تكنولوجيا الرعاية الصحية ، فراجع صفحات الحلول الخاصة بنا. الاحتمالات مع الابتكارات مثل YOLO-العالم يبدو أنه لا نهاية له!

شعار الفيسبوكشعار تويترشعار لينكد إنرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي