الشيك الأخضر
تم نسخ الرابط إلى الحافظة

تشغيل رؤية الكمبيوتر مفتوحة المصدر مع HuggingFaceمحولات

انغمس في الرؤية الحاسوبية مفتوحة المصدر مع HuggingFace! تعرّف على التعلّم التحويلي والتحويلات واستكشف أكثر من 8000 نموذج. انضم إلى ميرف نويان للتعرف على الرؤى والعروض التوضيحية العملية، وتمكين المطورين من الابتكار في استكشاف الذكاء الاصطناعي.

بينما نواصل استكشاف النقاط البارزة من YOLO حدث رؤية 2023 (YV23 ) ، دعنا نلتقي ب Merve Noyan ، مهندس مناصرة المطورين في HuggingFace، منصة البرمجة اللغوية العصبية الرائدة مع نماذج مدربة مسبقا للتطوير الفعال لتطبيقات اللغة. في حديثها ، شاركت Merve بعض الأفكار المذهلة في عالم رؤية الكمبيوتر مفتوحة المصدر. 

انضم إلينا ونحن نأخذك في رحلة عبر الكون الرائع للتعلم التحويلي والمحولات والنظام البيئي لرؤية الكمبيوتر مفتوح المصدر .

كشف النقاب عن نقل التعلم: ملخص سريع

بدأت Merve الأمور بكتاب تمهيدي سريع حول نقل التعلم ، العصا السحرية التي تسمح لنا بنقل المعرفة من شبكة عصبية إلى أخرى. تخيل تدريب نموذج على الميزات العالمية في الطبقات المبكرة ، مثل الحواف والزوايا ، ثم ضبطه لمهام محددة. هذا هو جوهر نقل التعلم وتقليل تبعيات البيانات وتعزيز الدقة.

سلطت ميرف الضوء على العمود الفقري التلافيفي الكلاسيكي مثل ResNet و Inception ، مما مهد الطريق للرحلة التحويلية المقبلة.

أدخل المحولات: كشف النقاب عن لغز

ما الذي يجعل المحولات مميزة؟ شبهت ميرف الأمر باللغز ، حيث عرضت كيف تختلف عن النماذج التقليدية القائمة على الالتفاف. تكمن الصلصة السرية في قدرتهم على أداء التعلم تحت الإشراف الذاتي ، والتقاط الميزات دون الحاجة إلى بيانات مصنفة. كانت Vision Transformer و Data Efficient Transformer و CLIP و SWIM CLIP من بين مجموعة النماذج المرصعة بالنجوم القائمة على المحولات التي قدمتها. 

وضع بعض الأرضية المشتركة مع Ultralytics تقدم منظمة الصحة العالمية الدعم لنموذج محول مصمم للكشف عن الكائنات. يتميز هذا الطراز ببرنامج تشفير مختلط فعال ، واختيار استعلام مدرك ل IOU ، وسرعة استدلال قابلة للتعديل. والجدير بالذكر أنه يلتزم بالنمط المألوف للآخرين Ultralytics YOLOv8 النماذج ، وتقديم خيارات للتنبؤ والتدريب والتحقق من الصحة والتصدير.

متجرك الشامل

ثم بحثت ميرف في كنز HuggingFace، مع أكثر من 8000 نموذج لمهام رؤية الكمبيوتر الكلاسيكية و 10000 نموذج للتطبيقات متعددة الوسائط. ال HuggingFace يضم Hub مجموعة بيانات ضخمة من 3,000 + ، مما يجعله ملعبا للمطورين والمتحمسين على حد سواء. أكدت Merve على التجربة السلسة ، وذلك بفضل HuggingFaceواجهة برمجة تطبيقات متسقة ، تقدم نماذج جاهزة للاستخدام لحالات الاستخدام المختلفة.

التدريب العملي على السحر مع HuggingFace

تحول الحديث إلى عروض عملية ، حيث أظهر كيف يمكن للمرء أن يعمل بسهولة مع النماذج. من إنشاء النماذج والمعالجات إلى الضبط الدقيق باستخدام واجهة برمجة تطبيقات Trainer ، أوضحت Merve أن HuggingFace مكتبة المحولات هي أفضل صديق للمطور. حتى أنها قدمت واجهة برمجة تطبيقات Pipeline ، وهي المفضلة الشخصية ، مما يبسط سير العمل للمستخدمين.

الشكل 1. ميرفي نويان تقدم عرضًا في YV23 في Google لحرم الشركات الناشئة في مدريد.

لمحة عن التطبيقات

اختتمت Merve الحديث بلمحة عن بعض التطبيقات الرائعة ، بما في ذلك نموذج Plot للإجابة على الأسئلة المرئية ، و Blip للتعليق على الصور ، ونموذج Segment Anything القوي لتجزئة الصورة. ال HuggingFace سلطت واجهة برمجة تطبيقات Pipeline API الخاصة بالنظام البيئي الضوء ، مما يجعل من السهل استخدام النماذج دون الغوص بعمق في الجوانب الفنية.

كان الكرز في الأعلى هو عرض Merve لخلق أوهام بصرية مع Elysian Diffusion ، وهي تجربة آسرة تضيف لمسة ممتعة إلى عالم الذكاء الاصطناعي.

باختصار!

في الختام ، تركنا حديث ميرف مصدر إلهام وشغف لاستكشاف الاحتمالات اللانهائية لرؤية الكمبيوتر مفتوحة المصدر. HuggingFace لقد جعل الذكاء الاصطناعي حقا في متناول الجميع وممتعا ومثيرا ، مما مكن المطورين من إطلاق العنان لإبداعهم. إليك مستقبل مجتمع المصادر المفتوحة والابتكارات المذهلة التي يحملها! 

شاهد الحديث كاملا هنا

شعار الفيسبوكشعار تويترشعار لينكد إنرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي