Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

ImageNet

استكشف ImageNet مجموعة البيانات الأساسية للتعلم العميق. تعرف على كيفية استخدامها في Ultralytics من خلال التعلم النقلي لتصنيف الصور بدقة عالية.

ImageNet قاعدة بيانات بصرية ضخمة مصممة للاستخدام في أبحاث برامج التعرف على الكائنات البصرية، وتُعتبر على نطاق واسع المحفز الذي أشعل ثورة التعلم العميق الحديثة . منظم وفقًا لتسلسل WordNet الهرمي، ImageNet ملايين الصور المصنفة عبر آلاف الفئات، مما يوفر حجمًا هائلاً من البيانات اللازمة لتدريب الشبكات العصبية المتطورة. بالنسبة للباحثين والمطورين في مجال الرؤية الحاسوبية، ImageNet معيارًا قياسيًا لتقييم أداء الخوارزميات، لا سيما في مهام مثل تصنيف الصور وتحديد مواقع الكائنات.

ImageNet وصعود شبكات CNN

اكتسبت مجموعة البيانات شهرة عالمية من خلال تحديImageNet للتعرف البصريImageNet (ILSVRC)، وهو مسابقة سنوية أقيمت بين عامي 2010 و 2017. تطلبت هذه المسابقة خوارزميات classify إلى واحدة من 1000 فئة بدقة عالية. حدثت نقطة تحول تاريخية في عام 2012 عندما حققت شبكة عصبية تلافيفية (CNN) المعروفة باسم AlexNet حققت معدل خطأ أقل بكثير من منافسيها. أظهر هذا الانتصار تفوق الشبكات العصبية العميقة على طرق استخراج الميزات التقليدية، مما أدى إلى بدء العصر الحالي للذكاء الاصطناعي. اليوم، تستمر البنى الحديثة مثل Ultralytics في البناء على المبادئ الأساسية التي تم وضعها خلال هذه التحديات.

دور التدريب المسبق والتعلم النقلي

أحد أهم مساهمات ImageNet دورها في التعلم النقلي. يتطلب تدريب شبكة عصبية عميقة من الصفر موارد حاسوبية هائلة وكميات هائلة من بيانات التدريب. لتجاوز ذلك، غالبًا ما يستخدم المطورون "نماذج مدربة مسبقًا" — شبكات تعلمت بالفعل استخراج تمثيلات غنية للميزات من ImageNet.

عندما يتم تدريب نموذج مسبقًا على ImageNet فإنه يتعلم كيفية تحديد العناصر المرئية الأساسية مثل الحواف والأنسجة والأشكال . يمكن بعد ذلك ضبط أوزان النموذج المكتسبة على مجموعة بيانات أصغر ومحددة لمهمة مختلفة. تعمل هذه العملية على تسريع دورات التطوير بشكل كبير وتحسين الأداء، خاصة عند استخدام أدوات مثل Ultralytics لتدريب النماذج المخصصة.

تطبيقات واقعية

ImageNet تأثير ImageNet إلى ما هو أبعد من البحث الأكاديمي ليشمل أنظمة الذكاء الاصطناعي العملية اليومية:

  • الدفع الآلي في متاجر البيع بالتجزئة: تعتمد الأنظمة التي تحدد تلقائيًا المنتجات أو السلع في أكشاك الدفع الذاتي على قدرات التصنيف التي تم صقلها على مجموعات بيانات ضخمة مثل ImageNet. من خلال التمييز بين العناصر المتشابهة بصريًا (مثل أنواع مختلفة من التفاح)، تعمل هذه الأنظمة على تبسيط الذكاء الاصطناعي في متاجر البيع بالتجزئة.
  • تنقيح المحتوى: تستخدم منصات التواصل الاجتماعي التعرف البصري لمسح ملايين الصور التي تم تحميلها تلقائيًا للبحث عن محتوى غير لائق. غالبًا ما تستمد القدرة الأساسية على التعرف على الأشياء والمشاهد من البنى الأساسية التي تم تدريبها في الأصل على ImageNet .

ImageNet COCO CIFAR-10

في حين أن ImageNet المعيار الذهبي للتصنيف، من المهم تمييزه عن مجموعات البيانات الشائعة الأخرى:

  • ImageNet COCO: مجموعة بيانات COCO الأشياء الشائعة في السياق) هي المعيار الأساسي لاكتشاف الأشياء وتقسيمها. بينما ImageNet على "ماذا" يوجد في الصورة (التصنيف)، COCO على "أين" توجد الأشياء وحدودها الدقيقة. .
  • ImageNet ImageNet ImageNet CIFAR-10: CIFAR-10 عبارة عن مجموعة بيانات أصغر بكثير تتكون من صور صغيرة بحجم 32x32 بكسل. غالبًا ما تستخدم لأغراض النماذج الأولية السريعة أو لأغراض تعليمية، بينما تمثل ImageNet تحديًا احترافيًا وعالي الدقة للنماذج الجاهزة للإنتاج.

استخدام نماذج ImageNet المدربة مسبقاً

تتيح أطر عمل الذكاء الاصطناعي الحديثة للمستخدمين الاستفادة من ImageNet دون عناء. يوضح المثال أدناه كيفية تحميل نموذج تصنيف YOLO26، الذي يأتي مدربًا مسبقًا على ImageNet classify .

from ultralytics import YOLO

# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")

يستخدم هذا المقتطف yolo26n-cls.pt نموذج، الذي تعلم 1000 ImageNet ، مما يسمح له بالتعرف على الفور على محتويات الصورة المدخلة دون أي تدريب إضافي.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن