اكتشف ImageNet، مجموعة البيانات الرائدة التي تغذي التقدم في مجال الرؤية الحاسوبية مع أكثر من 14 مليون صورة، والتي تدعم أبحاث الذكاء الاصطناعي ونماذجه وتطبيقاته.
ImageNet هي مجموعة بيانات تأسيسية كبيرة جدًا تُستخدم على نطاق واسع في أبحاث الرؤية الحاسوبية وتطويرها. وهي تتألف من أكثر من 14 مليون صورة تم شرحها يدويًا للإشارة إلى الكائنات المصورة، مرتبة وفقًا للتسلسل الهرمي لشبكة WordNet. مع وجود أكثر من 20,000 فئة (مجموعة متلازمات)، توفر ImageNet موردًا ثريًا ومتنوعًا لتدريب وتقييم نماذج التعلم الآلي (ML) ، خاصةً لمهام مثل تصنيف الصور والتعرف على الصور. وقد كان حجمها الهائل وشروحها التفصيلية حاسماً في تطوير هذا المجال. يمكنك معرفة المزيد حول استخدام مجموعة البيانات مع نماذج Ultralytics على صفحة وثائق مجموعة بيانات ImageNet.
شكّل تقديم ImageNet لحظة محورية للتعلم العميق (DL)، خاصة في مجال الرؤية الحاسوبية. فقبل ImageNet، كان الافتقار إلى مجموعات بيانات كبيرة ومتنوعة وجيدة التسمية يمثل عائقًا كبيرًا. مكنت ImageNet من تدريب نماذج أعمق وأكثر تعقيدًا، مثل الشبكات العصبية التلافيفية (CNNs)، مما أدى إلى تحقيق اختراقات كبيرة. استخدم تحدي ImageNet السنوي للتعرّف على الصور على نطاق واسع (ILSVRC)، الذي استمر من عام 2010 إلى عام 2017، مجموعة فرعية من ImageNet وأصبح المعيار القياسي لتقييم خوارزميات تصنيف الصور واكتشاف الأجسام. وقد أثرت نماذج مثل AlexNet وResNet، التي حققت أحدث النتائج على ImageNet، تأثيرًا كبيرًا على هياكل السيرة الذاتية الحديثة.
يتمثل التطبيق الأساسي ل ImageNet في العمل كمعيار قياسي لتقييم نماذج وخوارزميات الرؤية الحاسوبية الجديدة. بالإضافة إلى القياس المعياري، يُستخدم على نطاق واسع في نماذج ما قبل التدريب.
في حين أن ImageNet واسعة وممتازة لمهام التصنيف، فإن مجموعات البيانات الأخرى تخدم أغراضًا مختلفة. على سبيل المثال، تُستخدم مجموعة بيانات COCO (الكائنات الشائعة في السياق) على نطاق واسع لاكتشاف الكائنات وتجزئتها وتسميتها التوضيحية حيث تقدم شروحًا أكثر تفصيلاً مثل أقنعة المثيل والمربعات المحددة لعدد أقل من فئات الكائنات مقارنةً ب ImageNet. وبالمثل، يوفّر Open Images V7 مربعات محدّدة لعدد كبير من فئات الكائنات. غالبًا ما يعتمد اختيار مجموعة البيانات على مهمة الرؤية الحاسوبية المحددة، مثل التصنيف أو الكشف أو التجزئة. يساعد استكشاف مجموعات بيانات الرؤية الحاسوبية المختلفة في اختيار أنسبها لمشروع ما.