مسرد المصطلحات

إيمدج نت

اكتشف ImageNet، مجموعة البيانات الرائدة التي تغذي التقدم في مجال الرؤية الحاسوبية مع أكثر من 14 مليون صورة، والتي تدعم أبحاث الذكاء الاصطناعي ونماذجه وتطبيقاته.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

ImageNet هي مجموعة بيانات تأسيسية كبيرة جدًا تُستخدم على نطاق واسع في أبحاث الرؤية الحاسوبية وتطويرها. وهي تتألف من أكثر من 14 مليون صورة تم شرحها يدويًا للإشارة إلى الكائنات المصورة، مرتبة وفقًا للتسلسل الهرمي لشبكة WordNet. مع وجود أكثر من 20,000 فئة (مجموعة متلازمات)، توفر ImageNet موردًا ثريًا ومتنوعًا لتدريب وتقييم نماذج التعلم الآلي (ML) ، خاصةً لمهام مثل تصنيف الصور والتعرف على الصور. وقد كان حجمها الهائل وشروحها التفصيلية حاسماً في تطوير هذا المجال. يمكنك معرفة المزيد حول استخدام مجموعة البيانات مع نماذج Ultralytics على صفحة وثائق مجموعة بيانات ImageNet.

الأهمية والملاءمة

شكّل تقديم ImageNet لحظة محورية للتعلم العميق (DL)، خاصة في مجال الرؤية الحاسوبية. فقبل ImageNet، كان الافتقار إلى مجموعات بيانات كبيرة ومتنوعة وجيدة التسمية يمثل عائقًا كبيرًا. مكنت ImageNet من تدريب نماذج أعمق وأكثر تعقيدًا، مثل الشبكات العصبية التلافيفية (CNNs)، مما أدى إلى تحقيق اختراقات كبيرة. استخدم تحدي ImageNet السنوي للتعرّف على الصور على نطاق واسع (ILSVRC)، الذي استمر من عام 2010 إلى عام 2017، مجموعة فرعية من ImageNet وأصبح المعيار القياسي لتقييم خوارزميات تصنيف الصور واكتشاف الأجسام. وقد أثرت نماذج مثل AlexNet وResNet، التي حققت أحدث النتائج على ImageNet، تأثيرًا كبيرًا على هياكل السيرة الذاتية الحديثة.

تطبيقات ImageNet

يتمثل التطبيق الأساسي ل ImageNet في العمل كمعيار قياسي لتقييم نماذج وخوارزميات الرؤية الحاسوبية الجديدة. بالإضافة إلى القياس المعياري، يُستخدم على نطاق واسع في نماذج ما قبل التدريب.

  • التدريب المسبق لتعلم النقل: تتعلم النماذج التي تم تدريبها على ImageNet ميزات بصرية عامة مفيدة لمجموعة واسعة من مهام الرؤية الأخرى. تسمح هذه التقنية، المعروفة باسم التعلّم التحوّلي، للمطوّرين بتكييف النماذج المدرّبة مسبقاً (مثل تلك المتوفرة في Ultralytics HUB) لتطبيقات محددة باستخدام مجموعات بيانات مخصصة أصغر بكثير، مما يقلل بشكل كبير من وقت التدريب ومتطلبات البيانات. العديد من Ultralytics YOLO على سبيل المثال، تستفيد من الأوزان المدربة مسبقًا على مجموعات بيانات كبيرة.
  • تطوير الأبحاث: تستمر ImageNet في دعم الأبحاث في مجالات مثل تعلُّم التمثيل وتكييف المجال وفهم الأعمال الداخلية للشبكات العصبية العميقة.

أمثلة من العالم الحقيقي

  1. تحليل الصور الطبية: على الرغم من أن ImageNet لا تحتوي على صور طبية، إلا أن النماذج المدربة مسبقًا عليها كثيرًا ما تُستخدم كنقطة انطلاق لمهام تحليل الصور الطبية. يمكن ضبط قدرات استخراج السمات العامة المكتسبة من ImageNet على مجموعات بيانات أصغر من الأشعة السينية أو الأشعة المقطعية أو التصوير بالرنين المغناطيسي للمساعدة في اكتشاف الحالات الشاذة مثل الأورام أو الكسور، كما هو موضح في تطبيقات مثل استخدام YOLO للكشف عن الأورام.
  2. المركبات ذاتية القيادة: تعتبر نماذج التعرف على الأشياء أساسية للمركبات ذاتية القيادة. وقد تم تطوير العديد من النماذج الأساسية المستخدمة في التعرف على المشاة والسيارات وإشارات المرور وإشارات المرور وإشارات الطرق في البداية وقياسها باستخدام ImageNet، مما يدل على دور مجموعة البيانات في بناء أنظمة الإدراك للذكاء الاصطناعي في السيارات ذاتية القيادة.

ImageNet مقابل مجموعات البيانات الأخرى

في حين أن ImageNet واسعة وممتازة لمهام التصنيف، فإن مجموعات البيانات الأخرى تخدم أغراضًا مختلفة. على سبيل المثال، تُستخدم مجموعة بيانات COCO (الكائنات الشائعة في السياق) على نطاق واسع لاكتشاف الكائنات وتجزئتها وتسميتها التوضيحية حيث تقدم شروحًا أكثر تفصيلاً مثل أقنعة المثيل والمربعات المحددة لعدد أقل من فئات الكائنات مقارنةً ب ImageNet. وبالمثل، يوفّر Open Images V7 مربعات محدّدة لعدد كبير من فئات الكائنات. غالبًا ما يعتمد اختيار مجموعة البيانات على مهمة الرؤية الحاسوبية المحددة، مثل التصنيف أو الكشف أو التجزئة. يساعد استكشاف مجموعات بيانات الرؤية الحاسوبية المختلفة في اختيار أنسبها لمشروع ما.

قراءة الكل