عزز دقة التعلم الآلي باستخدام هندسة الميزات الخبيرة. تعلّم تقنيات إنشاء الميزات المؤثرة وتحويلها واختيارها.
هندسة الميزات هي العملية الحاسمة لاختيار الميزات وتحويلها وإنشاء ميزات من البيانات الأولية لجعلها أكثر ملاءمة لنماذج التعلم الآلي (ML). وهي تتضمن استخدام معرفة المجال وتقنيات تحليل البيانات لصياغة المدخلات التي تمثل المشكلة الأساسية بشكل أفضل، مما يؤدي في النهاية إلى تحسين أداء النموذج ودقته وقابليته للتفسير. فكّر في الأمر على أنه إعداد أفضل المكونات للوصفة؛ فحتى أمهر الطهاة (أو النموذج) يعاني من مكونات رديئة الجودة(بيانات التدريب). غالبًا ما تعتبر هذه الخطوة واحدة من أكثر الأجزاء أهمية واستهلاكًا للوقت في سير عمل التعلم الآلي.
نادراً ما تكون البيانات الأولية التي يتم جمعها من العالم الحقيقي جاهزة للاستخدام المباشر في خوارزميات تعلّم الآلة. فقد تحتوي على قيم مفقودة، أو تناقضات، أو معلومات غير ذات صلة، أو قد تكون بتنسيقات غير مناسبة لاستهلاك النموذج (مثل البيانات النصية أو الفئوية). تعالج هندسة الميزات هذه المشكلات من خلال:
تندرج العديد من التقنيات تحت مظلة هندسة الميزات:
على الرغم من استخدامهما بالتبادل في كثير من الأحيان، إلا أن هندسة الميزات واستخراج الميزات لهما فروق دقيقة مميزة.
من حيث الجوهر، غالبًا ما يكون استخراج الميزة أداة تُستخدم ضمن عملية أوسع نطاقًا لهندسة الميزة.
في حين أن النماذج المتقدمة مثل Ultralytics YOLO تتفوق في مهام مثل اكتشاف الأجسام وتجزئة الصور من خلال التعلم التلقائي للسمات المرئية ذات الصلة من خلال بنيات الشبكات العصبية العميقة(العمود الفقري والرقبة والرأس)، تظل مبادئ هندسة السمات ذات صلة. على سبيل المثال، تُعد المعالجة المسبقة للصور المُدخَلة (على سبيل المثال، معادلة الرسم البياني للإضاءة المتفاوتة، أو تقليل الضوضاء باستخدام مكتبات مثل OpenCV، أو تطبيق عمليات تعزيز بيانات محددة مصممة خصيصًا لمجال المشكلة) قبل إدخالها في نموذج YOLO شكلاً من أشكال هندسة السمات التي يمكن أن تحسن من متانة وأداء النموذج. علاوةً على ذلك، يمكن هندسة مخرجات YOLO (مثل إحداثيات المربع المحدود، وفئات الكائنات، والأعداد) في ميزات للمهام النهائية أو دمجها مع مصادر بيانات أخرى لتحليل أكثر تعقيدًا، وربما تتم إدارتها داخل منصات مثل Ultralytics HUB التي تساعد في تنظيم مجموعات البيانات والنماذج. استكشف وثائق Ultralytics والدروس التعليمية لمزيد من المعلومات حول استخدام النماذج والتدريب المخصص والمعالجة المسبقة للبيانات المشروحة. يمكن لأدوات مثل Featuretools أن تساعد أيضًا في أتمتة أجزاء من عملية هندسة الميزات، بما يتماشى مع المفاهيم في التعلم الآلي الآلي (AutoML). تظل هندسة الميزات الفعّالة، حتى إلى جانب نماذج التعلم العميق القوية، جانبًا أساسيًا في ممارسات التعلم الآلي الآلي الناجحة.