اكتشف بساطة وقوة مصنفات باييز الساذجة لتصنيف النصوص، والبرمجة اللغوية العصبية اللغوية، واكتشاف الرسائل غير المرغوب فيها، وتحليل المشاعر في الذكاء الاصطناعي وتعلم الآلة.
تشير مصنفات بايز الساذجة إلى عائلة من المصنفات الاحتمالية البسيطة والفعالة في الوقت نفسه والتي تعتمد على تطبيق نظرية بايز مع افتراض استقلالية قوية ("ساذجة") بين السمات. على الرغم من هذا التبسيط، تُستخدم مصنفات بايز الساذجة على نطاق واسع في التعلم الآلي (ML) نظرًا لكفاءتها وسهولة تنفيذها وأدائها الجيد بشكل مدهش في العديد من سيناريوهات العالم الحقيقي، خاصة في المهام المتعلقة بالنصوص. وهي خيار شائع للنماذج الأساسية في مشاكل التصنيف.
تتمثل الفكرة الأساسية وراء سذاجة باييز في حساب احتمالية انتماء نقطة بيانات إلى فئة معينة، بالنظر إلى سماتها. يأتي الجزء "الساذج" من الافتراض الأساسي بأن جميع الميزات التي تساهم في التصنيف مستقلة عن بعضها البعض، بالنظر إلى الفئة. على سبيل المثال، عند تصنيف بريد إلكتروني على أنه بريد مزعج أو غير مزعج، تفترض الخوارزمية أن وجود كلمة "مجاني" مستقل عن وجود كلمة "نقود"، بالنظر إلى أن البريد الإلكتروني هو بريد مزعج. على الرغم من أن هذا الافتراض نادرًا ما يكون صحيحًا في الواقع (غالبًا ما يكون للكلمات في اللغة تبعيات)، إلا أنه يبسّط العملية الحسابية بشكل كبير، مما يجعل الخوارزمية سريعة وتتطلب بيانات تدريب أقل مقارنةً بالنماذج الأكثر تعقيدًا. وهي تنتمي إلى فئة خوارزميات التعلّم تحت الإشراف.
توجد العديد من الاختلافات في باييز الساذج المصممة خصيصًا لأنواع مختلفة من البيانات:
يمكن العثور على تفاصيل حول هذه المتغيرات غالبًا في وثائق مكتبة التعلم الآلي، مثل قسم Scikit-learn Naive Bayes.
تتفوق مصنفات بايز الساذجة في تطبيقات مختلفة، على الرغم من بساطتها:
المزايا:
العيوب:
ساذج بايز هو مصنف احتمالي يحسب الاحتمالات الصريحة للتصنيفات. وهذا يتناقض مع نماذج مثل آلات دعم المتجهات (SVM)، التي تجد مستوى فائق مثالي لفصل الفئات، أو أشجار القرار التي تستخدم بنية شبيهة بالشجرة من القواعد. في حين أن آلات SVMs غالبًا ما يكون أداؤها أفضل عندما تكون تفاعلات الميزات مهمة وتكون الفئات منفصلة جيدًا، وتوفر أشجار القرار قابلية تفسير عالية، تظل نماذج "باييف باي" الساذجة خط أساس قوي، خاصةً بالنسبة للبيانات النصية، نظرًا لسرعتها وكفاءتها، حتى عندما لا يتم استيفاء افتراض الاستقلالية بشكل مثالي. توفر أدوات مثل Ultralytics HUB منصات لإدارة مختلف مشاريع التعلّم الآلي المختلفة، على الرغم من أنها تركز عادةً على نماذج التعلّم العميق للرؤية الحاسوبية بدلاً من خوارزميات التعلّم الآلي الكلاسيكية مثل Naive Bayes.