Sözlük

Naive Bayes

Yapay zeka ve makine öğreniminde metin sınıflandırma, NLP, spam algılama ve duygu analizi için Naive Bayes sınıflandırıcılarının basitliğini ve gücünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Naive Bayes, özellikler arasında güçlü ("naif") bir bağımsızlık varsayımı ile Bayes Teoremi 'nin uygulanmasına dayanan basit ama etkili bir olasılıksal sınıflandırıcı ailesini ifade eder. Bu basitleştirmeye rağmen, Naive Bayes sınıflandırıcıları verimlilikleri, uygulama kolaylıkları ve özellikle metinle ilgili görevler olmak üzere birçok gerçek dünya senaryosunda şaşırtıcı derecede iyi performansları nedeniyle Makine Öğreniminde (ML) yaygın olarak kullanılmaktadır. Sınıflandırma problemlerinde temel modeller için popüler bir seçimdir.

Temel Kavram: "Naif" Varsayım

Naive Bayes'in arkasındaki temel fikir, özellikleri göz önüne alındığında bir veri noktasının belirli bir sınıfa ait olma olasılığını hesaplamaktır. "Naif" kısmı, sınıflandırma işlemine katkıda bulunan tüm özelliklerin, sınıf göz önüne alındığında birbirinden bağımsız olduğu temel varsayımından gelir. Örneğin, bir e-postayı spam veya spam değil olarak sınıflandırırken, algoritma, e-postanın spam olduğu göz önüne alındığında, "ücretsiz" kelimesinin varlığının "para" kelimesinin varlığından bağımsız olduğunu varsayar. Bu varsayım gerçekte nadiren doğru olsa da (bir dildeki kelimelerin genellikle bağımlılıkları vardır), hesaplamayı büyük ölçüde basitleştirerek algoritmayı hızlı hale getirir ve daha karmaşık modellere kıyasla daha az eğitim verisi gerektirir. Denetimli öğrenme algoritmaları kategorisine aittir.

Naive Bayes Sınıflandırıcı Türleri

Naive Bayes'in farklı veri türlerine göre uyarlanmış çeşitli varyasyonları mevcuttur:

  • Gaussian Naive Bayes: Özelliklerin Gaussian (normal) bir dağılım izlediğini varsayar. Genellikle özellikler sürekli değerlere sahip olduğunda kullanılır.
  • Multinomial Naive Bayes: Metin sınıflandırmasındaki kelime sayıları gibi ayrık sayılar için yaygın olarak kullanılır. Frekansları veya sayıları temsil eden özelliklerle iyi çalışır.
  • Bernoulli Naive Bayes: İkili/boolean özellikler için uygundur (örneğin, bir kelimenin bir belgede geçip geçmediği).

Bu varyantlarla ilgili ayrıntılar genellikle Scikit-learn Naive Bayes bölümü gibi ML kütüphane belgelerinde bulunabilir.

Gerçek Dünya Uygulamaları

Naive Bayes sınıflandırıcıları, basitliklerine rağmen çeşitli uygulamalarda üstünlük sağlar:

  1. Spam Filtreleme: Klasik kullanım durumlarından biri. E-posta hizmetleri, veri kümesinde tanımlanan belirli kelimelerin veya kalıpların sıklığına göre e-postaları "spam" veya "spam değil" olarak sınıflandırmak için Naive Bayes kullanır. Bu yaklaşımla ilgili daha fazla ayrıntı "A Practical Guide to Naive Bayes Text Classification" gibi kılavuzlarda bulunabilir.
  2. Metin Sınıflandırma ve Duygu Analizi: Doğal Dil İşleme'de (NLP) haber makalelerini konuya göre kategorize etme(belge sınıflandırma), bir metnin türünü belirleme veya duygu analizi yapma (bir incelemenin olumlu mu yoksa olumsuz mu olduğunu belirleme) gibi görevler için yaygın olarak kullanılır.

Avantajlar ve Dezavantajlar

Avantajlar:

  • Hızlı eğitilir ve tahmin edilir.
  • Nispeten az miktarda eğitim verisi gerektirir.
  • Metin gibi yüksek boyutlu verilerde (birçok özellik) bile iyi performans gösterir.
  • Uygulaması ve anlaşılması basit.

Dezavantajlar:

  • Güçlü bağımsızlık varsayımı gerçek dünya verilerinde sıklıkla ihlal edilir ve potansiyel olarak doğruluğu sınırlandırır.
  • Özelliklerin nasıl dağıtıldığına duyarlı olabilir (örneğin, Gauss varsayımı uymayabilir).
  • Sürekli özellikler için, veriler varsayılan dağılımı takip etmezse performans etkilenebilir.

Diğer Sınıflandırıcılarla Karşılaştırma

Naive Bayes, sınıflandırmalar için açık olasılıkları hesaplayan olasılıksal bir sınıflandırıcıdır. Bu, sınıfları ayırmak için optimum bir hiper düzlem bulan Destek Vektör Makineleri (SVM) veya ağaç benzeri bir kural yapısı kullanan Karar Ağaçları gibi modellerle tezat oluşturur. SVM'ler genellikle özellik etkileşimleri önemli olduğunda ve sınıflar iyi ayrıldığında daha iyi performans gösterirken ve Karar Ağaçları yüksek yorumlanabilirlik sunarken, Naive Bayes, bağımsızlık varsayımı mükemmel bir şekilde karşılanmadığında bile hızı ve verimliliği nedeniyle özellikle metin verileri için güçlü bir temel olmaya devam etmektedir. Ultralytics HUB gibi araçlar, çeşitli makine öğrenimi projelerini yönetmek için platformlar sağlar, ancak genellikle Naive Bayes gibi klasik makine öğrenimi algoritmalarından ziyade bilgisayarla görme için derin öğrenme modellerine odaklanır.

Tümünü okuyun