Sözlük

Lojistik Regresyon

İkili sınıflandırma için Lojistik Regresyonun gücünü keşfedin. Makine öğrenimindeki uygulamalarını, temel kavramlarını ve alaka düzeyini öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Lojistik Regresyon, öncelikle ikili sınıflandırma problemleri için kullanılan temel bir istatistiksel yöntem ve Makine Öğreniminde (ML) bir köşe taşı algoritmasıdır. "Regresyon" içeren adına rağmen, bir girdinin belirli bir kategoriye ait olma olasılığını tahmin etmek için kullanılan bir sınıflandırma algoritmasıdır. Denetimli Öğrenme şemsiyesi altında yer alır, yani etiketli eğitim verilerinden öğrenir. Basitliği, yorumlanabilirliği ve verimliliği nedeniyle, özellikle birçok tahmine dayalı modelleme görevinde temel model olarak yaygın bir şekilde kullanılmaktadır.

Lojistik Regresyon Nasıl Çalışır?

Sürekli sayısal değerleri tahmin eden Doğrusal Regresyonun aksine, Lojistik Regresyon olasılıkları tahmin eder. Bir veya daha fazla bağımsız değişkene (özellik) dayalı olarak ikili bir sonucun (örneğin, Evet/Hayır, 1/0, Doğru/Yanlış) olasılığını modeller. Bunu, giriş özelliklerinin doğrusal bir kombinasyonuna genellikle Sigmoid fonksiyonu olan lojistik bir fonksiyon uygulayarak başarır. Sigmoid fonksiyonu herhangi bir gerçek değerli sayıyı 0 ile 1 arasında bir değere eşler ve bu da olasılık olarak yorumlanabilir. Daha sonra bu olasılığı bir sınıf tahminine dönüştürmek için bir eşik (genellikle 0,5) kullanılır (örneğin, olasılık > 0,5 ise sınıf 1'i tahmin et, aksi takdirde sınıf 0'ı tahmin et). Süreç, genellikle Gradyan İnişi gibi optimizasyon teknikleri kullanılarak eğitim sırasında her özellik için model ağırlıklarının veya katsayılarının öğrenilmesini içerir.

Lojistik Regresyon Türleri

Öncelikle ikili sınıflandırma için bilinse de, Lojistik Regresyon genişletilebilir:

  1. İkili Lojistik Regresyon: Bağımlı değişkenin yalnızca iki olası sonucu olduğunda kullanılan en yaygın türdür (örneğin, spam/spam değil, kötü huylu/iyi huylu).
  2. Multinomial Lojistik Regresyon: Bağımlı değişken üç veya daha fazla nominal kategoriye sahip olduğunda kullanılır (sıralanmamış sonuçlar, örneğin çiçek türünün tahmin edilmesi: Iris setosa, versicolor veya virginica). Multinomial sınıflandırmayı tartışan kaynaklarda daha fazla ayrıntı bulunabilir.
  3. Ordinal Lojistik Regresyon: Bağımlı değişken üç veya daha fazla sıralı kategoriye sahip olduğunda uygulanır (sıralı sonuçlar, örneğin müşteri memnuniyetinin 'düşük', 'orta' veya 'yüksek' olarak derecelendirilmesi). Ordinal regresyon teknikleri daha fazla bilgi sağlar.

Gerçek Dünya Uygulamaları

Lojistik Regresyon çeşitli alanlarda kullanılmaktadır:

  • Tıbbi Teşhis: Kan basıncı, BMI veya yaş gibi tanısal ölçümlere dayanarak bir hastanın bir hastalığa (örneğin diyabet, kalp hastalığı) sahip olma olasılığını tahmin etme. Sağlık Hizmetlerinde Yapay Zeka ve Tıbbi Görüntü Analizinde tanı modelleri oluşturmada yaygın bir araçtır. Radyolojide yapay zeka alanındaki bazı araştırmalar da benzer ilkeleri kullanmaktadır.
  • Spam E-posta Tespiti: E-posta içeriğinden, gönderen bilgilerinden veya başlık verilerinden çıkarılan özelliklere dayalı olarak e-postaların 'spam' veya 'spam değil' olarak sınıflandırılması. Bu, birçok NLP eğitiminde tartışılan ikili sınıflandırmanın klasik bir örneğidir.
  • Kredi Puanlaması: Bir borçlunun finansal geçmişine ve özelliklerine dayalı olarak bir kredide temerrüde düşme olasılığını değerlendirmek, bankalara kredi verme kararlarında yardımcı olmak. Bu, Finans alanında yapay zeka için önemli bir uygulamadır.
  • Duygu Analizi: Bir müşteri yorumu veya sosyal medya gönderisi gibi bir metin parçasında ifade edilen duyarlılığı (örneğin, olumlu, olumsuz, nötr) belirleme. Duygu Analizi uygulamaları hakkında daha fazla bilgi edinin.
  • Müşteri Kaybını Tahmin Etme: Bir müşterinin bir hizmeti veya ürünü kullanmayı bırakma olasılığını tahmin etme.

Uygunluk ve Değerlendirme

Daha geniş Yapay Zeka (YZ) bağlamında, Lojistik Regresyon sınıflandırma görevleri için önemli bir temel model olarak hizmet vermektedir. Katsayıları, her bir özelliğin sonuç üzerindeki etkisini anlamak için yorumlanabilir ve modelin Açıklanabilirliğine (XAI) önemli ölçüde katkıda bulunur. Sinir Ağları (NN), Destek Vektör Makineleri (SVM) gibi daha karmaşık modeller ve hatta gelişmiş mimariler Ultralytics YOLONesne Algılama için kullanılan Lojistik Regresyon, özellikle Bilgisayarla Görme (CV) gibi alanlarda karmaşık veri kümelerinde genellikle daha yüksek performans elde ederken, daha basit problemler için veya tahmine dayalı modellemede ilk adım olarak değerini korumaktadır. YOLO11 YOLOv8 gibi YOLO modellerinin karşılaştırılması, karmaşık görevlerdeki gelişmeleri vurgulamaktadır.

Model performansı tipik olarak Doğruluk, Kesinlik, Geri Çağırma, F1 Puanı, Karışıklık Matrisi ve ROC Eğrisi Altındaki Alan (AUC) gibi ölçütler kullanılarak değerlendirilir. Scikit-learn gibi kütüphaneler, genellikle aşağıdaki gibi çerçeveler üzerine inşa edilmiş sağlam uygulamalar sağlar PyTorch veya TensorFlow. YOLO için kullanılanlar da dahil olmak üzere bu değerlendirmemetriklerini anlamakYOLO performans metrikleri kılavuzu), makine öğreniminde çok önemlidir. Çeşitli ML modellerini yönetmek ve dağıtmak için Ultralytics HUB gibi platformlar, bulut eğitim seçenekleri de dahil olmak üzere kapsamlı araçlar sunar.

Güçlü ve Zayıf Yönler

Güçlü yönler:

  • Basitlik ve Verimlilik: Uygulaması, yorumlaması kolay ve eğitmesi hesaplama açısından ucuzdur.
  • Yorumlanabilirlik: Model katsayıları, girdi özelliklerinin sonuç (log-odds) üzerindeki etkisinin önemi ve yönü ile doğrudan ilgilidir.
  • İyi bir Temel: Sınıflandırma görevleri için sağlam bir başlangıç noktası sağlar.
  • Çıktılar Olasılıklar: Sıralama veya eşik ayarlamaları için yararlı olabilecek sonuçlar için olasılık puanları sağlar.

Zayıflıklar:

  • Doğrusallık Varsayımı: Bağımsız değişkenler ile sonucun log-olasılığı arasında doğrusal bir ilişki olduğunu varsayar. Karmaşık, doğrusal olmayan örüntüleri iyi yakalayamayabilir.
  • Aykırı Değerlere Duyarlılık: Verilerdeki aykırı değerlerden etkilenebilir.
  • Yetersiz Uyuma Eğilimli: Karar sınırlarının yüksek oranda doğrusal olmadığı karmaşık veri kümeleri için yeterince güçlü olmayabilir ve potansiyel olarak yetersiz uyuma yol açabilir.
  • Özellik Mühendisliği Gerektirir: Performans genellikle büyük ölçüde etkili özellik mühendisliğine bağlıdır.

Özet olarak, Lojistik Regresyon, makine öğreniminde temel ve yaygın olarak kullanılan bir sınıflandırma algoritmasıdır, özellikle ikili sınıflandırma problemleri için basitliği ve yorumlanabilirliği ile değerlidir ve daha karmaşık modeller için bir ölçüt olarak kullanılır.

Tümünü okuyun