Makine öğreniminde Yanlılık-Varyans Ödünleşiminde ustalaşın. Optimum model performansı için doğruluk ve genellemeyi dengeleme tekniklerini öğrenin!
Yanlılık-Varyans Değişimi, denetimli Makine Öğreniminde (ML), yalnızca eğitildikleri veriler üzerinde değil, aynı zamanda yeni, görülmemiş veriler üzerinde de iyi performans gösteren modeller oluşturma zorluğuyla ilgilenen merkezi bir kavramdır. Bir modelin yapabileceği iki tür hata arasındaki doğal gerilimi tanımlar: aşırı basit varsayımlardan kaynaklanan hatalar (önyargı) ve eğitim verilerine aşırı duyarlılıktan kaynaklanan hatalar (varyans). İyi bir genelleme elde etmek, bu iki hata kaynağı arasında dikkatli bir denge kurmayı gerektirir.
Yanlılık, karmaşık bir gerçek dünya problemine potansiyel olarak daha basit bir modelle yaklaşıldığında ortaya çıkan hatayı ifade eder. Yüksek yanlılığa sahip bir model, potansiyel olarak karmaşık örüntüleri göz ardı ederek veriler hakkında güçlü varsayımlarda bulunur. Bu durum, modelin verilerdeki altta yatan eğilimleri yakalayamadığı durumlarda yetersiz uyuma yol açarak hem eğitim verilerinde hem de test verilerinde düşük performansa neden olabilir. Örneğin, basit doğrusal regresyon kullanarak son derece eğri bir ilişkiyi modellemeye çalışmak muhtemelen yüksek yanlılıkla sonuçlanacaktır. Yanlılığın azaltılması genellikle Derin Öğrenmede (DL) bulunan daha sofistike algoritmaların kullanılması veya özellik mühendisliği yoluyla daha ilgili özelliklerin eklenmesi gibi model karmaşıklığının artırılmasını içerir.
Varyans, modelin eğitim verilerinde mevcut olan gürültü de dahil olmak üzere belirli dalgalanmalara karşı çok hassas olması nedeniyle ortaya çıkan hatayı ifade eder. Yüksek varyansa sahip bir model, eğitim verilerini çok iyi öğrenir, genel kalıpları öğrenmek yerine esasen ezberler. Bu durum, modelin eğitim verilerinde son derece iyi performans gösterdiği ancak genelleme yapmayı öğrenemediği için yeni, görülmemiş verilerde kötü performans gösterdiği aşırı uyuma yol açar. Çok sayıda parametreye sahip derin Sinir Ağları (NN) veya yüksek dereceli polinom regresyon gibi karmaşık modeller yüksek varyansa daha yatkındır. Varyansı azaltma teknikleri arasında modeli basitleştirmek, daha çeşitli eğitim verileri toplamak (bkz . Veri Toplama ve Açıklama kılavuzu) veya düzenli hale getirme gibi yöntemler kullanmak yer alır.
Yanlılık-Varyans Değiş tokuşunun özü, model karmaşıklığı ile ilgili olarak yanlılık ve varyans arasındaki ters ilişkidir. Bir modeli daha karmaşık hale getirerek önyargıyı azalttığınızda (örneğin, bir sinir ağına katmanlar ekleyerek), tipik olarak varyansını artırırsınız. Tersine, varyansı azaltmak için bir modeli basitleştirmek genellikle önyargısını artırır. İdeal model, görülmeyen veriler üzerinde toplam hatayı (önyargı, varyans ve indirgenemez hatanın bir kombinasyonu) en aza indiren tatlı noktayı bulur. Bu kavram, "The Elements of Statistical Learning" gibi metinlerde ayrıntılı olarak açıklandığı üzere istatistiksel öğrenmenin temelini oluşturur.
Yanlılık-Varyans Ödünleşimini başarılı bir şekilde yönetmek, etkili makine öğrenimi modelleri geliştirmenin anahtarıdır. Çeşitli teknikler yardımcı olabilir:
Yanlılık-Varyans Ödünleşimini YZ'de tartışılan diğer yanlılık türlerinden ayırt etmek çok önemlidir:
Yanlılık-Varyans Değişimi, karmaşıklık ve genelleme ile ilgili model hatasının istatistiksel özelliklerine odaklanırken ( Doğruluk veya mAP gibi metrikleri etkiler), Yapay Zeka Yanlılığı, Veri Seti Yanlılığı ve Algoritmik Yanlılık adalet, eşitlik ve temsil konularıyla ilgilidir. Ödünleşimin ele alınması, tahmin performansını optimize etmeyi amaçlarken (bkz. YOLO Performans Ölçütleri kılavuzu), diğer önyargıların ele alınması etik ve eşitlikçi sonuçlar sağlamayı amaçlamaktadır. Ultralytics HUB gibi araçlar, hem performans hem de potansiyel veri sorunlarıyla ilgili hususların izlenmesine dolaylı olarak yardımcı olan veri kümelerinin ve eğitim süreçlerinin(Bulut Eğitimi) yönetilmesine yardımcı olabilir.