Sözlük

Yetersiz Uyum

Uzman ipuçları, stratejiler ve gerçek dünyadan örneklerle makine öğrenimi modellerinde yetersiz uyumun nasıl tespit edileceğini, önleneceğini ve ele alınacağını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Makine öğrenimi (ML) alanında, optimum model performansına ulaşmak, basitlik ve karmaşıklık arasında bir denge bulmayı gerektirir. Yetersiz uyum, bir modelin eğitim verilerinde bulunan altta yatan kalıpları yakalamak için çok basit olduğu yaygın bir sorundur. Bu, modelin etkili bir şekilde öğrenemediği anlamına gelir ve yalnızca eğitildiği veriler üzerinde değil, aynı zamanda yeni, görülmemiş veriler(test verileri veya gerçek dünya girdileri) üzerinde de düşük performansa yol açar. Yetersiz uyum gösteren bir model, verilerdeki ilişkileri doğru bir şekilde temsil etmek için gerekli kapasiteden veya eğitim süresinden yoksundur, bu da yüksek yanlılığa ve iyi genelleme yapamamasına neden olur.

Yetersiz Uyuma Ne Sebep Olur?

Uyumsuz bir modele çeşitli faktörler katkıda bulunabilir:

  • Yetersiz Model Karmaşıklığı: Seçilen model, verilerin karmaşıklığı için çok basit olabilir. Örneğin, doğrusal olmayan örüntülere sahip veriler için temel bir doğrusal regresyon modeli kullanmak veya çok az katmana veya nörona sahip bir sinir ağı (NN) kullanmak.
  • Yetersiz Özellik Mühendisliği: Modele sağlanan girdi özellikleri yeterince ilgili bilgi içermeyebilir veya altta yatan örüntüleri etkili bir şekilde temsil etmeyebilir.
  • Yetersiz Eğitim Verisi: Model, altta yatan kalıpları öğrenmek için yeterli örnek görmemiş olabilir. Bu durum özellikle karmaşık derin öğrenme modelleri için geçerlidir. Ultralytics veri kümeleri gibi platformlar aracılığıyla keşfedilebilecek çeşitli ve temsili verilere sahip olmak çok önemlidir.
  • Eğitimin Çok Kısa Sürmesi: Model eğitim süreci, verilerdeki örüntüleri öğrenmek için yeterli epoklara sahip olmadan önce durdurulabilir.
  • Aşırı Düzenlileştirme: Aşırı uyumu önlemek için kullanılan L1 veya L2 düzenlileştirme veya yüksek bırakma oranları gibi teknikler bazen modeli aşırı derecede kısıtlayabilir ve çok güçlü bir şekilde uygulandığında gerekli kalıpları öğrenmesini engelleyebilir.

Yetersiz Uyumun Belirlenmesi

Yetersiz uyum genellikle modelin eğitim sırasındaki ve sonrasındaki performansı değerlendirilerek teşhis edilir:

  • Yüksek Eğitim Hatası: Model, eğitildiği veriler üzerinde bile düşük performans gösterir. Doğruluk, kesinlik, geri çağırma veya F1 puanı gibi temel ölçümler düşüktür ve kayıp fonksiyonu değeri yüksek kalır.
  • Yüksek Doğrulama/Test Hatası: Model, görülmeyen doğrulama verilerinde veya test verilerinde de düşük performans gösterir. Eğitim ve doğrulama hatası arasındaki performans farkı genellikle küçüktür, ancak her iki hata da kabul edilemeyecek kadar yüksektir.
  • Öğrenme Eğrileri: Eğitim ve doğrulama kaybı/metriklerinin eğitim epoklarına karşı çizilmesi yetersiz uyumu ortaya çıkarabilir. Her iki eğri de yüksek bir hata seviyesinde plato çiziyorsa, model muhtemelen yetersiz uyum gösteriyordur. TensorBoard gibi araçları kullanarak bunları izleyebilir veya Weights & Biases. Belirli YOLO performans ölçümlerini anlamak da hayati önem taşır.

Yetersiz Uyumun Ele Alınması

Çeşitli stratejiler yetersiz uyumun üstesinden gelmeye yardımcı olabilir:

  • Model Karmaşıklığını Artırın: Daha fazla parametre, katman veya nöron içeren daha güçlü bir model mimarisi kullanın. Örneğin, daha basit bir CNN'den daha gelişmiş bir mimariye geçmek Ultralytics YOLO11nesne algılama görevleri için.
  • Özellik Mühendisliğini Geliştirin: Mevcut verilerden daha bilgilendirici özellikler oluşturun veya yeni ilgili veri kaynaklarını dahil edin.
  • Eğitim Süresini Artırın: Veri modellerini öğrenmesi için yeterli zaman tanımak amacıyla modeli daha fazla epok için eğitin. Rehberlik için model eğitimi ipuçlarını kontrol edin.
  • Düzenlemeyi Azaltın: Düzenli hale getirme tekniklerinin gücünü azaltın (örneğin, düzenli hale getirme parametresi lambda'yı düşürün, bırakma olasılığını azaltın).
  • Yeterli Veri Sağlayın: Daha fazla eğitim örneği toplayın. Daha fazla veri toplamak mümkün değilse, veri artırma gibi teknikler eğitim verilerinin çeşitliliğini yapay olarak artırabilir. Veri kümelerini yönetmek Ultralytics HUB gibi platformlar kullanılarak kolaylaştırılabilir.

Yetersiz Uyum ve Aşırı Uyum

Yetersiz uyum ve aşırı uyum aynı madalyonun iki yüzüdür ve model genellemesindeki başarısızlıkları temsil eder.

  • Yetersiz uyum: Model çok basittir (yüksek yanlılık). Verilerin altında yatan eğilimleri yakalayamaz, bu da hem eğitim hem de test setlerinde düşük performansa neden olur.
  • Aşırı uyum: Model çok karmaşıktır (yüksek varyans). Gürültü ve rastgele dalgalanmalar da dahil olmak üzere eğitim verilerini çok iyi öğrenir, bu da eğitim setinde mükemmel performansa, ancak görünmeyen verilerde düşük performansa yol açar.

ML'deki amaç, modelin gürültüyü ezberlemeden altta yatan gerçek örüntüleri öğrendiği, genellikle yanlılık-varyans ödünleşimi bağlamında tartışılan, yetersiz uyum ile aşırı uyum arasında tatlı bir nokta bulmaktır.

Gerçek Dünyadan Yetersiz Uyum Örnekleri

  1. Basit Görüntü Sınıflandırıcı: ImageNet'teki binlerce nesne kategorisini sınıflandırmak gibi karmaşık bir görüntü sınıflandırma görevi üzerinde çok basit bir Evrişimsel Sinir Ağını (CNN) (örneğin, yalnızca bir veya iki evrişimsel katmanla) eğitmek. Model muhtemelen yetersiz uyum gösterecektir çünkü sınırlı kapasitesi birçok sınıfı etkili bir şekilde ayırt etmek için gereken karmaşık özellikleri öğrenmesini engeller. Hem eğitim hem de doğrulama doğruluğu düşük kalacaktır.
  2. Temel Kestirimci Bakım: Sadece çalışma sıcaklığına bağlı olarak makine arızalarını tahmin etmek için basit bir doğrusal model kullanmak. Arızalar aslında titreşim, yaş, basınç ve sıcaklık gibi doğrusal olmayan faktörlerin karmaşık etkileşiminden etkileniyorsa, doğrusal model yetersiz kalacaktır. Gerçek karmaşıklığı yakalayamaz, zayıf tahminsel modelleme performansına yol açar ve arızaları doğru bir şekilde tahmin edemez. Daha karmaşık modellerin veya daha iyi özelliklerin kullanılması gerekli olacaktır. Gibi çerçeveler PyTorch veya TensorFlow daha sofistike modeller oluşturmak için araçlar sunar.
Tümünü okuyun