Sözlük

Model Ağırlıkları

Model ağırlıklarının makine öğrenimindeki önemini, tahminlerdeki rolünü ve Ultralytics YOLO adresinin yapay zeka görevleri için kullanımını nasıl basitleştirdiğini keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Model ağırlıkları, bir makine öğrenimi modelinin eğitim süreci sırasında öğrendiği temel parametrelerdir. Bu sayısal değerler, eğitim verilerinden edinilen bilgiyi temsil eder ve modelin yeni, görülmemiş veriler üzerinde nasıl tahminler veya kararlar verdiğinin temelini oluşturur. Esasen ağırlıklar, bir sinir ağındaki (NN) nöronlar arasında olduğu gibi, model içindeki bağlantıların gücünü ve önemini belirler.

Model Ağırlıklarını Anlama

Çok sayıda ayarlanabilir düğmesi olan karmaşık bir makine düşünün; model ağırlıkları bu düğmeler gibi hareket eder. Eğitim sırasında modele bir veri kümesinden örnekler gösterilir ve model tahminler yapar. Bu tahminler ile gerçek doğru cevaplar (temel gerçek) arasındaki fark bir kayıp fonksiyonu ile ölçülür. Stokastik Gradyan İnişi (SGD) veya Adam gibi bir optimizasyon algoritması daha sonra bu kaybı en aza indirmek için bu ağırlıkları sistematik olarak ayarlar. Bu işlem birçok iterasyon veya epok boyunca tekrarlanır ve ağırlıklar kademeli olarak iyileştirilir. Başlangıçta, ağırlıklar genellikle küçük rastgele değerlere ayarlanır, ancak eğitim yoluyla, verilerdeki altta yatan kalıpları yakalayan değerlere yakınsarlar. Ağırlıkları, eğitimden önce ayarlanan ve eğitim sırasında öğrenilmek yerine öğrenme sürecine rehberlik eden öğrenme oranı veya yığın boyutu gibi hiperparametrelerden ayırmak önemlidir. NN'lerde ağırlıkların yanında sıklıkla bulunan bir başka öğrenilmiş parametre türü olan önyargılar, bir nöronun temel aktivasyonunu temsil eder.

Model Ağırlıklarının Önemi

Model ağırlıkları, eğitim verilerinden öğrenilen kalıpları ve ilişkileri kodladıkları için kritik öneme sahiptir. İyi optimize edilmiş ağırlıklar, bir modelin daha önce karşılaşmadığı veriler üzerinde doğru tahminlerde bulunarak etkili bir şekilde genelleme yapmasını sağlar. Ağırlıkların kalitesi, modelin doğruluk ve sağlamlık gibi performans ölçümlerini doğrudan etkiler. Genellikle yetersiz veri veya aşırı uyum gibi sorunlar nedeniyle kötü eğitilmiş ağırlıklar, güvenilir olmayan tahminlerle sonuçlanır.

Birçok modern yapay zeka uygulamasında, özellikle de bilgisayarla görme (CV) alanında, modeller genellikle ImageNet veya COCO gibi büyük, genel veri kümeleri üzerinde önceden eğitilir. Elde edilen ağırlıklar geniş görsel özellikleri yakalar. Ultralytics YOLO modelleri için mevcut olanlar gibi bu önceden eğitilmiş ağırlıklar, daha sonra doğrudan çıkarım için veya belirli bir görev veya özel veri kümesi üzerinde ince ayar yapmak için bir başlangıç noktası olarak kullanılabilir. Aktarımlı öğrenme olarak bilinen bu teknik, eğitimi önemli ölçüde hızlandırır ve özellikle sınırlı özel verilerle genellikle daha iyi performans sağlar. Ultralytics HUB gibi platformları kullanarak modelleri belirli ağırlıklarla yönetebilir ve eğitebilirsiniz.

Gerçek Dünya Uygulamaları

Model ağırlıkları, sayısız yapay zeka uygulamasının arkasındaki motordur:

  1. Otonom Araçlarda Nesne Algılama: Gibi modeller Ultralytics YOLOv8 gerçek zamanlı video akışlarında arabalar, yayalar ve trafik işaretleri gibi nesneleri tanımlamak ve bulmak için öğrendikleri ağırlıkları kullanarak daha güvenli navigasyon sağlar. Ağırlıklar, modelin bu belirli nesneleri tanımak için piksel desenlerini nasıl yorumladığını belirler.
  2. Hastalık Tespiti için Tıbbi Görüntü Analizi: Sağlık hizmetlerinde, tıbbi görüntüler (X ışınları veya MRI'lar gibi) üzerinde eğitilen yapay zeka modelleri, Beyin Tümörü veri kümesi gibi veri kümelerini kullanarak beyin taramalarındaki potansiyel tümörleri tanımlamak gibi hastalıkların göstergesi olan ince anormallikleri tespit etmek için ağırlıklarını kullanır. Ağırlıklar, binlerce açıklamalı tıbbi görüntüden öğrenilen görsel özellikleri kodlar. Gibi araçlar Weights & Biases bu ağırlıkları üreten deneylerin izlenmesine yardımcı olabilir.
Tümünü okuyun