Omurgaların derin öğrenmedeki rolünü keşfedin, ResNet ve ViT gibi en iyi mimarileri keşfedin ve gerçek dünyadaki yapay zeka uygulamalarını öğrenin.
Derin öğrenmede, özellikle bilgisayarla görme (CV) alanında, "omurga" bir sinir ağı (NN ) modelindeki ilk, temel katman kümesini ifade eder. Birincil amacı özellik çıkarımıdır: görüntü gibi ham girdi verilerini işlemek ve bunları kompakt, bilgilendirici bir temsile dönüştürmek. Genellikle özellik haritaları olarak adlandırılan bu temsil, girdideki temel desenleri, dokuları ve şekilleri yakalar. Omurgayı yapay zekanın gözleri olarak düşünün, üst düzey muhakeme gerçekleşmeden önce ilk yorumlamayı gerçekleştirir. Bu temel işlem, modelin sonraki görevler için görsel bilgileri anlama ve yorumlama konusundaki genel yeteneği açısından kritik öneme sahiptir.
Tipik bir omurga, genellikle konvolüsyonel katmanlar, havuzlama katmanları ( uzamsal boyutları azaltan) ve aktivasyon fonksiyonları (doğrusal olmayan) içeren bir dizi katmandan oluşur. Giriş verileri bu katmanlardan geçtikçe, ağ aşamalı olarak hiyerarşik özellikleri öğrenir. İlk katmanlar kenarlar ve köşeler gibi basit unsurları tespit edebilirken, daha derin katmanlar bu basit özellikleri birleştirerek daha karmaşık yapıları, nesnelerin parçalarını ve nihayetinde tüm nesneleri tanıyabilir. Omurga tarafından üretilen çıktı, orijinal girdideki önemli bilgileri özetleyen bir dizi üst düzey özellik haritasıdır. Bu süreç, anlamsal anlamını korurken verinin boyutluluğunu etkili bir şekilde azaltır ve birçok başarılı derin öğrenme modelinin temelini oluşturur.
Nesne algılama, örnek segmentasyonu veya poz tahmini gibi görevler için tasarlanmış sofistike bilgisayarla görme modellerinde omurga, temel özellik temsilini sağlar. Genellikle "boyun" (özellikleri rafine eden ve toplayan) ve "kafa" (nihai görev tahminini gerçekleştiren) olarak adlandırılan sonraki bileşenler, omurga tarafından çıkarılan özellikler üzerine inşa edilir. Örneğin, bir algılama kafası, algılanan nesnelerin etrafındaki sınırlayıcı kutuları ve bunlara karşılık gelen sınıfları tahmin etmek için bu rafine özellikleri kullanır. Omurga bu sonraki aşamalardan farklıdır; tek odak noktası giriş verilerinden güçlü, genellikle genel amaçlı bir özellik temsili oluşturmaktır. Yaygın bir uygulama, ImageNet gibi büyük ölçekli veri kümeleri üzerinde önceden eğitilmiş omurgaları kullanmak ve daha sonra transfer öğrenimini kullanarak belirli aşağı akış görevleri için ince ayar yapmak ve eğitim sürecini önemli ölçüde hızlandırmaktır.
Özellik çıkarımında kanıtlanmış etkinlikleri nedeniyle çeşitli köklü sinir ağı mimarileri sıklıkla omurga olarak kullanılmaktadır:
Omurga seçimi, çeşitli model karşılaştırmalarında vurgulandığı gibi, hız, hesaplama maliyeti(FLOP) ve doğruluk dahil olmak üzere bir modelin performans özelliklerini önemli ölçüde etkiler. Gibi çerçeveler PyTorch ve TensorFlowOpenCV gibi kütüphanelerle birlikte, bu omurgaları uygulamak ve kullanmak için temel araçlardır. Ultralytics HUB gibi platformlar, farklı omurgalara sahip modelleri kullanma sürecini daha da basitleştirir.
Omurgayı tüm sinir ağıyla veya diğer belirli bileşenlerle karıştırmamak önemlidir:
Omurgalar, sayısız yapay zeka uygulamasının temel bileşenleridir: