Sözlük

Omurga

Omurgaların derin öğrenmedeki rolünü keşfedin, ResNet ve ViT gibi en iyi mimarileri keşfedin ve gerçek dünyadaki yapay zeka uygulamalarını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Derin öğrenmede, özellikle bilgisayarla görme (CV) alanında, "omurga" bir sinir ağı (NN ) modelindeki ilk, temel katman kümesini ifade eder. Birincil amacı özellik çıkarımıdır: görüntü gibi ham girdi verilerini işlemek ve bunları kompakt, bilgilendirici bir temsile dönüştürmek. Genellikle özellik haritaları olarak adlandırılan bu temsil, girdideki temel desenleri, dokuları ve şekilleri yakalar. Omurgayı yapay zekanın gözleri olarak düşünün, üst düzey muhakeme gerçekleşmeden önce ilk yorumlamayı gerçekleştirir. Bu temel işlem, modelin sonraki görevler için görsel bilgileri anlama ve yorumlama konusundaki genel yeteneği açısından kritik öneme sahiptir.

Temel İşlevsellik

Tipik bir omurga, genellikle konvolüsyonel katmanlar, havuzlama katmanları ( uzamsal boyutları azaltan) ve aktivasyon fonksiyonları (doğrusal olmayan) içeren bir dizi katmandan oluşur. Giriş verileri bu katmanlardan geçtikçe, ağ aşamalı olarak hiyerarşik özellikleri öğrenir. İlk katmanlar kenarlar ve köşeler gibi basit unsurları tespit edebilirken, daha derin katmanlar bu basit özellikleri birleştirerek daha karmaşık yapıları, nesnelerin parçalarını ve nihayetinde tüm nesneleri tanıyabilir. Omurga tarafından üretilen çıktı, orijinal girdideki önemli bilgileri özetleyen bir dizi üst düzey özellik haritasıdır. Bu süreç, anlamsal anlamını korurken verinin boyutluluğunu etkili bir şekilde azaltır ve birçok başarılı derin öğrenme modelinin temelini oluşturur.

Bilgisayarlı Görme Modellerindeki Rolü

Nesne algılama, örnek segmentasyonu veya poz tahmini gibi görevler için tasarlanmış sofistike bilgisayarla görme modellerinde omurga, temel özellik temsilini sağlar. Genellikle "boyun" (özellikleri rafine eden ve toplayan) ve "kafa" (nihai görev tahminini gerçekleştiren) olarak adlandırılan sonraki bileşenler, omurga tarafından çıkarılan özellikler üzerine inşa edilir. Örneğin, bir algılama kafası, algılanan nesnelerin etrafındaki sınırlayıcı kutuları ve bunlara karşılık gelen sınıfları tahmin etmek için bu rafine özellikleri kullanır. Omurga bu sonraki aşamalardan farklıdır; tek odak noktası giriş verilerinden güçlü, genellikle genel amaçlı bir özellik temsili oluşturmaktır. Yaygın bir uygulama, ImageNet gibi büyük ölçekli veri kümeleri üzerinde önceden eğitilmiş omurgaları kullanmak ve daha sonra transfer öğrenimini kullanarak belirli aşağı akış görevleri için ince ayar yapmak ve eğitim sürecini önemli ölçüde hızlandırmaktır.

Yaygın Omurga Mimarileri

Özellik çıkarımında kanıtlanmış etkinlikleri nedeniyle çeşitli köklü sinir ağı mimarileri sıklıkla omurga olarak kullanılmaktadır:

Omurga seçimi, çeşitli model karşılaştırmalarında vurgulandığı gibi, hız, hesaplama maliyeti(FLOP) ve doğruluk dahil olmak üzere bir modelin performans özelliklerini önemli ölçüde etkiler. Gibi çerçeveler PyTorch ve TensorFlowOpenCV gibi kütüphanelerle birlikte, bu omurgaları uygulamak ve kullanmak için temel araçlardır. Ultralytics HUB gibi platformlar, farklı omurgalara sahip modelleri kullanma sürecini daha da basitleştirir.

Omurgayı İlgili Terimlerden Ayırt Etme

Omurgayı tüm sinir ağıyla veya diğer belirli bileşenlerle karıştırmamak önemlidir:

  • Tüm Sinir Ağı: Omurga, daha büyük bir ağ mimarisinin sadece bir parçası, tipik olarak ilk özellik çıkarma kısmıdır. Ağın tamamı, göreve özgü tahminlerden sorumlu boyun ve baş(lar)ı da içerir.
  • Algılama Başlığı: Bu, özellikleri (genellikle hem omurga hem de boyun tarafından işlenir) alan ve sınırlayıcı kutu koordinatlarını ve sınıf olasılıklarını çıkaran bir nesne algılama modelinin son kısmıdır. Daha genel amaçlı omurgadan farklı olarak göreve özeldir.
  • Özellik Çıkarıcı: Omurga bir özellik çıkarıcı olsa da, "özellik çıkarıcı" terimi bazen bir ağın özellikleri çıkaran herhangi bir parçasını veya hatta derin öğrenme dışındaki bağımsız özellik çıkarma algoritmalarını (SIFT veya HOG gibi) ifade edebilir. gibi modern derin öğrenme mimarileri bağlamında Ultralytics YOLO"omurga" özellikle ilk evrişimsel tabanı ifade eder.

Gerçek Dünya Uygulamaları

Omurgalar, sayısız yapay zeka uygulamasının temel bileşenleridir:

  1. Otonom Sürüş: Sürücüsüz araçlardaki sistemler, kamera ve LiDAR sensörlerinden gelen girdileri işlemek için büyük ölçüde sağlam omurgalara (örneğin, ResNet veya EfficientNet varyantları) güvenir. Çıkarılan özellikler, Waymo gibi şirketler tarafından geliştirilen sistemlerde görüldüğü gibi, güvenli navigasyon ve karar verme için çok önemli olan araçların, yayaların, trafik ışıklarının ve şerit çizgilerinin algılanmasını ve sınıflandırılmasını sağlar.
  2. Tıbbi Görüntü Analizi: Sağlık hizmetleri yapay zeka çözümlerinde omurgalar X-ışınları, CT'ler veya MRI'lar gibi tıbbi taramaları analiz etmek için kullanılır. Örneğin, DenseNet gibi bir omurga, pnömoni belirtilerini tespit etmeye yardımcı olmak için bir göğüs röntgeninden veya potansiyel tümörleri tanımlamak için bir CT taramasından özellikler çıkarabilir(ilgili araştırma Radyoloji: AI). Bu, radyologlara teşhis ve tedavi planlamasında yardımcı olur. Ultralytics modelleri gibi YOLO11 güçlü omurgaları kullanarak tümör tespiti gibi görevler için uyarlanabilir.
Tümünü okuyun