Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Artık Ağlar (ResNet)

Residual Networks (ResNet) teknolojisinin gücünü keşfedin. Atlama bağlantılarının, bilgisayar görüşü için derin öğrenmeyi mümkün kılmak üzere kaybolan gradyan sorununu nasıl çözdüğünü öğrenin.

Residual Networks, yaygın olarak ResNets olarak bilinen, yapay sinir ağı (ANN) mimarisinin çok derin ağların eğitimini mümkün kılmak için tasarlanmış özel bir türüdür. 2015 Microsoft araştırmacıları tarafından tanıtılan ResNet, derin öğrenmede kaybolan gradyan sorunu olarak bilinen kritik bir darboğazı çözmüştür. Geleneksel ağlarda, daha fazla katman istiflemek genellikle performans doygunluğuna veya bozulmasına yol açıyordu, çünkü model ağırlıklarını güncellemek için gereken sinyal katmanlar boyunca geriye doğru yayıldıkça zayıflıyordu. ResNet, verilerin bir veya daha fazla katmanı atlayarak doğrudan sonraki işleme aşamalarına akmasını sağlayan "atlama bağlantıları" (veya kalıntı bağlantıları) getirdi. Bu yenilik, daha derin ağların etkili bir şekilde eğitilebileceğini kanıtladı ve bilgisayar görüşünde (CV) önemli atılımlar sağladı ve modern mimariler için temel bir kavram haline geldi.

Temel Kavram: Kalıntı Öğrenme

ResNet'in belirleyici özelliği "artık blok"tur. Standart bir evrişimli sinir ağında (CNN), her katman girdiden çıktıya doğrudan bir eşleme öğrenmeye çalışır. Ağlar derinleştikçe, bu doğrudan eşlemeyi öğrenmek giderek zorlaşır.

ResNet, öğrenme hedefini farklı bir şekilde formüle ederek bu yaklaşımı değiştirir. Her katman yığınının altta yatan tüm eşlemeyi öğrenmesini ummak yerine, artık blok katmanları girdi ile istenen çıktı arasındaki "artık"ı veya farkı öğrenmeye zorlar. Daha sonra, orijinal girdi bir atlama bağlantısı aracılığıyla öğrenilen kalıntıya yeniden eklenir. Bu yapısal değişiklik, bir kimlik eşlemesi (girdiyi değiştirmeden geçirme) optimumsa, ağın kalıntıları sıfıra itmeyi kolayca öğrenebileceği anlamına gelir. Bu, derin öğrenme (DL) modellerinin optimize edilmesini çok daha kolay hale getirir ve onlarca katmandan yüzlerce, hatta binlerce katmana ölçeklenmelerine olanak tanır.

Anahtar Mimari Varyantları

ResNet, kurulduğu günden bu yana, çeşitli varyasyonlarıyla yapay zeka topluluğunda standart bir referans noktası haline gelmiştir.

  • ResNet-50: "Darboğaz" tasarımını kullanan 50 katmanlı bir versiyon. Bu tasarım, boyutları azaltmak ve daha sonra geri yüklemek için 1x1 konvolüsyonlar kullanır, böylece yüksek doğruluğu korurken ağın hesaplama açısından verimli olmasını sağlar. .
  • ResNet-101 ve ResNet-152: Sırasıyla 101 ve 152 katmanlı daha derin varyantlar. Bunlar genellikle hesaplama kaynakları daha karmaşık özellik haritalarını yakalamak için daha yüksek karmaşıklığa izin verdiğinde kullanılır. Özellik haritaları.
  • ResNeXt: ResNet'in bir evrimi olan ve "kardinalite" boyutunu tanıtan, kalan bloğu birden fazla paralel yola bölen, verimliliği ve performansı artıran bir yöntemdir.

Gerçek Dünya Uygulamaları

ResNet mimarilerinin sağlamlığı, onları çok çeşitli görsel görevler için tercih edilen bir seçenek haline getirmiştir.

  • Tıbbi Görüntü Analizi: Sağlık hizmetlerinde, yüksek çözünürlüklü taramalarda ince anomalileri tespit etmek çok önemlidir. ResNet tabanlı modeller, tıbbi görüntülemede tümör tespiti gibi detect için sıklıkla kullanılır. Bu durumda, ağın derinliği MRI veya CT verilerindeki ince desenleri ayırt etmeye yardımcı olur.
  • Otonom Araçlar: Otonom araçlar, yayaları, işaretleri ve engelleri tanımak için kamera görüntülerinden güvenilir özellik çıkarma gerektirir. ResNets genellikle backbone olarak kullanılır ve güvenli navigasyon için gerekli olan zengin görsel özellikleri sağlar.

ResNet ve Diğer Mimariler

ResNet'in özel kullanım alanını anlamak için onu diğer popüler mimarilerden ayırmak faydalıdır.

  • ResNet ve VGG: VGG (Visual Geometry Group) ağları da derin CNN'lerdir, ancak kalıntı bağlantıları yoktur. Sonuç olarak, ResNet ile karşılaştırılabilir derinliklerde eğitilmeleri çok daha zordur ve genellikle büyük tam bağlantılı katmanları nedeniyle hesaplama açısından daha pahalıdırlar.
  • ResNet ve Inception: Inception ağları, farklı ölçeklerdeki özellikleri yakalamak için aynı katman içinde farklı boyutlarda filtreler kullanarak genişliğe odaklanır. ResNet ise derinliğe odaklanır. Inception-ResNet gibi modern mimariler her iki kavramı da birleştirir.
  • ResNet ve Vision Transformer (ViT): ViT'ler görüntüleri global olarak işlemek için kendi kendine dikkat mekanizmaları kullanırken, ResNet'ler yerel konvolüsyonlara dayanır. Ancak, ResNet'ler güçlü bir temel kalmaya devam eder ve genellikle daha küçük veri kümeleri veya gerçek zamanlı çıkarımlar için daha hızlıdır.

Uygulama Örneği

PyTorch gibi modern derin öğrenme kütüphaneleri, önceden eğitilmiş ResNet modellerine erişimi PyTorch . Bu modeller, transfer öğrenimi için çok değerlidir. Transfer öğreniminde, ImageNet gibi büyük bir veri seti üzerinde eğitilmiş bir model ImageNet gibi büyük bir veri seti üzerinde eğitilmiş bir modelin belirli bir görev için ince ayarlandığı transfer öğrenimi için paha biçilmez bir değere sahiptir.

Aşağıdaki Python , önceden eğitilmiş bir ResNet-50 modelini kullanarak nasıl yükleneceğini göstermektedir. torchvision ( PyTorch bir parçası) ve basit bir ileri geçiş gerçekleştirin. Kullanıcılar Ultralytics Platformu sık sık kullanabilir YOLO26 algılama backbone , ResNet gibi temel kavramları anlamak gelişmiş özelleştirme için çok önemlidir.

import torch
import torchvision.models as models

# Load a pre-trained ResNet-50 model
resnet50 = models.resnet50(weights=models.ResNet50_Weights.DEFAULT)
resnet50.eval()  # Set model to evaluation mode

# Create a dummy input tensor (batch_size, channels, height, width)
input_tensor = torch.randn(1, 3, 224, 224)

# Perform a forward pass to get predictions
with torch.no_grad():
    output = resnet50(input_tensor)

print(f"Output shape: {output.shape}")  # Expect [1, 1000] for ImageNet classes

Modern Yapay Zekada Önemi

YOLO26 gibi daha yeni mimariler maksimum hız ve doğruluk için yüksek düzeyde optimize edilmiş yapılar kullanıyor olsa da, kalıntı öğrenmenin ilkeleri her yerde geçerliliğini korumaktadır. Atlama bağlantıları kavramı, doğal dil işleme (NLP) (NLP) ve en yeni nesne algılama modellerinde kullanılan transformatörler dahil olmak üzere birçok gelişmiş ağda standart bir bileşen haline gelmiştir. ResNet, bilginin ağ üzerinden daha serbestçe akmasını sağlayarak, günümüzün yapay zekasını destekleyen derin ve karmaşık modellerin önünü açmıştır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın