Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Alıcı Alan (Receptive Field)

Alıcı alanın sinir ağının gördüklerini nasıl tanımladığını keşfedin. Ultralytics tüm boyutlardaki detect etkili bir şekilde detect için uzamsal bağlamı nasıl optimize ettiğini öğrenin.

Bilgisayar görme (CV) ve derin öğrenme alanında algılama alanı, bir sinir ağındaki (NN) belirli bir nöronun "gördüğü" veya analiz ettiği giriş görüntüsünün belirli bir bölgesini ifade eder. Kavramsal olarak, insan gözünün veya kamera merceğinin görüş alanına benzer şekilde işlev görür. Bir modelin herhangi bir katmanda ne kadar uzamsal bağlam algılayabileceğini belirler. Veriler Konvolüsyonel Sinir Ağı (CNN) üzerinden ilerledikçe, alıcı alan genellikle genişler ve sistemin kenarlar veya köşeler gibi küçük, yerel ayrıntıları tanımlamaktan tüm nesneler veya sahneler gibi karmaşık, küresel yapıları anlamaya geçiş yapmasına olanak tanır.

Alıcı Alanların Mekanizması

Alıcı alanın boyutu ve derinliği, ağın mimarisi tarafından belirlenir. İlk katmanlarda, nöronlar genellikle küçük bir alıcı alana sahiptir ve ince dokuları yakalamak için küçük bir piksel kümesine odaklanır. Ağ derinleştikçe, havuzlama katmanları ve adımlı konvolüsyonlar gibi işlemler özellik haritalarını etkili bir şekilde düşürür. Bu işlem, sonraki nöronların orijinal girdinin çok daha büyük bir bölümünden bilgi toplamasını sağlar.

En son teknolojiye sahip Ultralytics dahil olmak üzere modern mimariler, bu alanları titizlikle dengelemek için tasarlanmıştır. Alıcı alan çok dar ise, model tüm şekli algılayamadığı için büyük nesneleri tanıyamayabilir. Tersine, alan çözünürlüğü korumadan aşırı geniş ise, model küçük nesneleri gözden kaçırabilir. Tersine, alan çözünürlüğü korumadan aşırı genişse, model küçük nesneleri gözden kaçırabilir. Bunu çözmek için mühendisler genellikle genişletilmiş konvolüsyonlar (atrous konvolüsyonlar olarak da bilinir) kullanarak uzamsal çözünürlüğü düşürmeden alıcı alanı genişletirler. Bu teknik, anlamsal segmentasyon gibi yüksek hassasiyet gerektiren görevler için hayati önem taşır.

Gerçek Dünya Uygulamaları

Alıcı alanı optimize etmek, çeşitli AI çözümlerinin başarısı için çok önemlidir.

  • Otonom Sürüş: Otomotiv alanında yapay zeka, algılama sistemlerinin aynı anda hem track ayrıntıları hem de büyük engelleri track . Bir araç, uzaktaki trafik ışıklarını tanımak için küçük bir algılama alanına ihtiyaç duyarken, aynı zamanda yakındaki bir kamyonun yörüngesini veya yol şeridinin eğriliğini anlamak için büyük bir algılama alanına ihtiyaç duyar. Bu çok ölçekli algılama, daha iyi yapay zeka güvenliği ve karar vermeyi sağlar. .
  • Tıbbi Teşhis: Sağlık hizmetlerinde AI uygularken, radyologlar taramalarda anormallikleri tespit etmek için modellere güvenirler. Beyin tümörlerini tanımlamak için ağ, beynin genel simetrisini ve yapısını anlamak için geniş bir algılama alanına ihtiyaç duyar. Ancak, mamografide detect için model, ince doku değişikliklerine duyarlı küçük algılama alanlarına sahip erken katmanlara güvenir.

İlgili Kavramları Ayırt Etme

Ağ tasarımını tam olarak anlamak için, alıcı alanı benzer terimlerden ayırmak yararlıdır:

  • Alıcı Alan ve Çekirdek: Çekirdek (veya filtre) boyutu, tek bir konvolüsyon işlemi için kayan pencerenin boyutlarını (örneğin, 3x3) tanımlar. Alıcı alan, bir nöronu etkileyen toplam birikmiş giriş alanını temsil eden ortaya çıkan bir özelliktir. Birden fazla 3x3 çekirdeğin yığını , 3x3'ten çok daha büyük bir alıcı alan oluşturur.
  • Alıcı Alan ve Özellik Haritası: Özellik haritası, öğrenilen temsilleri içeren bir katman tarafından üretilen çıktı hacmidir. Alıcı alan, özellik haritasındaki tek bir nokta ile orijinal girdi görüntüsü arasındaki ilişkiyi tanımlar.
  • Alıcı Alan ve Bağlam Penceresi: Her iki terim de algılanan verilerin kapsamını ifade etse de, "bağlam penceresi" genellikle Doğal Dil İşleme (NLP) veya video analizinde zamansal veya sıralı bir aralığı (ör. token sınırı) belirtmek için kullanılır. Alıcı alan ise, ızgara benzeri verilerdeki (görüntüler) uzamsal alanı ifade eder.

Kodda Pratik Kullanım

Yeni YOLO26 gibi son teknoloji modeller, tüm boyutlardaki nesneler için etkili alıcı alanları korumak için Özellik Piramidi Ağları (FPN) kullanır. Aşağıdaki örnek, bir modeli yüklemeyi ve nesne algılamayı, bu dahili mimari optimizasyonları otomatik olarak kullanarak gerçekleştirmeyi gösterir. Optimize edilmiş mimarilerle kendi modellerini eğitmek isteyen kullanıcılar, kesintisiz veri kümesi yönetimi ve bulut eğitimi için Ultralytics kullanabilirler.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın