Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Evrişim

Bilgisayar görme ve derin öğrenmede konvolüsyonun temellerini keşfedin. Çekirdekler ve özellik haritalarının Ultralytics gerçek zamanlı görevler için nasıl güçlendirdiğini öğrenin.

Konvolüsyon, modern bilgisayar görme (CV) ve derin öğrenme (DL) sistemlerinin temel yapı taşı olan temel bir matematiksel işlemdir. Görüntü işleme bağlamında, konvolüsyon, önemli özelliklerin bir haritasını oluşturmak için genellikle çekirdek olarak adlandırılan küçük bir filtrenin giriş görüntüsü üzerinde kaydırılmasını içerir. Bu süreç, yapay zeka (AI) modellerinin insan müdahalesi olmadan kenarlar, dokular ve şekiller gibi kalıpları otomatik olarak öğrenmesini ve tanımlamasını sağlar. Genellikle manuel özellik çıkarma gerektiren geleneksel makine öğrenimi (ML) 'nden farklı olarak, konvolüsyon ağların görsel verileri basit çizgilerden başlayarak yüzler veya araçlar gibi karmaşık nesnelere kadar hiyerarşik bir anlayışla anlamasını sağlar.

Evrişim (Convolution) Nasıl Çalışır?

İşlem, giriş verileri üzerinde bir filtre uygulayarak, eleman bazında çarpma işlemi gerçekleştirerek ve sonuçları toplayarak her konum için tek bir değer üretir. Bu çıktı, özellik haritası olarak bilinir.

  • Çekirdek: Bu, belirli özellikleri algılayan küçük bir sayı (ağırlık) matrisidir. Örneğin, Sobel operatörü, detect veya yatay kenarları detect için kullanılan belirli bir çekirdek türüdür .
  • Kayan Pencere: Çekirdek, "adım" adı verilen tanımlanmış bir adım boyutu kullanarak görüntü üzerinde hareket eder. Bu uzamsalfiltreleme işlemi, görüntüleri anlamak için çok önemli olan pikseller arasındaki ilişkiyi korur.
  • Katman Hiyerarşisi: Convolutional Neural Networks (CNNs) gibi derin mimarilerde, ilk katmanlar düşük seviyeli ayrıntıları yakalar, daha derin katmanlar ise bunları yüksek seviyeli kavramlarla birleştirir.

Konvolüsyon ve İlgili Kavramlar

Konvolüsyonu tam olarak kavramak için, onu sinir ağı (NN) literatüründe sıklıkla karşılaşılan benzer terimlerden ayırmak yararlıdır: * Fourier dönüşümü: Bir sinyalin tüm frekans bileşenlerini içeren bir fonksiyonun zamanla değişen bir fonksiyonun fonksiyonu.

  • Çapraz Korelasyon ve Konvolüsyon: Matematiksel olarak, gerçek konvolüsyon, çekirdeği uygulamadan önce ters çevirmeyi içerir. Ancak, PyTorch dahil olmak üzere çoğu derin öğrenme çerçevesi, çapraz korelasyonu (ters çevirme olmadan kaydırma) uygular, ancak ağırlıklar eğitim sırasında öğrenildiği için performans açısından ters çevirme ayrımı önemsiz olduğundan buna "konvolüsyon" adını verir. Bu ayrım, PyTorch'un PyTorch.Tensor.convolution ve PyTorch.Tensor.crosscorrelate işlevleri arasında da geçerlidir.
  • Konvolüsyon ve Dikkat: Konvolüsyon bilgileri yerel olarak (komşu pikseller) işlerken, dikkat mekanizması bir modelin görüntünün uzak kısımlarını aynı anda ilişkilendirmesine olanak tanır. YOLO26 gibi modern mimariler, dikkat katmanları hesaplama açısından daha ağır olabileceğinden, gerçek zamanlı çıkarım hızlarını korumak için genellikle yüksek düzeyde optimize edilmiş konvolüsyon katmanları kullanır. YOLO26 gibi modern mimariler,

Gerçek Dünya Uygulamaları

Konvolüsyonun verimliliği, yapay zekanın sağlam algılama sistemlerini güçlendirerek çeşitli endüstrilerde devrim yaratmasını sağlamıştır: :

  1. Tıbbi Teşhis: Sağlık hizmetlerinde yapay zeka alanında, konvolüsyon yüksek çözünürlüklü MRG taramalarının analizine yardımcı olur. Anormallikleri vurgulamak için tasarlanmış özel çekirdekler kullanarak, modeller tümörlerin veya kırıkların detect belirtilerini insan uzmanlarla rekabet edecek bir doğrulukla detect edebilir.
  2. Otonom Navigasyon: Otonom araçlar, gerçek zamanlı nesne algılama için konvolüsyona dayanır. Araç hareket ederken, konvolüsyonel katmanlar video akışlarını işleyerek yayaları, şerit işaretlerini ve trafik işaretlerini anında tanımlar. Bu, otomotiv güvenliğinde yapay zekanın kritik bir bileşenidir.

Ultralytics ile Python

Python kullanarak en son teknolojiye sahip modellerdeki evrişimli katmanları inceleyebilirsiniz. Aşağıdaki örnek, YOLO26 model ve ilk katmanının, standart bir evrişimsel işlem kullandığını doğrular. Bu işlem, torch.nn.

import torch.nn as nn
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Access the first layer of the model's backbone
first_layer = model.model.model[0]

# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
    print("Success: The first layer is a standard convolution.")
    print(f"Kernel size: {first_layer.conv.kernel_size}")

Kenar AI için Konvolüsyon Neden Önemlidir?

Konvolüsyonel işlemler yüksek oranda optimize edilebilir olduğundan, hesaplama kaynaklarının sınırlı olduğu Edge AI uygulamaları için idealdir. Aynı çekirdek tüm görüntüde paylaşıldığından (parametre paylaşımı), model eski tam bağlantılı mimarilere göre önemli ölçüde daha az bellek gerektirir. Bu verimlilik, gelişmiş modellerin akıllı telefonlarda ve IoT cihazlarında çalıştırılmasını sağlar.

Özel veri kümeleri için bu işlemlerden yararlanmak isteyen ekipler için Ultralytics , karmaşık altyapıyı yönetmeden görüntüleri açıklamak ve konvolüsyon tabanlı modelleri eğitmek için sorunsuz bir ortam sağlar. Transfer öğrenimini kullanarak, önceden eğitilmiş konvolüsyon ağırlıklarını ince ayar yaparak, minimum eğitim verisiyle yeni nesneleri tanıyabilirsiniz.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın