Sözlük

Model Budama

Model budama ile makine öğrenimi modellerini optimize edin. Kaynakları sınırlı dağıtımlar için daha hızlı çıkarım, daha az bellek kullanımı ve enerji verimliliği elde edin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Model budama, makine öğreniminde eğitilmiş modelleri optimize etmeye odaklanan önemli bir tekniktir. Bir sinir ağından ağırlıklar ve bağlantılar gibi daha az kritik parametrelerin çıkarılmasıyla elde edilen karmaşıklıklarını ve boyutlarını azaltarak modelleri düzenler. Bu süreç, performanstan önemli ölçüde ödün vermeden modelleri daha verimli hale getirerek daha hızlı işleme, daha az bellek kullanımı ve daha az enerji tüketimi gibi faydalar sağlar ve özellikle sınırlı kaynaklara sahip ortamlarda dağıtım için faydalıdır.

Neden Model Budama Kullanılmalı?

Model budamayı kullanmak için birkaç zorlayıcı neden vardır. İlk olarak, makine öğrenimi modellerinin boyutunu önemli ölçüde azaltarak cep telefonları veya uç sistemler gibi sınırlı depolama alanına sahip cihazlara dağıtılmasını kolaylaştırır. Daha küçük modeller, tahminler oluşturmak için daha az hesaplama gerektiğinden daha yüksek çıkarım hızlarına da yol açar. Bu hız artışı, otonom araçlarda nesne algılama veya canlı video analizi gibi gerçek zamanlı uygulamalar için hayati önem taşır. Ayrıca, budanmış modeller daha az enerji tüketir; bu da pille çalışan cihazlar ve sürdürülebilir yapay zeka uygulamalarını hedefleyen büyük ölçekli veri merkezleri için çok önemli bir avantajdır.

Model Budama Türleri

Model budama genel olarak iki ana türe ayrılabilir:

  • Ağırlık Budama: Bu teknik, sinir ağı içindeki bireysel ağırlıkların kaldırılmasına odaklanır. Ayrıca yapılandırılmış ve yapılandırılmamış budama olarak ikiye ayrılabilir. Yapılandırılmamış budama, konumlarından bağımsız olarak tek tek ağırlıkları kaldırır, bu da seyrekliğe yol açar ancak potansiyel olarak düzensiz bellek erişim modellerine yol açar. Öte yandan yapısal budama, filtreler veya kanallar gibi tüm yapıları kaldırarak daha kompakt ve donanım dostu modeller elde edilmesini sağlar.
  • Nöron Budama: Düğüm veya birim budama olarak da bilinen nöron budama, bir sinir ağından tüm nöronların veya düğümlerin çıkarılmasını içerir. Bu yöntem, ağ mimarisini ağırlık budamaya göre daha agresif bir şekilde basitleştirir ve bazen daha önemli hızlanmalara ve model boyutunun küçülmesine yol açabilir.

Model Budama ve Diğer Optimizasyon Teknikleri

Model budama, parametreleri kaldırarak model boyutunu azaltırken, model niceleme ve bilgi damıtma gibi diğer teknikler alternatif optimizasyon stratejileri sunar. Niceleme, ağırlıkların hassasiyetini azaltır (örneğin, 32 bit kayan noktadan 8 bit tam sayıya), bu da model boyutunu azaltır ve model yapısını değiştirmeden hesaplamayı hızlandırır. Bilgi damıtma, daha büyük, daha karmaşık bir "öğretmen" modelinin davranışını taklit etmek için daha küçük bir "öğrenci" modelini eğitir. Bu teknikler genellikle daha da büyük verimlilik kazanımları elde etmek için budama ile birlikte kullanılır. Örneğin, bir model önce boyutunu küçültmek için budanabilir ve ardından dağıtım için performansını daha da optimize etmek üzere nicelleştirilebilir.

Model Budamanın Gerçek Dünya Uygulamaları

Model budama, özellikle hesaplama kaynaklarının sınırlı olduğu veya verimliliğin çok önemli olduğu çeşitli alanlarda yaygın olarak uygulanmaktadır. Bazı önemli uygulamalar şunlardır:

  • Mobil ve Uç Cihazlar: Gerçek zamanlı nesne algılama ve görüntü işleme için Ultralytics YOLO modellerini mobil cihazlara dağıtmak verimli modeller gerektirir. Budama, model boyutunu ve gecikme süresini azaltmaya yardımcı olarak akıllı telefonlarda ve IoT cihazlarında karmaşık yapay zeka görevlerini çalıştırmayı mümkün kılar.
  • Otonom Araçlar: Sürücüsüz araçlar, sensör verilerine dayalı hızlı karar verme gerektirir. Budanmış modeller, düşük gecikme süresinin güvenlik için çok önemli olduğu yaya algılama ve şeritte tutma gibi kritik görevler için hızlı çıkarım sağlar.

Sonuç

Model budama, verimli makine öğrenimi modellerini dağıtmak için önemli bir optimizasyon tekniğidir. Model boyutunu ve karmaşıklığını azaltarak daha hızlı çıkarım, daha düşük bellek kullanımı ve daha az enerji tüketimi sağlar. Ultralytics , çeşitli dağıtım senaryolarında bilgisayarla görme uygulamalarının pratikliğini ve verimliliğini artırmak için budama gibi teknikler de dahil olmak üzere kullanıcıların modellerini optimize etmelerine yardımcı olacak bir dizi araç ve kaynak sağlar.

Tümünü okuyun