Model budama ile makine öğrenimi modellerini optimize edin. Kaynakları sınırlı dağıtımlar için daha hızlı çıkarım, daha az bellek kullanımı ve enerji verimliliği elde edin.
Model budama, makine öğreniminde eğitilmiş modelleri optimize etmeye odaklanan önemli bir tekniktir. Bir sinir ağından ağırlıklar ve bağlantılar gibi daha az kritik parametrelerin çıkarılmasıyla elde edilen karmaşıklıklarını ve boyutlarını azaltarak modelleri düzenler. Bu süreç, performanstan önemli ölçüde ödün vermeden modelleri daha verimli hale getirerek daha hızlı işleme, daha az bellek kullanımı ve daha az enerji tüketimi gibi faydalar sağlar ve özellikle sınırlı kaynaklara sahip ortamlarda dağıtım için faydalıdır.
Model budamayı kullanmak için birkaç zorlayıcı neden vardır. İlk olarak, makine öğrenimi modellerinin boyutunu önemli ölçüde azaltarak cep telefonları veya uç sistemler gibi sınırlı depolama alanına sahip cihazlara dağıtılmasını kolaylaştırır. Daha küçük modeller, tahminler oluşturmak için daha az hesaplama gerektiğinden daha yüksek çıkarım hızlarına da yol açar. Bu hız artışı, otonom araçlarda nesne algılama veya canlı video analizi gibi gerçek zamanlı uygulamalar için hayati önem taşır. Ayrıca, budanmış modeller daha az enerji tüketir; bu da pille çalışan cihazlar ve sürdürülebilir yapay zeka uygulamalarını hedefleyen büyük ölçekli veri merkezleri için çok önemli bir avantajdır.
Model budama genel olarak iki ana türe ayrılabilir:
Model budama, parametreleri kaldırarak model boyutunu azaltırken, model niceleme ve bilgi damıtma gibi diğer teknikler alternatif optimizasyon stratejileri sunar. Niceleme, ağırlıkların hassasiyetini azaltır (örneğin, 32 bit kayan noktadan 8 bit tam sayıya), bu da model boyutunu azaltır ve model yapısını değiştirmeden hesaplamayı hızlandırır. Bilgi damıtma, daha büyük, daha karmaşık bir "öğretmen" modelinin davranışını taklit etmek için daha küçük bir "öğrenci" modelini eğitir. Bu teknikler genellikle daha da büyük verimlilik kazanımları elde etmek için budama ile birlikte kullanılır. Örneğin, bir model önce boyutunu küçültmek için budanabilir ve ardından dağıtım için performansını daha da optimize etmek üzere nicelleştirilebilir.
Model budama, özellikle hesaplama kaynaklarının sınırlı olduğu veya verimliliğin çok önemli olduğu çeşitli alanlarda yaygın olarak uygulanmaktadır. Bazı önemli uygulamalar şunlardır:
Model budama, verimli makine öğrenimi modellerini dağıtmak için önemli bir optimizasyon tekniğidir. Model boyutunu ve karmaşıklığını azaltarak daha hızlı çıkarım, daha düşük bellek kullanımı ve daha az enerji tüketimi sağlar. Ultralytics , çeşitli dağıtım senaryolarında bilgisayarla görme uygulamalarının pratikliğini ve verimliliğini artırmak için budama gibi teknikler de dahil olmak üzere kullanıcıların modellerini optimize etmelerine yardımcı olacak bir dizi araç ve kaynak sağlar.