Yapay zeka modellerini budama ile optimize edin; karmaşıklığı azaltın, verimliliği artırın ve performanstan ödün vermeden uç cihazlarda daha hızlı dağıtın.
Budama, eğitilmiş modellerin boyutunu ve karmaşıklığını azaltmak için yapay zeka (AI) ve makine öğreniminde (ML) kullanılan bir model optimizasyon tekniğidir. Bir sinir ağı (NN) içindeki ağırlıklar veya bağlantılar gibi daha az önemli veya gereksiz olduğu düşünülen parametrelerin seçici olarak kaldırılmasını içerir. Birincil amaç, genellikle doğrulukta önemli bir düşüş olmadan daha az hesaplama gücü ve bellek gerektiren daha küçük, daha hızlı modeller oluşturmaktır. Bu süreç, özellikle sınırlı kaynaklara sahip cihazlarda verimli model dağıtımı için çok önemlidir.
Derin öğrenme (DL) modelleri karmaşık görevlerin üstesinden gelmek için büyüdükçe, önemli hesaplama kaynakları talep ederler. Budama, modelleri daha hafif hale getirerek bu zorluğun üstesinden gelir. Bu optimizasyon depolama gereksinimlerini azaltır, enerji tüketimini düşürür ve gerçek zamanlı çıkarım senaryoları için hayati önem taşıyan çıkarım gecikmesini azaltır. Budama, özellikle mobil cihazlar, gömülü sistemler ve verimliliğin çok önemli olduğu Edge AI uygulamaları gibi ortamlarda modelleri dağıtmak için faydalıdır.
Budama teknikleri çeşitli yapay zeka alanlarında yaygın olarak uygulanmaktadır. İşte iki somut örnek:
Budama yöntemleri değişebilir, ancak genellikle bu kategorilere girer:
Budama farklı aşamalarda uygulanabilir: eğitimden önce (mimariyi belirleme), eğitim sırasında veya eğitimden sonra (önceden eğitilmiş bir modele ince ayar yapma). Gibi platformlar PyTorch çeşitli budama tekniklerini kolaylaştırmak için yardımcı programlar sağlar.
Budama, çeşitli model optimizasyon stratejilerinden biridir. Onu ilgili kavramlardan ayırmak önemlidir:
Bu teknikler birbirini dışlamaz ve maksimum verimlilik elde etmek için genellikle budama ile birleştirilir. Daha geniş bir genel bakış için model optimizasyonuna ilişkin bu kılavuza bakın. Budama yoluyla optimize edilen modeller genellikle aşağıdaki gibi standart formatlara aktarılabilir ONNX daha geniş dağıtım uyumluluğu için.
Özetle, budama, çeşitli dağıtım ihtiyaçlarına uygun verimli yapay zeka modelleri oluşturmak için değerli bir tekniktir ve bilgisayarla görme (CV) ve diğer makine öğrenimi görevlerinin pratik uygulamasına önemli ölçüde katkıda bulunur. Ultralytics HUB gibi araçlar ve platformlar genellikle bu tür optimizasyon yöntemlerini içerir veya kolaylaştırır.