Sözlük

Budama

Yapay zeka modellerini budama ile optimize edin; karmaşıklığı azaltın, verimliliği artırın ve performanstan ödün vermeden uç cihazlarda daha hızlı dağıtın.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Yapay zeka ve makine öğrenimi bağlamında budama, daha az önemli bağlantıları veya parametreleri kaldırarak bir modelin karmaşıklığını azaltmak için kullanılan teknikleri ifade eder. Bu işlem, modelin doğruluğundan önemli ölçüde ödün vermeden hesaplama ve bellek kullanımı açısından daha verimli hale getirilmesini amaçlar. Budama, modelleri kaynak kısıtlaması olan cihazlara yerleştirirken veya çıkarım hızlarını artırmayı hedeflerken özellikle değerlidir.

Budamanın Önemi

Budamanın birincil önemi model optimizasyonunda yatmaktadır. Derin öğrenme modelleri daha yüksek doğruluk elde etmek için boyut ve karmaşıklık açısından büyüdükçe, hesaplama açısından pahalı ve bellek açısından yoğun hale gelirler. Bu durum, özellikle sınırlı kaynaklara sahip akıllı telefonlar veya gömülü sistemler gibi uç cihazlarda dağıtım için zorluklar yaratmaktadır. Budama, dağıtımı daha kolay olan ve daha az hesaplama gücü gerektiren daha küçük, daha hızlı modeller oluşturarak bunu ele alır ve böylece çeşitli uygulamalarda gerçek zamanlı çıkarıma olanak tanır. Model dağıtımı için modellerin optimize edilmesinde çok önemli bir adımdır ve yapay zekayı çeşitli platformlarda daha erişilebilir ve pratik hale getirir.

Budama Uygulamaları

Budama teknikleri, yapay zeka ve makine öğrenimi içinde çeşitli alanlarda uygulanmaktadır. İşte birkaç somut örnek:

  • Mobil Bilgisayar Görüşü: Düşünmek Ultralytics YOLOnesne algılama gibi görevler için mobil uygulamalarda kullanılan modeller. Budama, bu modellerin boyutunu önemli ölçüde azaltarak pil ömrünü tüketmeden veya performanstan ödün vermeden akıllı telefonlarda verimli bir şekilde çalışmasını sağlayabilir. Bu, mobil güvenlik sistemleri veya artırılmış gerçeklik uygulamaları gibi gerçek zamanlı uygulamalar için çok önemlidir. Örneğin, Raspberry Pi üzerindeki bir Edge TPU üzerinde budanmış bir YOLO modelinin kullanılması, daha yüksek çıkarım hızları ve daha düşük güç tüketimi sağlayabilir.

  • Otonom Sürüş Sistemleri: Kendi kendine giden araçlarda hızlı ve doğru nesne tespiti çok önemlidir. Otonom araçlar, sensör verilerini gerçek zamanlı olarak işlemek için karmaşık modellere güvenir. Bu modellerin budanması çıkarım gecikmesini azaltarak aracın yapay zeka sisteminin daha hızlı karar vermesini sağlayabilir. Bu, dinamik sürüş ortamlarında güvenlik ve yanıt verebilirlik için kritik öneme sahiptir. Budama yoluyla optimize edilen modeller ayrıca aşağıdakiler kullanılarak da dağıtılabilir TensorRT Otonom sistemlerde yaygın olarak kullanılan NVIDIA GPU'larda performansı daha da hızlandırmak için.

Türler ve Teknikler

Budama için genel olarak kategorize edilen farklı yaklaşımlar vardır:

  • Ağırlık Budama: Bu, bir sinir ağında modelin çıktısı üzerinde minimum etkiye sahip olan bireysel ağırlıkların veya bağlantıların kaldırılmasını içerir. Büyüklüğe dayalı budama gibi teknikler, en küçük mutlak değerlere sahip ağırlıkları kaldırır.
  • Filtre Budama: Bu daha yapılandırılmış yaklaşım, tüm filtreleri (ve bunlarla ilişkili özellik haritalarını) evrişimsel katmanlardan kaldırır. Filtre budama, hesaplama sayısını doğrudan azalttığı için ağırlık budamaya kıyasla genellikle daha önemli model boyutu küçültme ve hızlandırma sağlar.

Budama, model geliştirme sürecinin farklı aşamalarında da uygulanabilir:

  • Eğitim Öncesi Budama: Budama, önceden eğitilmiş bir model üzerinde gerçekleştirilir. Önceden eğitilmiş modeller genellikle gereksiz parametrelere sahip olduğundan bu yaygın bir yaklaşımdır.
  • Eğitim Sırasında Budama: Budama, eğitim sürecinin kendisine entegre edilmiştir. Bu, daha verimli eğitim ve budama sonrasında potansiyel olarak daha iyi model performansı sağlayabilir.
  • Eğitim Sonrası Budama: Budama, model tamamen eğitildikten sonra uygulanır. Bu en basit yaklaşımdır ve genellikle model boyutunu daha da küçültmek ve çıkarımı hızlandırmak için niceleme gibi teknikleri içerir, bazen aşağıdaki gibi formatlarla birlikte kullanılır ONNX.

Özetle, budama, kaynak sınırlı ortamlarda ve gecikmeye duyarlı uygulamalarda verimli ve performanslı YZ modellerinin kullanılmasını sağlayan hayati bir model optimizasyon tekniğidir. Budama, model karmaşıklığını azaltarak YZ'nin daha pratik ve yaygın olarak uygulanabilir olmasına katkıda bulunur.

Tümünü okuyun