Sözlük

LoRA (Düşük Sıralı Adaptasyon)

LoRA'nın YOLO gibi büyük yapay zeka modellerine nasıl verimli bir şekilde ince ayar yaptığını, maliyetleri düşürdüğünü ve minimum kaynakla uç dağıtımı mümkün kıldığını keşfedin.

LoRA veya Düşük Sıralı Uyarlama, tüm modeli yeniden eğitmeye gerek kalmadan belirli görevler için büyük, önceden eğitilmiş makine öğrenimi (ML) modellerini uyarlamak için kullanılan oldukça verimli bir tekniktir. İlk olarak Microsoft araştırmacıları tarafından bir makalede detaylandırılan LoRA, Parametre Verimli İnce Ayar'ın (PEFT) temel taşı haline gelmiştir. Büyük Dil Modelleri (LLM'ler) ve diğer temel modeller gibi devasa modellerin özelleştirilmesiyle ilişkili hesaplama maliyetini ve depolama gereksinimlerini önemli ölçüde azaltır.

LoRA Nasıl Çalışır?

LoRA, önceden eğitilmiş bir modeldeki milyarlarca model ağırlığını güncellemek yerine hepsini dondurur. Daha sonra modelin belirli katmanlarına, genellikle bir Transformer mimarisinin dikkat mekanizması içinde, düşük sıralı adaptörler olarak adlandırılan bir çift küçük, eğitilebilir matris enjekte eder. Eğitim süreci boyunca yalnızca bu yeni, çok daha küçük matrislerin parametreleri güncellenir. Temel fikir, modeli yeni bir göreve uyarlamak için gereken değişikliklerin orijinal modelin içerdiğinden çok daha az parametre ile temsil edilebilmesidir. Bu, adaptasyon için gerekli bilgileri kompakt bir biçimde yakalamak için boyutsallık azaltmaya benzer ilkelerden yararlanır. Eğitim tamamlandığında, küçük adaptör orijinal ağırlıklarla birleştirilebilir veya modüler görev değiştirme için ayrı tutulabilir.

Gerçek Dünya Uygulamaları

LoRA'nın verimliliği, özellikle birden fazla özel modelin gerekli olduğu çok çeşitli uygulamalar için idealdir.

  • Sohbet Robotlarını Özelleştirme: Bir işletme güçlü, genel amaçlı bir LLM 'yi alıp LoRA'yı kullanarak kendi dahili bilgi tabanı üzerinde eğitebilir. Bu, tam ince ayarın muazzam maliyeti olmadan şirkete özgü terminolojiyi anlayan özel bir müşteri hizmetleri sohbet botu oluşturur.
  • YZ Sanat ve Stil Transferi: Sanatçılar ve tasarımcılar, Stable Diffusion gibi üretici yapay zeka modellerini belirli bir sanatsal stile uyarlamak için LoRA'yı kullanıyor. Bir adaptörü kendi görüntülerinden oluşan küçük bir set üzerinde eğiterek, Hugging Face gibi platformlarda popüler bir uygulama olan benzersiz estetiklerini taklit eden yeni sanat üretebilirler.

LoRA ve İlgili Kavramlar

LoRA'yı diğer model uyarlama tekniklerinden ayırmak faydalı olacaktır:

  • Tam İnce Ayar: Bu yöntem, yeni bir veri kümesi üzerinde önceden eğitilmiş bir modelin tüm ağırlıklarını günceller. Genellikle etkili olmakla birlikte, uyarlanan her model için önemli hesaplama kaynakları(GPU) ve depolama alanı gerektirir. Buna karşılık LoRA, orijinal ağırlıkları dondurur ve yalnızca küçük, enjekte edilmiş adaptör matrislerini eğitir. İnce ayar sözlüğü girişimizde ve NVIDIA'nın ince ayar genel bakışında daha fazla ayrıntı bulabilirsiniz.
  • İpucu Ayarlama: Bu teknik model ağırlıklarını tamamen dondurur ve bunun yerine belirli görevler için modelin davranışını yönlendirmek üzere sürekli "yumuşak istemler" (girdi katıştırmalarına eklenen vektörler) öğrenir. LoRA'nın aksine, herhangi bir model ağırlığını değiştirmez, yalnızca girdi temsilini uyarlamaya odaklanır. İpucu ayarlama ve ipucu mühendisliği hakkında daha fazla bilgi edinin.
  • Diğer PEFT Yöntemleri: LoRA, daha geniş bir alan olan Parametre Verimli İnce Ayar (PEFT) içinde sadece bir tekniktir. Diğer yöntemler arasında Adapter Tuning (benzer ancak biraz farklı adaptör yapıları ile), Prefix Tuning ve IA³ yer alır ve her biri parametre verimliliği ve performansında farklı ödünleşimler sunar. Bu yöntemler genellikle Hugging Face PEFT kütüphanesi gibi çerçevelerde mevcuttur.

Özetle LoRA, hem Doğal Dil İşleme (NLP) hem de bilgisayarla görme alanında çok çeşitli belirli görevler için önceden eğitilmiş büyük temel modelleri özelleştirmek için güçlü ve kaynak açısından verimli bir yol sunarak gelişmiş yapay zekayı daha pratik ve erişilebilir hale getirir. Bu yaklaşım, model yaşam döngülerini yönetmek için Ultralytics HUB gibi platformlar tarafından kolaylaştırılan bir süreç olan birçok özel modelin kolay yönetimine ve dağıtımına olanak tanır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı