Sözlük

Transfer Öğrenimi

Zaman kazanmak, yapay zeka performansını artırmak ve önceden eğitilmiş modelleri kullanarak sınırlı veriyle yeni görevlerin üstesinden gelmek için aktarmalı öğrenmenin gücünü ortaya çıkarın.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Transfer öğrenimi, bir görev için geliştirilen bir modelin ikinci, ilgili bir görevdeki bir model için başlangıç noktası olarak yeniden kullanıldığı bir Makine Öğrenimi (ML) tekniğidir. Sıfırdan bir model oluşturmak yerine, transfer öğrenimi kaynak görevden öğrenilen bilgiden (özellikler, ağırlıklar) yararlanarak hedef görev için gereken eğitim süresini, veri gereksinimlerini ve hesaplama kaynaklarını önemli ölçüde azaltır. Bu yaklaşım özellikle hedef görevin sınırlı etiketli veriye sahip olduğu durumlarda faydalıdır.

Transfer Öğrenimi Nasıl Çalışır?

Süreç genellikle görüntü görevleri için ImageNet veya Doğal Dil İşleme (NLP) için büyük metin derlemeleri gibi büyük, genel bir veri kümesi üzerinde önceden eğitilmiş bir modelle başlar. Bu ön eğitim, genellikle Evrişimsel Sinir Ağı (CNN) veya Dönüştürücü gibi bir Derin Öğrenme (DL) modeli olan modelin genel özellikleri (kenarlar, dokular, görüntülerdeki desenler veya metindeki gramer ve anlambilim) öğrenmesini sağlar.

Yeni hedef görev için bu önceden eğitilmiş model uyarlanır. Yaygın stratejiler şunları içerir:

  1. Önceden Eğitilmiş Modeli Özellik Çıkarıcı Olarak Kullanma: Önceden eğitilmiş modelin ilk katmanları dondurulur (ağırlıkları güncellenmez) ve yalnızca son sınıflandırıcı veya göreve özgü katmanlar yeni veri kümesi üzerinde eğitilir.
  2. İnce ayar: Bu, önceden eğitilmiş katmanların bir kısmının veya tamamının dondurulmasını ve öğrenilen özelliklerin büyük ölçüde değiştirilmesini önlemek için tipik olarak daha düşük bir öğrenme oranıyla yeni veri kümesi üzerinde eğitim sürecine(geriye yayılma) devam edilmesini içerir. İnce ayar, modelin genel bilgisini hedef görevin belirli nüansları için uzmanlaştırmasını sağlar.

Transfer Öğreniminin Faydaları

Transfer öğrenimini kullanmak birkaç önemli avantaj sunar:

  • Azaltılmış Veri İhtiyacı: Daha küçük hedef veri kümelerinde bile iyi performans elde eder.
  • Daha Hızlı Geliştirme: Model eğitim süresini önemli ölçüde kısaltır.
  • Geliştirilmiş Performans: Özellikle karmaşık görevlerde sıfırdan eğitime kıyasla genellikle daha yüksek doğruluk ve daha iyi genelleme sağlar.
  • Kaynak Verimliliği: Hesaplama maliyetlerinden tasarruf sağlar (GPU zaman, enerji) kapsamlı eğitim ile ilişkilidir.

Transfer Öğrenimi ve İlgili Kavramlar

  • İnce ayar: Daha önce de belirtildiği gibi, ince ayar, önceden eğitilmiş ağırlıkların yeni görev üzerinde eğitim sırasında ayarlandığı transfer öğrenmede kullanılan özel bir yöntemdir. Transfer öğrenimi, bilgiden yararlanmanın daha geniş bir kavramıdır ve önceden eğitilmiş modeli ince ayar yapmadan sabit bir özellik çıkarıcı olarak kullanmayı da içerebilir.
  • Sıfır Atışlı Öğrenme: Bir modeli genellikle bazı yeni etiketli veriler kullanarak yeni bir göreve uyarlayan transfer öğrenmenin aksine, Sıfır Atışlı Öğrenme, yardımcı bilgilere veya paylaşılan öznitelik alanlarına dayanarak modelin eğitim sırasında hiç görmediği sınıflar üzerinde görevleri (sınıflandırma gibi) gerçekleştirmeyi amaçlar.
  • Sıfırdan Eğitim: Bu, model ağırlıklarının rastgele başlatıldığı ve yalnızca hedef veri kümesi üzerinde eğitildiği, önemli ölçüde daha fazla veri ve zaman gerektiren geleneksel yaklaşımdır.

Gerçek Dünya Uygulamaları

Transfer öğrenimi çeşitli alanlarda yaygın olarak uygulanmaktadır:

  1. Bilgisayarla Görme: COCO gibi büyük veri kümeleri üzerinde önceden eğitilmiş Ultralytics YOLO gibi modeller sıklıkla özel nesne algılama, görüntü segmentasyonu veya görüntü sınıflandırma görevleri için uyarlanır. Örneğin, günlük nesneler üzerinde önceden eğitilmiş bir model, anormallikleri(tümör tespiti) tespit etmek için tıbbi görüntü analizi veya belirli mahsulleri veya zararlıları tanımlamak için tarımda yapay zeka gibi belirli uygulamalar için ince ayar yapılabilir. Katmanları dondurarakYOLOv5 ile transfer öğrenmeyi nasıl uygulayacağınızı öğrenebilirsiniz.
  2. Doğal Dil İşleme (NLP): BERT ve GPT gibi Büyük Dil Modelleri (LLM'ler) devasa metin veri kümeleri üzerinde önceden eğitilmiştir. Duygu analizi, adlandırılmış varlık tanıma (NER) veya özel sohbet robotları oluşturma gibi belirli NLP görevleri için ince ayar yapılabilen güçlü temel modeller olarak hizmet ederler. Hugging Face Transformers gibi kütüphaneler bu süreci büyük ölçüde kolaylaştırır.

Ultralytics HUB gibi platformlar, önceden eğitilmiş modeller sağlayarak transfer öğrenimini uygulama sürecini basitleştirir (YOLOv8, YOLOv11) ve kullanıcıya özel veri kümeleri üzerinde kolay özel eğitim için araçlar. Gibi çerçeveler PyTorch ve TensorFlow ayrıca transfer öğrenimi için kapsamlı destek ve eğitimler sunmaktadır. Daha derinlemesine bir araştırma için Stanford CS231n genel bakışı gibi kaynakları veya"Derin Transfer Öğrenimi Üzerine Bir Anket" gibi akademik anketleri inceleyin.

Tümünü okuyun