Sözlük

Diziden Diziye Modeller

Diziden diziye modellerin girdiyi çıktı dizilerine dönüştürerek çeviri, sohbet robotları ve konuşma tanıma gibi yapay zeka görevlerini nasıl güçlendirdiğini keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Diziden Diziye (Seq2Seq) modeller, bir giriş dizisini, giriş ve çıkış dizilerinin uzunluklarının farklı olabileceği bir çıkış dizisine dönüştürmek için tasarlanmış bir derin öğrenme mimarileri sınıfıdır. Başlangıçta Tekrarlayan Sinir Ağları (RNN'ler ) kullanılarak geliştirilen bu modeller, özellikle Doğal Dil İşleme'de (NLP) sıralı verileri içeren birçok görevin temelini oluşturur. Temel fikir, cümleler, ses klipleri veya zaman serisi verileri gibi dizileri bir alandan diğerine eşlemektir.

Diziden Diziye Modeller Nasıl Çalışır?

Seq2Seq modelleri tipik olarak iki ana bileşenden oluşur: bir kodlayıcı ve bir kod çözücü.

  1. Kodlayıcı: Bu kısım tüm girdi dizisini (örneğin, Fransızca bir cümle) adım adım işler. Her adımda, dahili gizli durumunu günceller. Genellikle "bağlam vektörü" veya "düşünce vektörü" olarak adlandırılan son gizli durum, girdi dizisinin bir özetini veya özünü yakalamayı amaçlar. İlk Seq2Seq modelleri, orijinal Sequence to Sequence Learning makalesinde ayrıntılı olarak açıklandığı gibi, bu amaç için RNN'leri veya LSTM 'leri kullanmıştır.
  2. Kod Çözücü: Bu bileşen, kodlayıcıdan nihai bağlam vektörünü alır ve çıktı dizisini adım adım üretir (örneğin, English'ye çevrilmiş cümle). Bağlam vektörünü başlangıç durumu olarak kullanır ve her zaman adımında çıktı dizisinin bir öğesini üretir, ilerledikçe kendi gizli durumunu günceller.

Özellikle daha uzun diziler için Seq2Seq performansını önemli ölçüde artıran önemli bir yenilik Dikkat Mekanizmasıydı. Dikkat, kod çözücünün her bir çıktı öğesini oluştururken girdi dizisinin gizli durumlarının farklı bölümlerine (yalnızca son bağlam vektörüne değil) geri dönüp bakmasına ve Bahdanau ve diğerleri tarafından önerildiği gibi önemlerini dinamik olarak tartmasına olanak tanır.

Uygunluk ve Evrim

Seq2Seq modelleri, özellikle girdi ve çıktı uzunluklarının değişken olduğu ve hizalamanın karmaşık olduğu görevler için büyük bir atılımı temsil ediyordu. Çeşitli dizi dönüşüm problemlerini ele almak için esnek bir çerçeve sağladılar. Temel olmasına rağmen, orijinal RNN tabanlı Seq2Seq modelleri uzun menzilli bağımlılıklarla ilgili zorluklarla karşılaştı. Bu, tamamen dikkat mekanizmalarına ve paralel işlemeye dayanan Transformatör modellerinin geliştirilmesine yol açtı ve birçok dizi görevinde son teknoloji performans için büyük ölçüde RNN'lerin yerini aldı. Bununla birlikte, temel kodlayıcı-kod çözücü kavramı etkili olmaya devam etmektedir. Gibi çerçeveler PyTorch ve TensorFlow hem geleneksel Seq2Seq hem de modern Transformer modelleri oluşturmak için sağlam araçlar sağlar.

Yapay Zeka ve Makine Öğrenimi Uygulamaları

Modern Transformer tabanlı halefleri de dahil olmak üzere Seq2Seq modelleri çok sayıda uygulamada kullanılmaktadır:

  • Makine Çevirisi: Metni bir kaynak dilden hedef dile çevirme (örneğin, Google Translate gibi hizmetleri destekleme).
  • Metin Özetleme: Uzun makale veya belgelerden daha kısa özetler oluşturma.
  • Sohbet Robotları ve Soru Yanıtlama: Giriş metnine veya sorulara dayalı olarak konuşma yanıtları veya cevapları oluşturma. Birçok modern sohbet robotu GPT-4 gibi gelişmiş Transformer mimarilerinden yararlanır.
  • Konuşma Tanıma: Ses özellikleri dizilerinin metin dizilerine dönüştürülmesi (transkripsiyon).
  • Resim Altyazısı Oluşturma: Giriş görüntüleri için metinsel açıklamalar (kelime dizileri) oluşturma. gibi modeller tarafından gerçekleştirilen nesne algılama görevlerinden farklı olsa da Ultralytics YOLOGörsel girdinin sıralı çıktıya eşlenmesini içerir. Stanford NLP Grubu gibi kurumlardaki araştırmalar genellikle bu alanları araştırmaktadır.

Seq2Seq modelleri öncelikle NLP ile ilişkilendirilse de, bunlardan esinlenen dikkat mekanizmaları bilgisayarla görmede de kullanım alanı bulmaktadır; örneğin, algılama modellerinin belirli bileşenlerinde RT-DETR veya Vision Transformers'da. gibi platformlarda çeşitli modelleri keşfedebilirsiniz. Hugging Face.

Tümünü okuyun