Sözlük

Temel Modeli

Temel modellerin ölçeklenebilir mimariler, geniş ön eğitim ve farklı uygulamalar için uyarlanabilirlik ile yapay zekada nasıl devrim yarattığını keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Temel modeller, devasa ölçekleri ve geniş, çeşitli veri kümeleri üzerinde eğitimleri ile karakterize edilen Yapay Zeka'da (AI) önemli bir paradigma değişimini temsil eder. Belirli görevler için tasarlanan geleneksel makine öğrenimi (ML) modellerinin aksine, temel modeller geniş veriler üzerinde önceden eğitilir ve bu sayede göreve özgü nispeten az veri ile çok çeşitli alt uygulamalar için uyarlanabilir veya ince ayaryapılabilir. Genellikle transfer öğrenmeden yararlanan bu yaklaşım, yapay zeka gelişimini hızlandırır ve güçlü yetenekleri daha erişilebilir hale getirir. Bu terim Stanford İnsan Merkezli Yapay Zeka Enstitüsü (HAI) tarafından popüler hale getirilmiştir.

Temel Modellerinin Temel Özellikleri

Temel modeller üç temel özellik ile tanımlanır: ölçek, genellik ve uyarlanabilirlik.

  1. Ölçek: Genellikle milyarlarca veya trilyonlarca veri noktası içeren metin, görüntü, kod ve diğer veri türlerini içeren web ölçekli veri kümeleri üzerinde eğitilirler. Tipik olarak milyarlarca parametreye sahiptirler ve önemli hesaplama kaynakları gerektirirler (GPU) eğitim için.
  2. Genellik: Kapsamlı ön eğitim, bu modellere eğitim verilerindeki kalıplar, sözdizimi, anlambilim ve bağlam hakkında geniş bir anlayış kazandırır. Bu, bazen sıfır vuruşlu öğrenme veya birkaç vuruşlu öğrenme yoluyla açıkça eğitilmedikleri görevlerde iyi performans göstermelerini sağlar.
  3. Uyarlanabilirlik: Temel güçleri, ince ayar yoluyla belirli görevlere uyarlanabilmelerinde yatmaktadır. Bu, daha küçük, göreve özgü bir veri kümesi üzerinde ek eğitim içerir ve bir modeli sıfırdan eğitmeye kıyasla gereken veri ve zamanı önemli ölçüde azaltır. Sıralı verileri işlemesi ve uzun menzilli bağımlılıkları yakalamasıyla bilinen Transformer gibi mimariler, özellikle Doğal Dil İşleme (NLP ) ve giderek artan bir şekilde Bilgisayarla Görme (CV) alanlarında yaygın olarak kullanılmaktadır.

Uygulamalar ve Örnekler

Vakıf modellerinin çok yönlülüğü, çok sayıda alanda inovasyonu teşvik etmektedir.

  • Doğal Dil İşleme: GPT-4 ve BERT gibi modeller metin oluşturma, çeviri, özetleme ve sofistike sohbet robotlarına güç sağlama gibi görevlerde mükemmeldir. Örneğin, bir müşteri hizmetleri şirketi, yüksek doğrulukta bir dahili soru yanıtlama sistemi oluşturmak için destek biletleri üzerinde BERT gibi önceden eğitilmiş bir dil modeline ince ayar yapabilir.
  • Bilgisayarla Görme: CLIP (Contrastive Language-Image Pre-training) ve Segment Anything Model (SAM) gibi vizyon temel modelleri görüntü sınıflandırma, nesne algılama ve görüntü segmentasyonu gibi görevleri yerine getirir. Örneğin, bir tarım teknolojisi şirketi, geleneksel denetimli öğrenme yaklaşımlarından çok daha az etiketli veri gerektiren farklı mahsul türlerini hassas bir şekilde segmentlere ayırmak veya hastalıktan etkilenen alanları belirlemek için SAM 'ı drone görüntülerinde ince ayar yaparak uyarlayabilir.
  • Çok Modlu Uygulamalar: Modeller, metin açıklamalarından görüntü oluşturma(metinden görüntüye) veya görüntülerle ilgili soruları yanıtlama gibi görevleri mümkün kılan birden fazla veri türü (ör. metin ve görüntüler) üzerinde giderek daha fazla eğitilmektedir.

Temel Modeller ve Geleneksel Modeller

Temel fark, kapsam ve yeniden kullanılabilirlikte yatmaktadır. Geleneksel makine öğrenimi modelleri genellikle özel bir veri kümesi kullanılarak tek ve belirli bir görev için eğitilir. Yeni bir görev ortaya çıkarsa, genellikle yeni bir modelin oluşturulması ve sıfırdan eğitilmesi gerekir. Ancak temel modeller yeniden kullanılabilir bir temel sağlar. Geniş ön eğitimleri genel bilgiyi yakalar ve bu bilgi daha sonra verimli bir şekilde özelleştirilebilir.

Bu paradigma, her yeni görev için kapsamlı veri toplama ve açıklama ihtiyacının azalması ve potansiyel olarak daha hızlı model dağıtımı gibi avantajlar sunmaktadır. Bununla birlikte, ön eğitim için gereken muazzam hesaplama maliyeti ve enerji, eğitim verilerinde bulunan önyargıları devralma ve güçlendirme riski ve bunların potansiyel kötüye kullanımı ve toplumsal etkileri ile ilgili önemli etik hususlar gibi zorluklar da bulunmaktadır. Ultralytics HUB gibi platformlar, gelişmiş yapay zeka modellerine erişim, eğitim ve dağıtım sürecini kolaylaştırmayı ve kullanıcıların bu güçlü teknolojilerden etkili bir şekilde yararlanmasına yardımcı olmayı amaçlamaktadır.

Tümünü okuyun