Sözlük

Destek Vektör Makinesi (SVM)

Gerçek dünya uygulamaları ve içgörülerle sınıflandırma, regresyon ve aykırı değer tespiti için Destek Vektör Makinelerinin (DVM'ler) gücünü keşfedin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Destek Vektör Makinesi (SVM), öncelikle sınıflandırma görevleri için kullanılan güçlü bir denetimli makine öğrenimi algoritmasıdır, ancak regresyon ve aykırı değer tespitine de uygulanabilir. Temelde bir SVM modeli, verilerinizdeki farklı sınıfları ayıran en uygun sınırı bulmaya çalışır. Hiper düzlem olarak bilinen bu sınır, marjı veya hiper düzlem ile her sınıftan en yakın veri noktaları arasındaki mesafeyi maksimize edecek şekilde seçilir. Marj maksimizasyonuna odaklanma, DVM'leri genelleme konusunda özellikle etkili kılan şeydir, yani görünmeyen veriler üzerinde iyi performans gösterirler.

SVM Nasıl Çalışır?

SVM, özünde bir veri kümesini farklı sınıflara ayırmak için en iyi hiper düzlemi bulmayı amaçlar. Bir grafik üzerinde iki grup veri noktası olduğunu ve bunları ayırmak için bir çizgi çizmek istediğinizi düşünün. DVM herhangi bir çizgi çizmez; her iki grubun en yakın noktalarından en uzakta olan çizgiyi bulur. Bu en yakın noktalar destek vektörleri olarak adlandırılır ve hiper düzlemin ve dolayısıyla karar sınırının tanımlanmasında çok önemlidir.

DVM'ler çok yönlüdür ve hem doğrusal hem de doğrusal olmayan sınıflandırma problemlerini ele alabilir. Doğrusal olarak ayrılabilir veriler için basit bir düz çizgi (2D'de) veya hiper düzlem (daha yüksek boyutlarda) yeterlidir. Bununla birlikte, daha karmaşık, doğrusal olmayan veri kümeleri için DVM'ler çekirdek hilesi adı verilen bir teknik kullanır. Bu, hesaplama açısından pahalı dönüşümü gerçekten gerçekleştirmeden, verileri doğrusal bir hiper düzlemin sınıfları etkili bir şekilde ayırabileceği daha yüksek boyutlu uzaylara dolaylı olarak eşlemelerine olanak tanır. Yaygın çekirdekler arasında, her biri farklı veri dağılımı türlerine uygun olan doğrusal, polinom ve radyal tabanlı fonksiyon (RBF) çekirdekleri bulunur.

Uygunluk ve Uygulamalar

DVM'ler, yüksek boyutlu uzaylarda sağlamlıkları ve etkinlikleri nedeniyle makine öğreniminde oldukça değerlidir. Özellikle sınıflar arasında net bir ayrım marjının olduğu ancak sınırların karmaşık olduğu karmaşık veri kümeleriyle uğraşırken kullanışlıdırlar. Yeni derin öğrenme modelleri birçok alanda yaygınlaşmasına rağmen, DVM'ler geçerliliğini korumakta ve genellikle aşağıdaki senaryolarda tercih edilmektedir:

  • Yüksek boyutluluk: SVM'ler, özellik sayısı örnek sayısından çok daha fazla olduğunda bile iyi performans gösterir. Bu, seyrek, yüksek boyutlu verilerle mücadele edebilen diğer bazı algoritmalardan farklıdır.
  • Açık ayrım marjı: Sınıflar arasında belirgin bir ayrım olduğunda, DVM'ler etkili sınırlar bulabilir ve genellikle diğer sınıflandırıcılardan daha iyi performans gösterir.
  • Yorumlanabilirlik ihtiyacı: Karar ağaçları kadar doğal olarak yorumlanabilir olmasa da DVM'ler karmaşık sinir ağlarından daha şeffaftır. Destek vektörleri, sınıflandırma için hangi veri noktalarının en kritik olduğuna dair içgörü sağlar.

DVM'ler, aşağıdakiler de dahil olmak üzere çeşitli alanlarda uygulama alanı bulmuştur:

  • Görüntü Sınıflandırma: Bilgisayarla görmede DVM'ler görüntü sınıflandırma görevleri için kullanılabilir. Örneğin, görüntüleri kedi ve köpek gibi kategorilere veya Ultralytics YOLO modelleri tarafından tespit edilen farklı nesne türlerine göre sınıflandırabilirler.
  • Metin ve Belge Sınıflandırma: DVM'ler duygu analizi, spam algılama ve haber makalelerini kategorize etme gibi görevler için doğal dil işlemede etkilidir. Metin verilerinde yaygın olan yüksek boyutlu özellik uzaylarının üstesinden gelebilirler.
  • Tıbbi Teşhis: Sağlık hizmetlerinde DVM'ler, radyoloji görüntülerindeki kanserli hücreleri tanımlamak veya hasta verilerine dayanarak hastalıkları teşhis etmek gibi tıbbi görüntüleri sınıflandırmak için tıbbi görüntü analizinde kullanılır.
  • Biyoinformatik: DVM'ler, biyoinformatik araştırmalarında dizi sınıflandırması, protein yapısı tahmini ve gen ifadesi analizi için kullanılır.

Avantajlar ve Sınırlamalar

DVM'ler çeşitli avantajlar sunar:

  • Yüksek boyutlarda etkilidir: Belirtildiği gibi, DVM'ler çok sayıda özelliğe sahip uzaylarda mükemmeldir.
  • Bellek açısından verimli: Karar fonksiyonunda eğitim noktalarının bir alt kümesini (destek vektörleri) kullanırlar ve bu da onları bellek açısından verimli hale getirir.
  • Çok yönlü çekirdek fonksiyonları: Çekirdek hilesi, DVM'lerin doğrusal olmayan karar sınırlarını etkili bir şekilde modellemesine olanak tanır.

Bununla birlikte, DVM'lerin de sınırlamaları vardır:

  • Hesaplama karmaşıklığı: Sıralı Minimal Optimizasyon (SMO) gibi teknikler bunu azaltmaya yardımcı olsa da eğitim, özellikle büyük veri kümelerinde hesaplama açısından yoğun olabilir.
  • Parametre ayarı: Düzenli hale getirme parametresi (C) ve çekirdek parametreleri gibi çekirdek ve hiperparametrelerin seçimi performansı önemli ölçüde etkileyebilir ve genellikle hiperparametre ayarlama gibi teknikler aracılığıyla dikkatli bir ayarlama gerektirir.
  • Doğası gereği olasılıksal değildir: SVM'ler bir sınıf etiketi çıktısı verir, ancak lojistik regresyon veya Naive Bayes gibi olasılıksal modellerin aksine olasılık tahminleri ek kalibrasyon gerektirir.

Gerçek Dünyadan Örnekler

  1. Yüz Tanıma: DVM'ler yüz tanıma sistemlerinde yüz özelliklerini sınıflandırmak ve bireyleri tanımlamak için kullanılır. Yüz görüntülerinden oluşan bir veri kümesi verildiğinde, bir DVM farklı yüzleri ayırt etmek için eğitilebilir ve güvenlik veya kişisel tanımlama uygulamalarında kullanılan bir yüz tanıma sisteminin temelini oluşturur.

  2. Spam E-posta Tespiti: SVM'ler spam e-postaları filtrelemede oldukça etkilidir. Kelime sıklıkları, e-posta başlıkları ve gönderen bilgileri gibi e-posta içeriğinden ve meta verilerinden çıkarılan özellikler üzerinde bir SVM'yi eğiterek, model gelen e-postaları spam veya spam olmayan olarak doğru bir şekilde sınıflandırabilir, e-posta güvenliğini ve kullanıcı deneyimini geliştirebilir.

Sonuç olarak, Destek Vektör Makineleri, özellikle yüksek boyutlu ortamlarda veya sınıflar arasında net bir ayrım marjı olduğunda, sınıflandırma ve diğer görevler için çok uygun olan sağlam ve çok yönlü bir makine öğrenimi algoritmasıdır. En yeni derin öğrenme teknolojisi olmasalar da, etkinlikleri ve teorik temelleri yapay zeka alanındaki geçerliliklerinin devam etmesini sağlamaktadır.

Tümünü okuyun