Sözlük

Destek Vektör Makinesi (SVM)

Gerçek dünya uygulamaları ve içgörülerle sınıflandırma, regresyon ve aykırı değer tespiti için Destek Vektör Makinelerinin (DVM'ler) gücünü keşfedin.

Destek Vektör Makinesi (DVM) hem sınıflandırma hem de regresyon görevleri için kullanılan güçlü ve çok yönlü bir denetimli öğrenme algoritmasıdır. DVM özünde, veri noktalarını farklı sınıflara en iyi şekilde ayıran optimum bir hiper düzlem veya karar sınırı bulur. DVM'yi özellikle etkili kılan şey, ayırıcı hiper düzlem ile herhangi bir sınıfın en yakın veri noktaları arasındaki mesafe olan marjı maksimize etme hedefidir. Cortes ve Vapnik'in temel makalesinde ayrıntılı olarak açıklanan bu ilke, modelin genelleme yeteneğini geliştirmeye yardımcı olarak aşırı uyuma daha az eğilimli olmasını sağlar.

Svms Nasıl Çalışır?

Algoritma, her bir veri öğesini n boyutlu bir uzayda (burada n özellik sayısıdır) bir nokta olarak çizerek çalışır. Sınıflandırma daha sonra sınıflar arasında en iyi ayrımı yaratan hiper düzlemin bulunmasıyla gerçekleştirilir.

  • Hiper düzlem: Bu, karar sınırıdır. İki özelliğe sahip bir veri kümesinde bu bir çizgidir; üç özellikte ise bir düzlemdir. Daha fazla özellik için bir hiper düzlem haline gelir.
  • Destek Vektörleri: Bunlar hiper düzleme en yakın olan veri noktalarıdır. Kritiktirler çünkü marjı tanımlarlar ve bunları kaldırmak hiper düzlemin konumunu değiştirecektir. Destek vektörlerinin mükemmel bir görselleştirmesi Stanford'un CS229 ders notlarında bulunabilir.
  • Marj: Marj, destek vektörleri ile hiper düzlem arasındaki boşluktur. DVM'nin amacı, bu marjı maksimize eden hiper düzlemi bulmak ve mümkün olan en sağlam ayrımı oluşturmaktır.
  • Çekirdek Hilesi: Doğrusal olarak ayrılamayan veriler için DVM'ler çekirdek hilesi adı verilen bir teknik kullanır. Bu güçlü yöntem, verilerin yeni uzaydaki koordinatlarını açıkça hesaplamadan doğrusal bir ayırıcının bulunabileceği daha yüksek boyutlu bir uzaya dönüştürülmesini içerir. Radyal Taban Fonksiyonu (RBF) gibi popüler çekirdekler çok karmaşık, doğrusal olmayan ilişkilerin üstesinden gelebilir. Daha fazla ayrıntı için SVM çekirdekleri kılavuzunu inceleyebilirsiniz.

Gerçek Dünya Uygulamaları

DVM'ler, özellikle yüksek boyutlu verilere sahip problemler için birçok alanda etkilidir.

  • Biyoinformatik: Genomik ve proteomikte, DVM'ler proteinleri sınıflandırmak ve gen ifadesi verilerini analiz etmek için kullanılır. Örneğin, binlerce özellik içeren bir görev olan mikroarray verilerine dayalı kanser alt türlerinin belirlenmesine yardımcı olabilirler. Bu da onları sağlık hizmetleri için yapay zeka alanında hayati bir araç haline getirmektedir.
  • Görüntü Sınıflandırma: Derin sinir ağlarının hakimiyetinden önce, SVM'ler görüntü sınıflandırması için en iyi performans gösteren modeldi. MNIST gibi veri kümelerinde el yazısı rakam tanıma ve Caltech-101'de nesne tanıma gibi görevler için başarıyla kullanılmışlardır.
  • Metin Sınıflandırma: Doğal Dil İşleme (NLP) alanında DVM'ler spam tespiti ve duygu analizi gibi görevler için etkilidir. Metin vektörleştirme yöntemleri tarafından oluşturulan yüksek boyutlu özellik uzaylarını verimli bir şekilde yönetebilirler.

Svm Vs. Diğer Algoritmalar

Lojistik Regresyon gibi daha basit algoritmalarla karşılaştırıldığında, DVM'ler sadece ayırıcı bir sınır bulmak yerine marjı maksimize etmeyi amaçlar, bu da daha iyi genellemeye yol açabilir. Karar Ağaçları veya Rastgele Ormanlar gibi ağaç tabanlı yöntemlerin aksine DVM'ler tek bir optimum hiper düzlem oluşturur (muhtemelen yüksek boyutlu bir uzayda). Ultralytics YOLO gibi modern derin öğrenme modelleri ham verilerden ( bilgisayarla görmede (CV) pikseller gibi) otomatik özellik çıkarma konusunda mükemmel olsa da, DVM'ler genellikle dikkatli özellik mühendisliği gerektirir, ancak daha küçük veri kümelerinde veya özelliklerin iyi tanımlandığı belirli yapılandırılmış veri türlerinde olağanüstü iyi performans gösterebilir. UCI Machine Learning Repository'de bu tür birçok veri kümesi bulabilirsiniz.

Popüler uygulamalar arasında LibSVM ve scikit-learn'deki SVM modülü bulunmaktadır. SVM tipik olarak PyTorch veya TensorFlow gibi modern CV çerçevelerinin çekirdeği olmasa da, daha geniş iş akışlarına entegre edilebilir. Bu tür modellerin eğitimi ve yönetimi, diğer çeşitli modellerle birlikte, veri etiketlemeden hiperparametre ayarlamaya ve son model dağıtımına kadar MLOps yaşam döngüsünü basitleştiren Ultralytics HUB gibi platformlar kullanılarak kolaylaştırılabilir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı