Sözlük

Temel Bileşen Analizi (PCA)

Temel Bileşen Analizi (PCA) ile yüksek boyutlu verileri basitleştirin. Yapay zeka, makine öğrenimi modelleri ve veri görselleştirme verimliliğini bugün geliştirin!

Temel Bileşen Analizi (PCA), makine öğreniminde (ML) boyut azaltma için temel bir tekniktir. Birincil amacı, orijinal bilginin (varyans) mümkün olduğunca çoğunu korurken yüksek boyutlu verilerin karmaşıklığını basitleştirmektir. Bunu, orijinal değişkenler kümesini "temel bileşenler" adı verilen yeni, daha küçük bir ilişkisiz değişkenler kümesine dönüştürerek başarır. Bu bileşenler, ilk birkaçı orijinal veri setinde bulunan varyasyonun çoğunu koruyacak şekilde sıralanır. Bu, PCA'yı veri ön işleme, veri keşfi ve veri görselleştirme için paha biçilmez bir araç haline getirir.

Temel Bileşen Analizi Nasıl Çalışır?

PCA, özünde bir veri kümesindeki maksimum varyans yönlerini tanımlar. Veri noktalarından oluşan bir dağılım grafiği düşünün; PCA, verinin yayılımını en iyi yakalayan çizgiyi bulur. Bu çizgi birinci temel bileşeni temsil eder. İkinci temel bileşen, bir sonraki en büyük varyans miktarını yakalayan, birinciye dik olan başka bir çizgidir. Orijinal verileri bu yeni bileşenlere yansıtarak PCA, gürültüyü filtreleyen ve en önemli kalıpları vurgulayan daha düşük boyutlu bir temsil oluşturur. Bu süreç, aşırı uyum riskini azaltarak ve eğitim için gereken hesaplama kaynaklarını azaltarak model performansını iyileştirmek için çok önemlidir.

Gerçek Dünya AI/ML Uygulamaları

PCA, Yapay Zeka (AI) ve bilgisayarla görme (CV) dahilindeki çeşitli alanlarda yaygın olarak kullanılmaktadır.

  1. Yüz Tanıma ve Görüntü Sıkıştırma: Bilgisayarla görmede görüntüler, her pikselin bir özellik olduğu yüksek boyutlu verilerdir. PCA, görüntüleri temsil etmek için gereken boyut sayısını azaltarak görüntüleri sıkıştırmak için kullanılabilir. Ünlü bir uygulama, "özyüzler" olarak bilinen tekniğin yüzlerin en önemli özelliklerini (temel bileşenler) tanımlamak için PCA'yı kullandığı yüz tanımadır. Bu basitleştirilmiş temsil, yüzlerin saklanmasını ve karşılaştırılmasını çok daha verimli hale getirir; bu da görüntü sınıflandırma ve biyometrik güvenlik gibi görevler için hayati önem taşır. Derinlemesine bir inceleme için özyüzlere giriş bölümüne bakın.
  2. Biyoinformatik ve Genetik Analiz: Genomik veri kümeleri genellikle birçok örnekte binlerce gen için gen ifade seviyeleri gibi binlerce özellik içerir. Bu tür yüksek boyutlu verileri analiz etmek, boyutsallık laneti nedeniyle zordur. PCA, Ulusal İnsan Genomu Araştırma Enstitüsü gibi kurumlardaki araştırmacıların bu karmaşıklığı azaltmalarına, verileri görselleştirmelerine ve benzer genetik profillere sahip hasta veya numune kümelerini belirlemelerine yardımcı olur. Bu, hastalıklarla veya tedaviye verilen yanıtlarla ilgili kalıpları ortaya çıkararak kişiselleştirilmiş tıp alanındaki araştırmaları hızlandırabilir.

PCA ve Diğer Teknikler

PCA doğrusal bir tekniktir, yani değişkenler arasındaki ilişkilerin doğrusal olduğunu varsayar. Güçlü ve yorumlanabilir olsa da, karmaşık, doğrusal olmayan yapıları etkili bir şekilde yakalayamayabilir.

  • Otomatik kodlayıcılar: Bunlar karmaşık, doğrusal olmayan veri temsillerini öğrenebilen sinir ağı tabanlı tekniklerdir. Genellikle PCA'dan daha güçlüdürler ancak daha az yorumlanabilir ve hesaplama açısından daha pahalıdırlar. Bunları PyTorch veya TensorFlow gibi çerçeveler kullanarak uygulayabilirsiniz.
  • t-dağıtılmış Stokastik Komşu Gömme (t-SNE): Öncelikle bir görselleştirme tekniği olan t-SNE, doğrusal olmayanlar da dahil olmak üzere yüksek boyutlu verilerdeki yerel yapı ve kümeleri ortaya çıkarmada başarılıdır. Ancak küresel yapıyı PCA kadar iyi koruyamaz ve hesaplama açısından yoğundur. Scikit-learn hem PCA hem de t-SNE için uygulamalar sağlar.

Daha gelişmiş teknikler mevcut olsa da PCA, genellikle veri keşfi ve ön işleme boru hatlarında bir temel veya ilk adım olarak kullanılan değerli bir araç olmaya devam etmektedir. Ultralytics ekosisteminde, Ultralytics YOLO gibi modeller CNN omurgalarında yerleşik özellik çıkarımı kullanırken, boyutsallık azaltma ilkeleri kilit öneme sahiptir. Ultralytics HUB gibi platformlar, veri kümelerinin düzenlenmesinden modellerin dağıtılmasına kadar tüm makine öğrenimi iş akışının yönetilmesine yardımcı olur ve bu tür ön işleme adımları optimum sonuçlar elde etmek için kritik öneme sahiptir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı