Ultralytics YOLO11 ile makine öğreniminde özellik çıkarmanın gücünü keşfedin. Etkili algılama ve analiz için teknikleri öğrenin.
Özellik çıkarma, makine öğrenimi (ML) ve bilgisayarla görmede (CV) hayati bir süreçtir ve ham, genellikle karmaşık verileri algoritmaların etkili bir şekilde işleyebileceği bir biçime dönüştürmek için kritik bir adım görevi görür. Görüntü, ses veya metin gibi yapılandırılmamış veya yüksek boyutlu verilerin, tipik olarak bir özellik vektörü olarak temsil edilen yapılandırılmış bir dizi sayısal özelliğe dönüştürülmesini içerir. Bu özellikler, gürültü ve fazlalıkları atarken orijinal verilerin temel özelliklerini yakalamayı amaçlar. Birincil hedefler arasında boyut azaltma yoluyla veri karmaşıklığını azaltmak, ilgili kalıpları vurgulamak ve verileri makine öğrenimi modelleri için daha uygun hale getirmek yer alır. Bu genellikle gelişmiş model doğruluğu, daha hızlı model eğitimi ve görülmeyen verilere daha iyi genelleme sağlar.
Özellik çıkarma için kullanılan özel teknikler büyük ölçüde işlenen veri türüne bağlıdır.
Görüntü Verileri: Geleneksel bilgisayarla görmede yöntemler, kenarlar, köşeler, dokular ( Gabor filtreleri gibi teknikler kullanılarak) veya renk histogramları gibi belirli özellikleri tespit etmek için manuel olarak algoritmalar tasarlamayı içerir. OpenCV gibi kütüphaneler bu klasik tekniklerin çoğunu uygulamak için araçlar sağlar(OpenCV resmi sitesi). Bununla birlikte, modern derin öğrenmede (DL), özellikle de Evrişimsel Sinir Ağları (CNN'ler) gibi modellerde kullanılan Ultralytics YOLOözellik çıkarma genellikle otomatik olarak öğrenilir. Ağın konvolüsyon katmanları giriş görüntüsüne filtreler uygulayarak, ilk katmanlardaki basit çizgiler ve dokulardan daha derin katmanlardaki nesne parçaları ve nesnelerin tamamına kadar hiyerarşik olarak giderek karmaşıklaşan desenleri yakalayan özellik haritaları oluşturur. Bunun uygulandığı çeşitli bilgisayarla görme görevlerini keşfedebilirsiniz.
Metin Verileri: Doğal Dil İşleme (NLP ) görevleri için özellik çıkarma, kelime önemini temsil etmek için Terim Sıklığı-Ters Belge SıklığıTF) hesaplama veya Word2Vec veya GloVe gibi modeller kullanarak kelime katıştırmaları oluşturma gibi yöntemleri içerebilir. Bu katıştırmalar, kelimeler arasındaki anlamsal ilişkileri yakalayan yoğun vektörlerdir. BERT ve Transformers gibi daha gelişmiş modeller bağlamsal temsilleri doğrudan metinden öğrenir.
Genel Teknikler: Temel Bileşen Analizi (PCA ) ve t-dağılımlı Stokastik Komşu Gömme (t-SNE) gibi yöntemler, çeşitli veri türlerine uygulanabilen genel amaçlı boyut azaltma teknikleridir. Yüksek boyutlu verileri daha düşük boyutlu bir uzaya dönüştürürken, önemli varyans veya komşuluk yapılarını korumayı amaçlarlar, bu da bir özellik çıkarma biçimi olarak düşünülebilir. Scikit-learn bu teknikler için uygulamalar sağlar.
Özellik çıkarma genellikle özellik mühendisliği ile karıştırılır, ancak bunlar farklı kavramlardır.
Derin öğrenme modelleri, görüntü tanıma ve nesne algılama gibi görevler için özellik çıkarma sürecinin çoğunu otomatikleştirirken, uygun veri artırımı veya girdi normalizasyonu gibi özellik mühendisliği ilkeleri, optimum performans elde etmek için çok önemli olmaya devam etmektedir.
Özellik çıkarma, sayısız yapay zeka ve makine öğrenimi uygulaması için temeldir:
Tıbbi Görüntü Analizi: Kanser gibi hastalıkları tespit etmek için X-ışınları, CT'ler veya MRI'lar gibi tıbbi taramaları analiz ederken, görüntülerden belirli özellikler çıkarılır. Bunlar dokulardaki doku modellerini, potansiyel anomalilerin şeklini ve boyutunu ( Beyin Tümörü veri kümesinde bulunan tümörler gibi) veya yoğunluk değişimlerini içerebilir. Çıkarılan bu özellikler daha sonra bir hastalığın varlığını veya evresini tahmin etmek için bir sınıflandırıcıya ( SVM veya sinir ağı gibi) beslenir. Bu, Radyoloji gibi yayınlarda tartışıldığı gibi radyologlara tanı koymada yardımcı olur: Yapay Zeka. Modern sistemler şunları kullanabilir Ultralytics YOLO11Tıbbi görüntü analizi gibi görevler için örtük olarak özellik çıkarır.
Duygu Analizi: Müşteri yorumları veya sosyal medya gönderileri gibi metin verilerinde ifade edilen duyarlılığı (olumlu, olumsuz, nötr) belirlemek için ham metinden özelliklerin çıkarılması gerekir. Bu, pozitif ve negatif kelimelerin sıklığını saymayı(Bag-of-Words), TF skorlarını kullanmayı veya önceden eğitilmiş dil modellerini kullanarak sofistike cümle katıştırmaları oluşturmayı içerebilir. Hugging Face. Bu özellikler metnin duygusal tonunu ölçerek bir makine öğrenimi modelinin müşteri geri bildirimlerini anlamak için çok önemli olan genel duyarlılığı sınıflandırmasına olanak tanır.
Gibi son teknoloji nesne algılama modelleri Ultralytics YOLOv8 ve YOLO11 özellik çıkarma işlemini sinir ağı (NN ) mimarileri içinde dolaylı olarak gerçekleştirmektedir. İlk katmanlar (genellikle omurganın bir parçası) güçlü, öğrenilmiş özellik çıkarıcılar olarak hareket eder. Giriş verileri bu katmanlardan geçerken, hiyerarşik özellikler otomatik olarak tanımlanır ve özellik haritalarında temsil edilir. Süreç büyük ölçüde otomatikleştirilmiş olsa da, özellik çıkarımının anlaşılması, etkili veri ön işleme adımlarının tasarlanmasına, hiperparametre ayarının yapılmasına ve model davranışının yorumlanmasına, potansiyel olarak Ultralytics belgelerinde bulunan araçların veya veri kümelerini ve deneyleri yönetmek için Ultralytics HUB gibi platformların kullanılmasına yardımcı olur. Teknikler, nesne kimliklerini kareler arasında korumak için görünüm özelliklerinin çıkarılabileceği nesne izleme gibi sonraki görevlerde de kullanılır. Gibi çerçeveler PyTorch ve TensorFlow bu modelleri oluşturmak ve eğitmek için temel altyapıyı sağlar.