Sözlük

K-En Yakın Komşular (KNN)

Sınıflandırma ve regresyon görevleri için basit ama güçlü bir makine öğrenimi algoritması olan K-En Yakın Komşular'ı (KNN) keşfedin. Nasıl çalıştığını öğrenin!

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

K-En Yakın Komşular (KNN) hem sınıflandırma hem de regresyon görevleri için kullanılan temel bir makine öğrenimi algoritmasıdır. Basitliği ve sezgisel doğası ile bilinir, bu da onu makine öğrenimi alanında yeni başlayanlar için popüler bir seçim haline getirir. KNN'nin arkasındaki temel fikir, benzer niteliklere sahip veri noktalarının aynı sınıfa ait olma veya benzer değerlere sahip olma eğiliminde olmasıdır. Bu algoritma, eğitim veri kümesindeki en yakın 'K' veri noktasının çoğunluk sınıfına veya ortalama değerine dayalı tahminler yapar.

K-En Yakın Komşular (KNN) Nasıl Çalışır?

KNN algoritması yakınlık prensibine göre çalışır. Yeni, görünmeyen bir veri noktası sunulduğunda, bu nokta ile eğitim veri kümesindeki tüm noktalar arasındaki mesafeyi hesaplar. Daha sonra yeni noktaya en yakın 'K' eğitim noktasını belirler. Sınıflandırma için, yeni noktaya 'K' en yakın komşuları arasında en yaygın olan sınıf atanır. Regresyon için, tahmin edilen değer 'K' en yakın komşularının değerlerinin ortalamasıdır (veya ağırlıklı ortalamasıdır). 'K' seçimi çok önemlidir ve modelin performansını önemli ölçüde etkileyebilir. Daha küçük bir 'K' gürültü duyarlılığına yol açabilirken, daha büyük bir 'K' karar sınırlarını yumuşatabilir ancak diğer sınıflardan noktaları içerebilir.

Mesafe Metrikleri

KNN'deki "en yakın" kavramı bir mesafe metriğine dayanır. Kullanılan yaygın mesafe metrikleri arasında Öklid mesafesi, Manhattan mesafesi ve Minkowski mesafesi yer alır. Her metriğin kendine has özellikleri vardır ve farklı veri türleri için uygundur. Örneğin, Öklid mesafesi genellikle sürekli sayısal veriler için kullanılırken, Manhattan mesafesi aykırı değerlere karşı daha sağlam olabilir.

Uygunluk ve Uygulamalar

KNN, uygulama kolaylığı ve çeşitli alanlardaki etkinliği nedeniyle yaygın olarak kullanılmaktadır. Özellikle veri dağılımı hakkında çok az veya hiç ön bilgi olmadığında kullanışlıdır. KNN, benzer kullanıcıların tercihlerine dayalı olarak kullanıcılara ürün önermek gibi tavsiye sistemlerinde uygulanabilir. Yapay zeka ve makine öğrenimi bağlamında öneri sistemleri hakkında daha fazla bilgi edinebilirsiniz.

Gerçek Dünya Uygulamaları

Örnek 1: Sağlık Hizmetleri

Sağlık hizmetlerinde KNN, benzer hastaların tıbbi geçmişlerine dayanarak bir hastanın belirli bir hastalığa yakalanma olasılığının olup olmadığını tahmin etmek için kullanılabilir. KNN yaş, kan basıncı ve kolesterol seviyeleri gibi faktörleri analiz ederek yeni hastaları risk kategorilerine ayırabilir, erken tanıya ve kişiselleştirilmiş tedavi planlarına yardımcı olabilir. Sağlık hizmetlerinde yapay zeka hakkında daha fazlasını keşfedin.

Örnek 2: Görüntü Tanıma

KNN, el yazısı rakamların tanımlanması veya nesnelerin görüntülerinin sınıflandırılması gibi görüntü tanıma görevlerinde kullanılabilir. KNN, görüntüleri özellik vektörleri olarak temsil ederek yeni görüntüleri eğitim setindeki etiketli görüntülere benzerliklerine göre sınıflandırabilir. Bu uygulama özellikle optik karakter tanıma (OCR) ve otomatik görüntü etiketleme gibi alanlarla ilgilidir.

İlgili Kavramlar

K-Means Kümeleme

Hem KNN hem de K-Means 'K' parametresini içerirken, farklı amaçlara hizmet ederler. K-Means kümeleme için kullanılan denetimsiz bir öğrenme algoritmasıdır ve burada 'K' küme sayısını temsil eder. Buna karşılık KNN, sınıflandırma ve regresyon için kullanılan denetimli bir öğrenme algoritmasıdır ve burada 'K' dikkate alınan komşu sayısını temsil eder. K-Means Kümeleme hakkında daha fazla bilgi edinin.

Boyut Azaltma

KNN'nin performansı, "boyutluluk laneti" olarak bilinen bir olgu olan yüksek boyutlu verilerden etkilenebilir. Temel Bileşen Analizi (PCA) gibi teknikler, temel bilgileri korurken özellik sayısını azaltmak ve böylece KNN'nin verimliliğini ve doğruluğunu artırmak için kullanılabilir.

Avantajlar ve Dezavantajlar

Avantajlar

  • Basitlik: KNN'nin anlaşılması ve uygulanması kolaydır.
  • Eğitim Aşaması Yok: KNN'nin açık bir eğitim aşaması yoktur, bu da onu dinamik veri kümeleri için verimli kılar.
  • Esneklik: Hem sınıflandırma hem de regresyon görevleri için kullanılabilir.

Dezavantajlar

  • Hesaplama Maliyeti: KNN, tüm eğitim noktalarına olan uzaklıkların hesaplanmasını gerektirdiğinden, özellikle büyük veri kümelerinde hesaplama açısından pahalı olabilir.
  • 'K'ya duyarlılık: 'K' seçimi performansı önemli ölçüde etkileyebilir.
  • Boyutluluğun Laneti: Yüksek boyutlu verilerle performans düşer.

Sonuç

K-En Yakın Komşular, çeşitli makine öğrenimi uygulamalarında kendine yer bulan çok yönlü ve sezgisel bir algoritmadır. Veri noktalarının benzerliğine dayalı tahminler yapabilme yeteneği, onu sınıflandırma ve regresyon görevleri için değerli bir araç haline getirmektedir. Bununla birlikte, optimum performans için 'K' seçiminin ve mesafe metriğinin dikkatli bir şekilde değerlendirilmesi şarttır. Gelişmiş makine öğrenimi modellerini ve bunların dağıtımını keşfetmek isteyenler için Ultralytics , Ultralytics YOLO modelleri ve Ultralytics HUB platformu gibi son teknoloji çözümler sunmaktadır.

Tümünü okuyun