Sözlük

Doğrusal Regresyon

Makine öğreniminde Doğrusal Regresyonun gücünü keşfedin! Tahmine dayalı modelleme başarısı için uygulamalarını, faydalarını ve temel kavramlarını öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Doğrusal Regresyon, istatistik ve makine öğreniminde (ML) tahmine dayalı modelleme için kullanılan temel bir algoritmadır. Bir bağımlı değişken (tahmin edilen) ile bir veya daha fazla bağımsız değişken (tahmin ediciler veya özellikler) arasında doğrusal bir ilişki kurmayı amaçlar. En basit ve en yorumlanabilir regresyon tekniklerinden biri olarak, daha karmaşık modelleri anlamak için temel oluşturur ve birçok analitik görevde önemli bir temel görevi görür. Etiketli eğitim verilerinden öğrendiği için denetimli öğrenme kategorisine girer.

Doğrusal Regresyon Nasıl Çalışır?

Temel fikir, tahmin edilen ve gerçek değerler arasındaki farkı en aza indiren veri noktaları boyunca en iyi uyan düz çizgiyi bulmaktır. Bu çizgi, değişkenler arasındaki doğrusal ilişkiyi temsil eder. Sadece bir bağımsız değişken olduğunda, buna Basit Doğrusal Regresyon denir; birden fazla bağımsız değişken varsa, buna Çoklu Doğrusal Regresyon denir. Süreç, her bir bağımsız değişken için katsayıların (veya model ağırlıklarının) tahmin edilmesini içerir; bu katsayılar, tahmin edicideki bir birimlik değişiklik için bağımlı değişkendeki değişikliği ölçer. Gradient Descent gibi teknikler genellikle bir kayıp fonksiyonunu(tipik olarak karesel hataların toplamı) minimize ederek bu optimal katsayıları bulmak için kullanılır. Normalleştirme ve özellik mühendisliği dahil olmak üzere dikkatli veri ön işleme, model performansını önemli ölçüde artırabilir. Etkili veri toplama ve açıklama, güvenilir bir model oluşturmak için ön koşullardır.

Gerçek Dünya Uygulamaları

Doğrusal Regresyon, basitliği ve yorumlanabilirliği nedeniyle çeşitli alanlarda yaygın olarak uygulanmaktadır:

  • Finansal Tahmin: Geçmiş verilere ve ekonomik göstergelere dayanarak hisse senedi fiyatlarını, varlık değerlerini veya ekonomik büyümeyi tahmin etmek. Örneğin, pazarlama harcamalarına ve pazar büyüklüğüne dayalı olarak bir şirketin gelirini tahmin etmek, finans alanında yapay zekanın yaygın bir kullanım alanıdır.
  • Satış Tahmini: Reklam bütçesi, promosyon faaliyetleri ve rakip fiyatlandırması gibi faktörlere dayalı olarak gelecekteki satışları tahmin etmek, envanter yönetimine yardımcı olmak ve yapay zeka ile perakende verimliliği sağlamak.
  • Gayrimenkul Değerleme: Metrekare, yatak odası sayısı, konum ve yaş gibi özelliklere dayalı olarak ev fiyatlarının tahmin edilmesi. Bu, makine öğrenimine giriş derslerinde sıklıkla kullanılan klasik bir örnektir.
  • Risk Değerlendirmesi: Bankacılık sektöründe kredi temerrüt oranları ile borçlu özellikleri arasındaki ilişkinin modellenerek kredi riskinin değerlendirilmesi.
  • Sağlık Hizmetleri Analizi: Yaşam tarzı seçimleri (örn. sigara, diyet) ve sağlık sonuçları (örn. tansiyon) gibi faktörler arasındaki ilişkiyi incelemek, sağlık hizmetlerinde yapay zeka içgörülerine katkıda bulunmak.

Doğrusal Regresyon ve Diğer Modeller

Doğrusal Regresyonu diğer makine öğrenimi modellerinden ayırmak önemlidir:

  • Lojistik Regresyon: İsim benzer olsa da Lojistik Regresyon, Doğrusal Regresyon gibi sürekli değerleri tahmin etmek yerine sınıflandırma görevleri (spam/spam değil gibi kategorileri tahmin etmek) için kullanılır. İkili bir sonucun olasılığını modeller.
  • Karar Ağaçları ve Rastgele Ormanlar: Bu modeller verilerdeki karmaşık, doğrusal olmayan ilişkileri yakalayabilir ve tahmin görevleri için genellikle daha güçlüdür, ancak Doğrusal Regresyondan daha az yorumlanabilir olabilir. Rastgele Ormanlar, birden fazla karar ağacı üzerine inşa edilen bir topluluk yöntemidir.
  • Sinir Ağları (NN) ve Derin Öğrenme (DL): Bilgisayarla görmede (CV) yaygın olarak kullanılan Evrişimsel Sinir Ağları (CNN'ler) gibi mimariler de dahil olmak üzere bu modeller, oldukça karmaşık, doğrusal olmayan modelleri modelleyebilir. Güçlüdürler ancak genellikle Ultralytics HUB gibi platformlar kullanılarak yönetilen önemli veri ve hesaplama kaynakları gerektirirler. Gibi modeller Ultralytics YOLO11 Doğrusal Regresyondan çok daha karmaşık olan gelişmiş DL modellerine örnek olarak verilebilir. Gelişmiş mimarilere ilişkin içgörüler için farklı YOLO modelleri arasındaki karşılaştırmaları keşfedebilirsiniz.

Uygunluk ve Sınırlamalar

Doğrusal Regresyon, değişkenler arasında doğrusal bir ilişki, hataların bağımsızlığı ve hataların sabit varyansı (homoscedasticity) olduğunu varsayar. Bu varsayımların ihlal edilmesi zayıf model performansına yol açabilir. Aynı zamanda aykırı değerlere karşı da hassastır ve bu da uydurulan doğruyu orantısız bir şekilde etkileyebilir. Bu sınırlamalara rağmen, basitliği, hızı ve yüksek yorumlanabilirliği onu birçok regresyon problemi için mükemmel bir başlangıç noktası ve temel veri ilişkilerini anlamak için değerli bir araç haline getirmektedir. Genellikle daha karmaşık modellerin değerlendirildiği bir ölçüt olarak hizmet eder. Scikit-learn gibi kütüphaneler pratik kullanım için sağlam uygulamalar sağlar ve gelişmiş teknikleri keşfetmeden veya model eğitimi ve dağıtımı için platformları kullanmadan önce ilkelerini anlamak çok önemlidir. Modellerin, ilgili bağlamlarda doğruluk veya F1 puanı gibi ölçütlerin yanı sıra Ortalama Karesel Hata (MSE) veya R-kare gibi ölçütler kullanılarak değerlendirilmesi, doğrulama verileri üzerindeki etkinliğin değerlendirilmesine yardımcı olur. Model dağıtımı için en iyi uygulamaların takip edilmesi güvenilir gerçek dünya uygulaması sağlar ve model eğitimi için ipuçlarının uygulanması sonuçları iyileştirebilir.

Tümünü okuyun