Sözlük

Eğitim Verileri

Yapay zekada eğitim verilerinin önemini keşfedin. Kaliteli veri kümelerinin gerçek dünyadaki görevler için doğru ve sağlam makine öğrenimi modellerini nasıl güçlendirdiğini öğrenin.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Yapay Zeka (AI) ve Makine Öğrenimi (ML) alanlarında eğitim verileri, modellere sınıflandırma veya tahmin gibi belirli görevleri nasıl gerçekleştireceklerini öğretmek için kullanılan temel veri kümesidir. Her örneğin tipik olarak bir girdiyi karşılık gelen istenen bir çıktı veya etiketle eşleştirdiği geniş bir örnek koleksiyonundan oluşur. Denetimli Öğrenme gibi süreçler aracılığıyla model bu verileri analiz eder, altta yatan kalıpları ve ilişkileri tanımlar ve girdilerden çıktılara eşlemeyi öğrenmek için dahili parametrelerini(model ağırlıkları) ayarlar. Bu öğrenme, yeni, daha önce görülmemiş veriler sunulduğunda modelin doğru tahminler veya kararlar vermesini sağlar.

Eğitim Verisi Nedir?

Eğitim verilerini bir yapay zeka modeli için ders kitabı ve alıştırma egzersizleri olarak düşünün. Bu, öğrenme aşamasında örnek olarak kullanılmak üzere özel olarak biçimlendirilmiş, dikkatlice düzenlenmiş bir bilgi kümesidir. Örneğin, Nesne Algılama gibi Bilgisayarla Görme (CV) görevlerinde, eğitim verileri, bu görüntülerdeki nesnelerin konumunu (sınırlayıcı kutular) ve sınıfını belirten ek açıklamalarla (etiketler) eşleştirilmiş görüntülerden veya video karelerinden ( giriş özellikleri) oluşur. Bu etiketlerin oluşturulması Veri Etiketleme olarak bilinen çok önemli bir adımdır. Model bu verileri yinelemeli olarak işler, tahminlerini gerçek etiketlerle karşılaştırır ve hatayı veya kayıp fonksiyonunu en aza indirmek için geri yayılma ve gradyan inişi gibi teknikleri kullanarak parametrelerini ayarlar.

Eğitim Verilerinin Önemi

Bir yapay zeka modelinin performansı ve güvenilirliği, eğitim verilerinin kalitesi, miktarı ve çeşitliliğine doğrudan bağlıdır. Yüksek kaliteli, temsili veriler, yüksek Doğruluk elde eden ve gerçek dünya senaryolarına iyi genelleme yapan modeller oluşturmak için gereklidir(ML'de Genelleme). Buna karşılık, yetersiz, gürültülü veya taraflı eğitim verileri düşük performans, Aşırı Uyum (modelin eğitim verilerinde iyi performans gösterirken yeni verilerde kötü performans göstermesi) veya doğal Veri Seti Önyargısı nedeniyle adil olmayan ve ayrımcı sonuçlar gibi önemli sorunlara yol açabilir. Önyargının ele alınması, YZ Etiğinin kilit bir yönüdür. Bu nedenle, titiz veri toplama, açıklama ve hazırlık, başarılı YZ sistemlerinin geliştirilmesinde kritik aşamalardır.

Gerçek Dünya Uygulamalarında Eğitim Verisi Örnekleri

Eğitim verileri, çeşitli alanlardaki sayısız yapay zeka uygulamasının yakıtıdır. İşte iki örnek:

  1. Otonom Araçlar: Sürücüsüz araçlar, algılama sistemleri için büyük ölçüde eğitim verilerine dayanır. Bu veriler arasında kameralar, LiDAR ve radar sensörlerinden alınan ve diğer araçlar, yayalar, bisikletliler, trafik ışıkları ve şerit işaretleri gibi nesnelerle titizlikle etiketlenmiş büyük miktarda görüntü yer almaktadır. Waymo'nun teknolojisinde kullanılanlar gibi modeller, karmaşık ortamlarda güvenli bir şekilde nasıl gezineceklerini öğrenmek için Argoverse gibi veri kümeleri üzerinde eğitilir. Daha fazla ayrıntı için otomotiv çözümlerinde yapay zekayı keşfedin.
  2. Duygu Analizi: Doğal Dil İşleme'de (NLP), duygu analizi modelleri metnin arkasındaki duygusal tonu belirler. Eğitim verileri, 'olumlu', 'olumsuz' veya 'nötr' gibi duygularla etiketlenmiş metin örneklerinden (örneğin, müşteri yorumları, sosyal medya gönderileri) oluşur(Duygu Analizi - Wikipedia). Bu, işletmelerin kamuoyu görüşünü veya müşteri memnuniyetini otomatik olarak ölçmesine olanak tanır.

Veri Kalitesi ve Hazırlığı

Eğitim verilerinin yüksek kalitede olmasını sağlamak çok önemlidir ve birkaç temel adım içerir. Veri Temizleme (Wikipedia) hataları, tutarsızlıkları ve eksik değerleri giderir. Veri Ön İşleme, ham verileri model için uygun bir formata dönüştürür. Veri Artırma gibi teknikler, mevcut verilerin değiştirilmiş kopyalarını oluşturarak (örneğin, görüntüleri döndürerek veya kırparak) veri kümesini yapay olarak genişletir, bu da model sağlamlığını artırmaya ve aşırı uyumu azaltmaya yardımcı olur. Ultralytics Veri Kümeleri Gezgini gibi araçlarla kolaylaştırıldığı gibi, keşif yoluyla verilerinizi anlamak da eğitim sürecine başlamadan önce çok önemlidir.

Eğitim Verileri ile Doğrulama ve Test Verileri

Tipik bir makine öğrenimi projesinde veriler üç farklı kümeye ayrılır:

  • Eğitim Verileri: Parametrelerini ayarlayarak modeli eğitmek için doğrudan kullanılan en büyük kısım. Etkili eğitim genellikle model eğitimi için ipuçlarının dikkatlice değerlendirilmesini içerir.
  • Doğrulama Verileri: Modelin açıkça öğrenmediği veriler üzerindeki performansını değerlendirmek için eğitim sırasında periyodik olarak kullanılan ayrı bir alt küme. Bu, Hiperparametre Optimizasyonu (Wikipedia) gibi işlemler aracılığıyla Hiperparametrelerin (örn. öğrenme oranı, yığın boyutu) ayarlanmasına yardımcı olur ve aşırı uyuma karşı erken bir uyarı sağlar. Bu değerlendirme için doğrulama modu kullanılır.
  • Test Verisi: Eğitim ve doğrulama sırasında görülmeyen, yalnızca model tamamen eğitildikten sonra kullanılan bağımsız bir veri kümesi. Modelin genelleme kabiliyetinin ve gerçek dünyada beklenen performansının nihai, tarafsız değerlendirmesini sağlar. Dağıtımdan önce titiz model testi çok önemlidir.

Bu veri kümeleri arasında sıkı bir ayrım sağlamak, güvenilir modeller geliştirmek ve yeteneklerini doğru bir şekilde değerlendirmek için çok önemlidir. Ultralytics HUB gibi platformlar, model geliştirme yaşam döngüsü boyunca bu veri kümelerini etkili bir şekilde yönetmek için araçlar sunar. Gibi son teknoloji modeller Ultralytics YOLO genellikle kapsamlı eğitim verileri olarak hizmet veren COCO veya ImageNet gibi büyük kıyaslama veri kümeleri üzerinde önceden eğitilir.

Tümünü okuyun