Yapay zekada eğitim verilerinin önemini keşfedin. Kaliteli veri kümelerinin gerçek dünyadaki görevler için doğru ve sağlam makine öğrenimi modellerini nasıl güçlendirdiğini öğrenin.
Yapay Zeka (AI) ve Makine Öğrenimi (ML) alanlarında eğitim verileri, modellere sınıflandırma veya tahmin gibi belirli görevleri nasıl gerçekleştireceklerini öğretmek için kullanılan temel veri kümesidir. Her örneğin tipik olarak bir girdiyi karşılık gelen istenen bir çıktı veya etiketle eşleştirdiği geniş bir örnek koleksiyonundan oluşur. Denetimli Öğrenme gibi süreçler aracılığıyla model bu verileri analiz eder, altta yatan kalıpları ve ilişkileri tanımlar ve girdilerden çıktılara eşlemeyi öğrenmek için dahili parametrelerini(model ağırlıkları) ayarlar. Bu öğrenme, yeni, daha önce görülmemiş veriler sunulduğunda modelin doğru tahminler veya kararlar vermesini sağlar.
Eğitim verilerini bir yapay zeka modeli için ders kitabı ve alıştırma egzersizleri olarak düşünün. Bu, öğrenme aşamasında örnek olarak kullanılmak üzere özel olarak biçimlendirilmiş, dikkatlice düzenlenmiş bir bilgi kümesidir. Örneğin, Nesne Algılama gibi Bilgisayarla Görme (CV) görevlerinde, eğitim verileri, bu görüntülerdeki nesnelerin konumunu (sınırlayıcı kutular) ve sınıfını belirten ek açıklamalarla (etiketler) eşleştirilmiş görüntülerden veya video karelerinden ( giriş özellikleri) oluşur. Bu etiketlerin oluşturulması Veri Etiketleme olarak bilinen çok önemli bir adımdır. Model bu verileri yinelemeli olarak işler, tahminlerini gerçek etiketlerle karşılaştırır ve hatayı veya kayıp fonksiyonunu en aza indirmek için geri yayılma ve gradyan inişi gibi teknikleri kullanarak parametrelerini ayarlar.
Bir yapay zeka modelinin performansı ve güvenilirliği, eğitim verilerinin kalitesi, miktarı ve çeşitliliğine doğrudan bağlıdır. Yüksek kaliteli, temsili veriler, yüksek Doğruluk elde eden ve gerçek dünya senaryolarına iyi genelleme yapan modeller oluşturmak için gereklidir(ML'de Genelleme). Buna karşılık, yetersiz, gürültülü veya taraflı eğitim verileri düşük performans, Aşırı Uyum (modelin eğitim verilerinde iyi performans gösterirken yeni verilerde kötü performans göstermesi) veya doğal Veri Seti Önyargısı nedeniyle adil olmayan ve ayrımcı sonuçlar gibi önemli sorunlara yol açabilir. Önyargının ele alınması, YZ Etiğinin kilit bir yönüdür. Bu nedenle, titiz veri toplama, açıklama ve hazırlık, başarılı YZ sistemlerinin geliştirilmesinde kritik aşamalardır.
Eğitim verileri, çeşitli alanlardaki sayısız yapay zeka uygulamasının yakıtıdır. İşte iki örnek:
Eğitim verilerinin yüksek kalitede olmasını sağlamak çok önemlidir ve birkaç temel adım içerir. Veri Temizleme (Wikipedia) hataları, tutarsızlıkları ve eksik değerleri giderir. Veri Ön İşleme, ham verileri model için uygun bir formata dönüştürür. Veri Artırma gibi teknikler, mevcut verilerin değiştirilmiş kopyalarını oluşturarak (örneğin, görüntüleri döndürerek veya kırparak) veri kümesini yapay olarak genişletir, bu da model sağlamlığını artırmaya ve aşırı uyumu azaltmaya yardımcı olur. Ultralytics Veri Kümeleri Gezgini gibi araçlarla kolaylaştırıldığı gibi, keşif yoluyla verilerinizi anlamak da eğitim sürecine başlamadan önce çok önemlidir.
Tipik bir makine öğrenimi projesinde veriler üç farklı kümeye ayrılır:
Bu veri kümeleri arasında sıkı bir ayrım sağlamak, güvenilir modeller geliştirmek ve yeteneklerini doğru bir şekilde değerlendirmek için çok önemlidir. Ultralytics HUB gibi platformlar, model geliştirme yaşam döngüsü boyunca bu veri kümelerini etkili bir şekilde yönetmek için araçlar sunar. Gibi son teknoloji modeller Ultralytics YOLO genellikle kapsamlı eğitim verileri olarak hizmet veren COCO veya ImageNet gibi büyük kıyaslama veri kümeleri üzerinde önceden eğitilir.