Eğitim verilerinin AI modellerini nasıl güçlendirdiğini öğrenin. Kaynak bulma, açıklama ekleme ve bilgisayar görme görevlerinde üstün doğruluk için Ultralytics nasıl eğitebileceğinizi keşfedin.
Eğitim verileri, makine öğrenimi modeline kalıpları nasıl tanıyacağını, tahminlerde nasıl bulunacağını veya belirli görevleri nasıl gerçekleştireceğini öğretmek için kullanılan ilk veri kümesidir. Yapay zeka sistemleri için temel ders kitabı görevi görür ve algoritmanın iç parametrelerini ayarlamak için analiz ettiği temel gerçeği sağlar. Denetimli öğrenme bağlamında eğitim verileri, modelin ikisi arasındaki ilişkiyi öğrenmesini sağlayan, karşılık gelen çıktı etiketleriyle eşleştirilmiş girdi örneklerinden oluşur . Bu verilerin kalitesi, miktarı ve çeşitliliği, modelin nihai doğruluğunu ve yeni, görülmemiş bilgilere genelleme yeteneğini doğrudan etkiler.
Eğitim verilerinin temel işlevi, modelin tahminleri ile gerçek sonuçlar arasındaki hatayı en aza indirmektir. Model eğitim süreci boyunca algoritma, verileri yinelemeli olarak işleyerek, belirli etiketlerle ilişkili özellikleri (örneğin, bir görüntüdeki kenarlar veya bir cümledeki anahtar kelimeler) belirler. Bu süreç, eğitim sırasında hiperparametreleri ayarlamak için kullanılan doğrulama verilerinden ve modelin performansının nihai değerlendirmesi için ayrılmış test verilerinden farklıdır.
Yüksek kaliteli eğitim verileri, modelin karşılaşacağı gerçek dünya senaryolarını temsil etmelidir. Veri kümesi önyargı içeriyorsa veya çeşitlilikten yoksunsa, model aşırı uyumdan muzdarip olabilir ve bu durumda eğitim örneklerini ezberler ancak yeni girdilerde iyi performans gösteremez. Tersine, veriler çok basit veya model için temel kalıpları yakalamak için yetersiz olduğunda yetersiz uyum meydana gelir.
Eğitim verileri, sistemlerin geçmiş örneklerden öğrenmesini sağlayarak neredeyse her sektörde yeniliklere güç katmaktadır. Örnekler.
Güçlü eğitim verileri elde etmek, genellikle makine öğrenimi projelerinin en zorlu kısmıdır. Veriler, Google Search gibi kamuya açık veri havuzlarından veya COCO gibi özel koleksiyonlardan COCO gibi özel koleksiyonlardan elde edilebilir. Ancak, ham veriler genellikle doğruluğu sağlamak için dikkatli veri temizleme ve açıklama gerektirir.
Ultralytics gibi araçlar, veri kümelerini yüklemek, etiketlemek ve yönetmek için entegre bir ortam sunarak bu iş akışını kolaylaştırmıştır. Etkili yönetim, aynı zamanda veri artırma, yani mevcut görüntülere çevirme, döndürme veya renk ayarı gibi dönüşümler uygulayarak eğitim kümesinin boyutunu yapay olarak artırmak için kullanılan bir teknik de içerir. Bu, modellerin girdi verilerindeki değişikliklere karşı daha sağlam hale gelmesine yardımcı olur.
Aşağıdaki Python , ultralytics kütüphane. Burada,
önceden eğitilmiş YOLO26 model, üzerinde ince ayar yapılır.
COCO8, eğitim süreçlerini doğrulamak için tasarlanmış küçük bir veri kümesi.
from ultralytics import YOLO
# Load a pre-trained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset for 5 epochs
# The 'data' argument specifies the dataset configuration file
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
"Garbage in, garbage out" (çöp girerse çöp çıkar) atasözü, makine öğreniminin temelidir. Transformers veya derin Convolutional Neural Networks (CNNs) gibi en sofistike mimariler bile, yetersiz eğitim verilerini telafi edemez. Ground truth etiketlerinin yanlış olduğu etiket gürültüsü gibi sorunlar, performansı ciddi şekilde düşürebilir. Bu nedenle, genellikle insan denetimini içeren sıkı kalite güvence süreçleri, veri setinin bütünlüğünü korumak için gereklidir.
Ayrıca, AI Etik ilkelerine bağlı kalmak, eğitim verilerinin demografik veya sosyoekonomik önyargılar açısından incelenmesini gerektirir. AI'da adaleti sağlamak, uygulamaya konulan uygulamalarda ayrımcı sonuçları önlemeye yardımcı olan dengeli ve temsili bir eğitim veri seti ile başlar.