GPU'ların yapay zeka ve derin öğrenmeyi nasıl hızlandırdığını öğrenin. Ultralytics modellerini eğitmek ve gerçek zamanlı çıkarımları optimize etmek için paralel hesaplamanın gücünü keşfedin.
Grafik İşlem Birimi (GPU), başlangıçta görüntü çıkışı için çerçeve tamponunda görüntülerin işlenmesini ve oluşturulmasını hızlandırmak üzere tasarlanmış özel bir elektronik devredir. Kökleri oyun ve profesyonel görselleştirme için bilgisayar grafiklerinin işlenmesinde yatan GPU'lar, modern Yapay Zeka (AI) teknolojisinin temel motoru haline gelmiştir. Görevleri sırayla işlemek için birkaç güçlü çekirdek kullanan standart işlemcilerin aksine, GPU , birden fazla görevi aynı anda işlemek için tasarlanmış binlerce küçük, verimli çekirdekten oluşur. Paralel hesaplama olarak bilinen bu özellik, derin öğrenme (DL) ve karmaşık sinir ağlarını (NN) destekleyen büyük matris ve vektör işlemleri için olağanüstü verimlilik sağlar. Derin öğrenme (DL) ve karmaşık
GPU'ların Makine Öğrenimi (ML) için vazgeçilmez olmasının temel nedeni, yüksek hızlı matris çarpımları yapabilme yetenekleridir. PyTorch gibi derin öğrenme çerçeveleri PyTorch ve TensorFlow özellikle bu donanım hızlandırmasını kullanmak için optimize edilmiştir. Bu, model eğitimi için gereken süreyi önemli ölçüde azaltır ve genellikle standart bir işlemcide haftalar süren hesaplamaları GPU saatlere indirger. Bu cihazların hesaplama verimi genellikle FLOPS (Saniye Başına Kayan Noktalı İşlem Sayısı) ile ölçülür. Bu, YOLO26 gibi son teknoloji modellerin zorlu taleplerini karşılamak için donanımın kapasitesini ölçmek için kritik bir metriktir.
Donanım yapısını anlamak için GPU diğer işlem GPU ayırmak faydalıdır:
Yüksek performanslı GPU'ların kullanımı, çeşitli sektörlerde yeniliklere yol açmıştır:
Kullanırken ultralytics paketinde GPU kullanımı GPU ve verimli iş akışları için şiddetle tavsiye GPU .
Kütüphane otomatik cihaz algılamayı destekler, ancak kullanıcılar cihazı açıkça da belirtebilirler.
.
Aşağıdaki örnek, ilk kullanılabilir GPU'da bir YOLO26 modelini nasıl eğiteceğinizi göstermektedir:
from ultralytics import YOLO
# Load the YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the first available GPU (device=0)
# This significantly accelerates training compared to CPU usage
results = model.train(data="coco8.yaml", epochs=5, imgsz=640, device=0)
Eğitimin ötesinde, GPU'lar Model Dağıtımında da önemli bir rol oynar. Çıkarım sırasında verimliliği en üst düzeye çıkarmak için modeller genellikle TensorRTgibi optimize edilmiş formatlara dönüştürülür. Bu formatlar, sinir ağını belirli GPU mükemmel bir şekilde uyumlu hale getirmek için yeniden yapılandırır ve gecikmeyi azaltır. Üst düzey yerel donanıma erişimi olmayan geliştiriciler için Ultralytics , veri kümelerini yönetmek ve güçlü uzaktan GPU modelleri eğitmek için bulut tabanlı çözümler sunar. Bu erişilebilirlik, Edge AI'da yeniliği teşvik eder ve karmaşık Bilgisayar Görme (CV) görevlerinin sahada daha küçük, güç tasarruflu cihazlara dağıtılmasını sağlar.