Makine öğrenimi modellerini bulut veya uç ortamlara nasıl dağıtacağınızı öğrenin. Ultralytics YOLO26 için dışa aktarma ve üretimi nasıl kolaylaştırdığını keşfedin.
Model dağıtımı, eğitilmiş bir makine öğrenimi modelinin üretim ortamına entegre edildiği kritik aşamadır ortamına entegre edildiği ve yeni verilere dayalı olarak pratik kararlar veya tahminler yaptığı kritik aşamadır. Bu aşama, genellikle izole edilmiş dizüstü bilgisayarlarda gerçekleştirilen araştırma veya deneysel ortamdan, modelin gerçek dünyadaki kullanıcılar ve sistemlerle etkileşime girdiği canlı bir uygulamaya geçişi temsil eder . Bu süreç, ağırlıkların ve mimarinin bulunduğu statik bir dosyayı, video akışındaki nesneleri tanımlama veya bir web sitesinde ürün önerme gibi değer yaratabilen aktif bir AI ajanı haline dönüştürür .
Etkili dağıtım, gecikme, ölçeklenebilirlik ve donanım uyumluluğu gibi model eğitiminin dışında kalan zorlukların ele alınmasını gerektirir. Kuruluşlar genellikle Ultralytics kullanarak bu yaşam döngüsünü kolaylaştırır ve bulutta eğitilen modellerin, güçlü sunuculardan kaynak kısıtlı uç cihazlara kadar çeşitli ortamlara sorunsuz bir şekilde sunulmasını sağlar.
Dağıtım stratejileri genellikle iki kategoriye ayrılır: bulut dağıtımı ve uç dağıtımı. Seçim, hız, gizlilik ve bağlantı için özel gereksinimlere büyük ölçüde bağlıdır.
Bir model dağıtılmadan önce, genellikle hedef donanımda verimli bir şekilde çalışmasını sağlamak için optimizasyona tabi tutulur. Bu süreç, modelin dışa aktarılmasını içerir; burada eğitim formatı ( PyTorch gibi) ONNX gibi dağıtım dostu bir formata dönüştürülür. ONNX (Open Neural Network Exchange) veya OpenVINOgibi dağıtım dostu bir biçime dönüştürülür.
Kuantizasyon gibi optimizasyon teknikleri, modelin boyutunu ve bellek ayak izini, doğruluğu önemli ölçüde feda etmeden azaltır. Farklı bilgi işlem ortamları arasında tutarlılığı sağlamak için, geliştiriciler genellikle modeli gerekli tüm yazılım bağımlılıklarıyla birlikte paketleyen Docker gibi konteynerleştirme araçlarını kullanır.
Aşağıda, YOLO26 modelini ONNX aktarmanın bir örneği verilmiştir. Bu, dağıtım hazırlığında sıkça yapılan bir adımdır:
from ultralytics import YOLO
# Load the YOLO26 nano model
model = YOLO("yolo26n.pt")
# Export the model to ONNX format for broad compatibility
# This creates a file suitable for various inference engines
path = model.export(format="onnx")
print(f"Model successfully exported to: {path}")
Model dağıtımı, çeşitli endüstrilerde yaygın olarak kullanılan bilgisayar görme sistemlerini destekler.
Model Dağıtımını, makine öğrenimi yaşam döngüsündeki ilgili terimlerden ayırmak önemlidir:
Dağıtım, sürecin sonu değildir. Canlı hale geldikten sonra, modellerin veri sapması gibi sorunları detect için sürekli izlenmesi gerekir. Veri sapması, gerçek dünya verilerinin eğitim verilerinden sapmaya başladığı durumdur. Prometheus veya Grafana gibi araçlar genellikle track metriklerini track için entegre edilir ve sistemin zaman içinde güvenilirliğini korumasını sağlar. Performans düştüğünde, modelin yeniden eğitilmesi ve yeniden dağıtılması gerekebilir, böylece MLOps döngüsü tamamlanır.