Sözlük

Model Servis

Model sunmanın temellerini öğrenin: Gerçek zamanlı tahminler, ölçeklenebilirlik ve uygulamalara sorunsuz entegrasyon için yapay zeka modellerini dağıtın.

Bir Makine Öğrenimi (ML) modeli eğitildikten ve doğrulandıktan sonra, bir sonraki kritik adım, yeni veriler üzerinde tahminler oluşturmak için kullanılabilir hale getirmektir. Bu süreç Model Sunma olarak bilinir. Eğitimli bir modelin, tipik olarak bir API uç noktasının arkasında, uygulamaların veya diğer sistemlerin gerçek zamanlı olarak tahminler talep etmesine olanak tanıyan bir üretim ortamına dağıtılmasını içerir. Model sunumu, geliştirilen model ile pratik uygulaması arasında köprü görevi görür ve modeli statik bir dosyadan daha geniş Makine Öğrenimi Yaşam Döngüsü içinde aktif, değer üreten bir hizmete dönüştürür.

Model Servisin Önemi

Model sunumu, makine öğrenimi modellerinin operasyonel hale getirilmesi için temeldir. Bu olmadan, en son teknoloji gibi en doğru modeller bile Ultralytics YOLO nesne algılayıcıları, geliştirme ortamlarında izole kalır ve gerçek dünya süreçlerini etkileyemez. Etkili model sunumu şunları sağlar:

Erişilebilirlik: Model tahminlerini REST API veya gRPC gibi standart arayüzler aracılığıyla çeşitli uygulamalar için kullanılabilir hale getirir.
Ölçeklenebilirlik: Talep değiştikçe tutarlı performans sağlayarak değişen tahmin istekleri yüklerini yönetir. Amazon SageMaker ve Google Cloud AI Platform gibi bulut platformları yönetilen ölçeklendirme çözümleri sunar.
Güvenilirlik: Kritik uygulamalar için istikrarlı ve sürekli kullanılabilir bir hizmet sağlar.
Performans: Bilgisayarla görme ve doğal dil işleme (NLP) gibi alanlarda gerçek zamanlı çıkarım kullanım durumlarını etkinleştirmek için düşük çıkarım gecikmesi için optimize edilmiştir.

Gerçek Dünya Uygulamaları

Model sunumu, her gün etkileşimde bulunduğumuz sayısız yapay zeka odaklı özelliği mümkün kılıyor. İşte iki örnek:

E-ticaret Ürün Önerileri: Bir çevrimiçi mağazaya göz attığınızda, arka uçta hizmet veren bir model öneri sistemine güç verir. Göz atma geçmişinizi veya kullanıcı profilinizi girdi olarak alır ve gerçek zamanlı olarak kişiselleştirilmiş ürün önerileri döndürür.
Tıbbi Teşhis Yardımı: Sağlık hizmetlerinde, tıbbi görüntü analizi için eğitilmiş modeller bir API aracılığıyla sunulabilir. Doktorlar hasta taramalarını (X-ışınları veya MRI'lar gibi) hizmete yükleyebilir, bu da potansiyel anormallikleri veya tanısal içgörüleri döndürerek klinik karar verme sürecine yardımcı olur. Ultralytics HUB gibi platformlar, bu tür özel modellerin dağıtımını kolaylaştırır.

Model Servisin Temel Bileşenleri

Sağlam bir model hizmet sisteminin uygulanması çeşitli bileşenleri içerir:

Model Formatı: Eğitilen modelin dağıtım için uygun bir formatta kaydedilmesi gerekir, örneğin ONNX, TensorFlow SavedModel veya aşağıdaki gibi optimize edilmiş formatlar TensorRT.
Sunum Çerçevesi: TensorFlow Serving, TorchServe veya NVIDIA Triton Inference Server gibi yazılımlar model yaşam döngüsünü yönetir, istekleri işler ve çıkarım yapar.
API Uç Noktası: Bir arayüz (genellikle bir API Gateway tarafından yönetilir) modelin tahmin yeteneklerini istemci uygulamalarına sunar.
Altyapı: Şirket içi sunucular, bulut bilişim örnekleri ve hatta özel uç bilişim cihazları olabilen temel donanım ve yazılım ortamı.
İzleme: Model izleme araçları ve süreçleri, sunulan modelin zaman içinde etkili kalmasını sağlamak için performansı, gecikmeyi, hataları ve potansiyel veri kaymasını izler.

Model Dağıtımı ve Model Sunumu

Model Dağıtımı ve Model Sunumu terimleri genellikle birbiriyle ilişkili olsa da aynı değildir. Model dağıtımı, eğitilmiş bir modeli kullanıma hazır hale getirmeye yönelik daha geniş bir kavramdır. Bu, modelleri doğrudan uygulamalara yerleştirmek, çevrimdışı çıkarım için uç cihazlara dağıtmak veya tahminleri periyodik olarak çalıştıran toplu işleme işlem hatları kurmak gibi çeşitli stratejileri kapsayabilir. İhtiyaçlarınıza bağlı olarak farklı Model Dağıtım Seçeneklerini keşfedebilirsiniz.

Model sunumu, özellikle bir modelin, genellikle bir API aracılığıyla erişilebilen, isteğe bağlı, genellikle gerçek zamanlı tahmin isteklerini işlemek için tasarlanmış bir ağ hizmeti olarak dağıtılması anlamına gelir. Bu, ölçeklenebilirlik ve düşük gecikme süresini göz önünde bulundurarak sürekli çıkarım yetenekleri sağlamaya odaklanan belirli bir model dağıtım türüdür. Anında tahmin gerektiren birçok etkileşimli uygulama için model sunumu tercih edilen dağıtım yöntemidir.

Model Servis

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

İnovasyonunuza güç katacak esnek kurumsal lisanslama çözümü

Yapay zeka modellerini saniyeler içinde eğitin Ultralytics YOLO

Ultralytics HUB ile YOLO modellerini kolayca eğitin

Model Servisin Önemi

Gerçek Dünya Uygulamaları

Model Servisin Temel Bileşenleri

Model Dağıtımı ve Model Sunumu

Daha fazla blog okuyun

Ultralytics topluluğuna katılın

Model Servis

YOLO modellerini Ultralytics HUB ile basitçeeğitin

İnovasyonunuza güç katacak esnek kurumsal lisanslama çözümü

Yapay zeka modellerini saniyeler içinde eğitin Ultralytics YOLO

Ultralytics HUB ile YOLO modellerini kolayca eğitin

Model Servisin Önemi

Gerçek Dünya Uygulamaları

Model Servisin Temel Bileşenleri

Model Dağıtımı ve Model Sunumu

Daha fazla blog okuyun

Ultralytics topluluğuna katılın

YOLO modellerini Ultralytics HUB ile basitçe
eğitin