Sözlük

Model Servis

Model sunmanın temellerini öğrenin: Gerçek zamanlı tahminler, ölçeklenebilirlik ve uygulamalara sorunsuz entegrasyon için yapay zeka modellerini dağıtın.

YOLO modellerini Ultralytics HUB ile basitçe
eğitin

Daha fazla bilgi edinin

Bir Makine Öğrenimi (ML) modeli eğitildikten ve doğrulandıktan sonra, bir sonraki kritik adım, yeni veriler üzerinde tahminler oluşturmak için kullanılabilir hale getirmektir. Bu süreç Model Sunma olarak bilinir. Eğitimli bir modelin, tipik olarak bir API uç noktasının arkasında, uygulamaların veya diğer sistemlerin gerçek zamanlı olarak tahminler talep etmesine olanak tanıyan bir üretim ortamına dağıtılmasını içerir. Model sunumu, geliştirilen model ile pratik uygulaması arasında köprü görevi görür ve modeli statik bir dosyadan daha geniş Makine Öğrenimi Yaşam Döngüsü içinde aktif, değer üreten bir hizmete dönüştürür.

Model Servisin Önemi

Model sunumu, makine öğrenimi modellerinin operasyonel hale getirilmesi için temeldir. Bu olmadan, en son teknoloji gibi en doğru modeller bile Ultralytics YOLO nesne algılayıcıları, geliştirme ortamlarında izole kalır ve gerçek dünya süreçlerini etkileyemez. Etkili model sunumu şunları sağlar:

Gerçek Dünya Uygulamaları

Model sunumu, her gün etkileşimde bulunduğumuz sayısız yapay zeka odaklı özelliği mümkün kılıyor. İşte iki örnek:

  1. E-ticaret Ürün Önerileri: Bir çevrimiçi mağazaya göz attığınızda, arka uçta hizmet veren bir model öneri sistemine güç verir. Göz atma geçmişinizi veya kullanıcı profilinizi girdi olarak alır ve gerçek zamanlı olarak kişiselleştirilmiş ürün önerileri döndürür.
  2. Tıbbi Teşhis Yardımı: Sağlık hizmetlerinde, tıbbi görüntü analizi için eğitilmiş modeller bir API aracılığıyla sunulabilir. Doktorlar hasta taramalarını (X-ışınları veya MRI'lar gibi) hizmete yükleyebilir, bu da potansiyel anormallikleri veya tanısal içgörüleri döndürerek klinik karar verme sürecine yardımcı olur. Ultralytics HUB gibi platformlar, bu tür özel modellerin dağıtımını kolaylaştırır.

Model Servisin Temel Bileşenleri

Sağlam bir model hizmet sisteminin uygulanması çeşitli bileşenleri içerir:

  • Model Formatı: Eğitilen modelin dağıtım için uygun bir formatta kaydedilmesi gerekir, örneğin ONNX, TensorFlow SavedModel veya aşağıdaki gibi optimize edilmiş formatlar TensorRT.
  • Sunum Çerçevesi: TensorFlow Serving, TorchServe veya NVIDIA Triton Inference Server gibi yazılımlar model yaşam döngüsünü yönetir, istekleri işler ve çıkarım yapar.
  • API Uç Noktası: Bir arayüz (genellikle bir API Gateway tarafından yönetilir) modelin tahmin yeteneklerini istemci uygulamalarına sunar.
  • Altyapı: Şirket içi sunucular, bulut bilişim örnekleri ve hatta özel uç bilişim cihazları olabilen temel donanım ve yazılım ortamı.
  • İzleme: Model izleme araçları ve süreçleri, sunulan modelin zaman içinde etkili kalmasını sağlamak için performansı, gecikmeyi, hataları ve potansiyel veri kaymasını izler.

Model Dağıtımı ve Model Sunumu

Model Dağıtımı ve Model Sunumu terimleri genellikle birbiriyle ilişkili olsa da aynı değildir. Model dağıtımı, eğitilmiş bir modeli kullanıma hazır hale getirmeye yönelik daha geniş bir kavramdır. Bu, modelleri doğrudan uygulamalara yerleştirmek, çevrimdışı çıkarım için uç cihazlara dağıtmak veya tahminleri periyodik olarak çalıştıran toplu işleme işlem hatları kurmak gibi çeşitli stratejileri kapsayabilir. İhtiyaçlarınıza bağlı olarak farklı Model Dağıtım Seçeneklerini keşfedebilirsiniz.

Model sunumu, özellikle bir modelin, genellikle bir API aracılığıyla erişilebilen, isteğe bağlı, genellikle gerçek zamanlı tahmin isteklerini işlemek için tasarlanmış bir ağ hizmeti olarak dağıtılması anlamına gelir. Bu, ölçeklenebilirlik ve düşük gecikme süresini göz önünde bulundurarak sürekli çıkarım yetenekleri sağlamaya odaklanan belirli bir model dağıtım türüdür. Anında tahmin gerektiren birçok etkileşimli uygulama için model sunumu tercih edilen dağıtım yöntemidir.

Tümünü okuyun