Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تقديم النموذج (Model Serving)

تعرف على كيفية سد الفجوة بين النماذج المدربة والإنتاج من خلال تقديم النماذج. استكشف استراتيجيات النشر لـ Ultralytics على Ultralytics .

خدمة النموذج هي عملية استضافة نموذج تعلم آلي مدرب وإتاحة وظائفه لتطبيقات البرامج عبر واجهة شبكة. وهي تعمل كجسر بين ملف نموذج ثابت محفوظ على قرص ونظام حي يعالج بيانات العالم الحقيقي. بمجرد أن يكمل النموذج مرحلة تدريب التعلم الآلي (ML) ، يجب دمجه في بيئة إنتاجية حيث يمكنه تلقي المدخلات — مثل الصور أو النصوص أو البيانات الجدولية — و إرجاع التنبؤات. يتم تحقيق ذلك عادةً عن طريق تغليف النموذج في واجهة برمجة التطبيقات (API)، مما يسمح له بالتواصل مع خوادم الويب أو تطبيقات الأجهزة المحمولة أو أجهزة إنترنت الأشياء.

دور تقديم النماذج في الذكاء الاصطناعي

الهدف الأساسي من تقديم النماذج هو تفعيل قدرات النمذجة التنبؤية بفعالية. بينما يركز التدريب على الدقة وتقليل الخسائر، يركز تقديم النماذج على مقاييس الأداء مثل الكمون (مدى سرعة إرجاع التنبؤ) والإنتاجية (عدد الطلبات التي يمكن معالجتها في الثانية). تضمن البنية التحتية القوية للخدمة أن تظل أنظمة الرؤية الحاسوبية (CV) موثوقة تحت الأحمال الثقيلة. وغالبًا ما تتضمن تقنيات مثل التعبئة في حاويات باستخدام أدوات مثل Docker، التي تحزم النموذج مع تبعياته لضمان سلوك متسق عبر بيئات الحوسبة المختلفة.

تطبيقات واقعية

تعمل خدمة النماذج على تشغيل ميزات الذكاء الاصطناعي في كل مكان في مختلف الصناعات من خلال تمكين اتخاذ القرارات الفورية بناءً على البيانات.

  • التصنيع الذكي: في البيئات الصناعية، تستخدم الذكاء الاصطناعي في أنظمة التصنيع نماذج للفحص خطوط التجميع. يتم إرسال صور عالية الدقة للمكونات إلى خادم محلي، حيث يقوم نموذج YOLO26 بالكشف عن العيوب مثل الخدوش أو الاختلالات، مما يؤدي إلى إصدار تنبيهات فورية لإزالة العناصر المعيبة.
  • أتمتة البيع بالتجزئة: يستخدم تجار التجزئة الذكاء الاصطناعي في البيع بالتجزئة لتحسين تجربة العملاء. تقوم الكاميرات التي تعمل بنماذج الكشف عن الأشياء بتحديد المنتجات في منطقة الدفع، وحساب التكلفة الإجمالية تلقائيًا دون الحاجة إلى مسح الباركود يدويًا .

التنفيذ العملي

لتقديم خدمة فعالة للنموذج، غالبًا ما يكون من المفيد تصدير النماذج إلى تنسيق موحد مثل ONNX، الذي يعزز قابلية التشغيل البيني بين أطر التدريب ومحركات الخدمة المختلفة. يوضح المثال التالي كيفية تحميل نموذج وتشغيل الاستدلال، ومحاكاة المنطق الذي سيكون موجودًا داخل نقطة نهاية الخدمة باستخدام Python.

from ultralytics import YOLO

# Load the YOLO26 model (this typically happens once when the server starts)
model = YOLO("yolo26n.pt")

# Simulate an incoming API request with an image source URL
image_source = "https://ultralytics.com/images/bus.jpg"

# Run inference to generate predictions for the user
results = model.predict(source=image_source)

# Process results (e.g., simulating a JSON response to a client)
print(f"Detected {len(results[0].boxes)} objects in the image.")

اختيار الاستراتيجية الصحيحة

يعتمد اختيار استراتيجية الخدمة بشكل كبير على حالة الاستخدام المحددة. يوفر الخدمة عبر الإنترنت استجابات فورية عبر بروتوكولات مثل REST أو gRPC، وهو أمر ضروري لتطبيقات الويب التي تواجه المستخدم. على العكس من ذلك، تقوم الخدمة المجمعة بمعالجة كميات كبيرة من البيانات في وضع عدم الاتصال بالإنترنت، وهي مناسبة لمهام مثل إنشاء التقارير الليلية . بالنسبة للتطبيقات التي تتطلب الخصوصية أو زمن انتقال منخفض دون الاعتماد على الإنترنت، تنقل Edge AI عملية الخدمة مباشرة إلى الجهاز، باستخدام تنسيقات محسّنة مثل TensorRT لتعظيم الأداء على الأجهزة المقيدة. تستفيد العديد من المؤسسات من Ultralytics لتبسيط نشر هذه النماذج على نقاط نهاية مختلفة، بما في ذلك واجهات برمجة التطبيقات السحابية والأجهزة الطرفية.

التمييز عن المصطلحات ذات الصلة

على الرغم من ارتباطهما الوثيق، فإن "خدمة النموذج" تختلف عن نشر النموذج والاستدلال .

  • نشر النموذج: يشير هذا إلى مرحلة دورة الحياة الأوسع نطاقًا المتمثلة في إطلاق نموذج في بيئة الإنتاج. الخدمة هي الآلية أو البرنامج المحدد (مثل NVIDIA Triton Server أو TorchServe) المستخدم لتنفيذ النموذج المنشور.
  • الاستدلال: هو العملية الحسابية لحساب توقع من مدخلات. يوفر تقديم النموذج البنية التحتية (الشبكات، قابلية التوسع، والأمان) التي تسمح بحد وث الاستدلال بشكل موثوق للمستخدمين النهائيين.
  • الخدمات الصغيرة: غالبًا ما يتم تصميم الخدمة على شكل مجموعة من الخدمات الصغيرة، حيث يعمل النموذج كخدمة مستقلة يمكن لأجزاء أخرى من التطبيق الاستعلام عنها، وغالبًا ما يتم تبادل البيانات بتنسيقات خفيفة الوزن مثل JSON.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن