Glossar

Modell Servieren

Lerne die Grundlagen des Model Serving - setze KI-Modelle für Echtzeitvorhersagen, Skalierbarkeit und nahtlose Integration in Anwendungen ein.

Sobald ein Machine Learning (ML) -Modell trainiert und validiert ist, besteht der nächste wichtige Schritt darin, es für die Erstellung von Vorhersagen für neue Daten verfügbar zu machen. Dieser Prozess wird als Model Serving bezeichnet. Dabei wird ein trainiertes Modell in einer Produktionsumgebung eingesetzt, in der Regel hinter einem API-Endpunkt (Application Programming Interface), über den Anwendungen oder andere Systeme Vorhersagen in Echtzeit abrufen können. Model Serving fungiert als Brücke zwischen dem entwickelten Modell und seiner praktischen Anwendung und verwandelt es von einer statischen Datei in einen aktiven, wertschöpfenden Dienst innerhalb des allgemeinen Lebenszyklus des maschinellen Lernens.

Die Bedeutung des Modeldienstes

Der Modellservice ist für die Operationalisierung von ML-Modellen von grundlegender Bedeutung. Ohne sie können selbst die genauesten Modelle, wie die modernsten Ultralytics YOLO Objektdetektoren, bleiben in der Entwicklungsumgebung isoliert und können sich nicht auf die realen Prozesse auswirken. Ein effektives Model Serving stellt sicher, dass die im Training entwickelten Erkenntnisse und Automatisierungsmöglichkeiten zugänglich und nutzbar sind. Es ermöglicht Inferenzen in Echtzeit, so dass Anwendungen dynamisch auf neue Daten reagieren können, was für Aufgaben von der Objekterkennung in Videos bis hin zur Verarbeitung natürlicher Sprache (NLP) in Chatbots entscheidend ist. Letztlich ist das Model Serving entscheidend für den Return on Investment (ROI) von KI-Initiativen.

Model Serving vs. Model Deployment

Obwohl der Begriff "Model Serving" oft synonym verwendet wird, ist er technisch gesehen eine spezifische Komponente innerhalb des umfassenderen Prozesses " Model Deployment". Die Modellbereitstellung umfasst alle Schritte, die notwendig sind, um ein trainiertes Modell in einer produktiven Umgebung einsatzfähig zu machen, einschließlich Paketierung, Einrichtung der Infrastruktur, Integration und Überwachung. Model Serving konzentriert sich speziell auf die Infrastruktur- und Softwareschicht, die das Modell beherbergt und eingehende Vorhersageanfragen bearbeitet, indem sie die Funktionen des Modells als Service zur Verfügung stellt, oft über Netzwerkprotokolle wie REST oder gRPC. Weitere Informationen findest du in unserem Leitfaden zu den Optionen für die Modellbereitstellung.

Anwendungen in der realen Welt

Model Serving ermöglicht unzählige KI-gesteuerte Funktionen, mit denen wir täglich interagieren. Hier sind zwei Beispiele:

E-Commerce-Plattformen: Empfehlungssysteme liefern den Nutzern personalisierte Produktvorschläge in Echtzeit, die auf ihrem Surfverhalten und ihren Vorlieben basieren. Die Infrastruktur, die das Modell bedient, verarbeitet Millionen von Anfragen und sorgt für eine geringe Latenzzeit.
Diagnostik im Gesundheitswesen: In der medizinischen Bildanalyse werden Modelle, die für die Erkennung von Anomalien (wie Tumoren in Scans, siehe YOLO11 für die Tumorerkennung) trainiert wurden, über sichere Endpunkte bedient. Kliniker/innen können Bilder hochladen und erhalten schnell und effizient diagnostische Unterstützung(Radiologie: Künstliche Intelligenz).

Schlüsselkomponenten des Modells Serving

Zur Umsetzung eines robusten Modellservicesystems müssen mehrere Komponenten zusammenarbeiten:

Modellformat: Die Modelle müssen in einem Format verpackt werden, das für die Bereitstellung geeignet ist, wie z. B. ONNXoder optimiert mit Tools wie TensorRT für eine bessere Leistung auf spezieller Hardware wie NVIDIA GPUs optimiert werden.
Serving Framework: Spezialisierte Software sorgt für das Laden des Modells, die Verwaltung der Ressourcen und die effiziente Verarbeitung von Inferenzanfragen. Beispiele hierfür sind TensorFlow Serving, TorchServe und NVIDIA Triton Inference Server, in die Ultralytics Modelle integriert sindTriton Integration Guide).
API-Endpunkt: Eine Schnittstelle (z. B. REST, gRPC) ermöglicht es Client-Anwendungen, Daten zu senden und Vorhersagen zu empfangen. Diese Schnittstelle wird häufig von einem API-Gateway verwaltet, das für Sicherheit, Ratenbegrenzung und Routing sorgt.
Infrastruktur: Die zugrundeliegende Hardware und Umgebung, in der das Modell bereitgestellt wird. Das können Cloud Computing-Plattformen wie Amazon SageMaker oder Google Cloud AI Platform (Vertex AI), Server vor Ort oder Edge Computing-Geräte sein(Deploying on Edge AI Devices). Containerisierungstools wie Docker werden oft für die Paketierung verwendet(Docker Quickstart).
Überwachung und Protokollierung: Tools zum Verfolgen von Leistungskennzahlen (Latenz, Durchsatz, Fehlerraten), Ressourcennutzung und möglichen Problemen wie Datendrift (Model Monitoring Guide).

Plattformen wie Ultralytics HUB zielen darauf ab, diesen gesamten Arbeitsablauf zu vereinfachen, indem sie integrierte Lösungen für das Training, die Versionierung, den Einsatz und die Bereitstellung von Computer-Vision-Modellen anbieten und sich dabei an den Best Practices von MLOps (Machine Learning Operations) orientieren. Zu den wichtigsten Aspekten gehören die Skalierbarkeit zur Bewältigung von Laständerungen, die Sicherheit(Datensicherheit) und die Wartungsfreundlichkeit.

Modell Servieren

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Flexible Unternehmenslizenzierungslösung für deine Innovation

Trainiere KI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Trainiere YOLO Modelle einfach mit Ultralytics HUB

Die Bedeutung des Modeldienstes

Model Serving vs. Model Deployment

Anwendungen in der realen Welt

Schlüsselkomponenten des Modells Serving

Mehr Blogs lesen

Werde Mitglied der Ultralytics Community

Modell Servieren

Trainiere YOLO Modelle einfachmit Ultralytics HUB

Flexible Unternehmenslizenzierungslösung für deine Innovation

Trainiere KI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Trainiere YOLO Modelle einfach mit Ultralytics HUB

Die Bedeutung des Modeldienstes

Model Serving vs. Model Deployment

Anwendungen in der realen Welt

Schlüsselkomponenten des Modells Serving

Mehr Blogs lesen

Werde Mitglied der Ultralytics Community

Trainiere YOLO Modelle einfach
mit Ultralytics HUB