Grüner Scheck
Link in die Zwischenablage kopiert

Echtzeit-Rückschlüsse in Vision-KI-Lösungen zeigen Wirkung

Erfahre, warum Echtzeit-Schlussfolgerungen in der Computer Vision für eine Reihe von Anwendungen wichtig sind und welche Rolle sie bei der Ermöglichung sofortiger Entscheidungen spielen.

Wir alle kennen die Frustration, die eine langsame Internetverbindung verursachen kann. Aber stell dir diese Verzögerung in einer wichtigen Situation vor, z. B. wenn ein selbstfahrendes Auto auf ein Hindernis reagiert oder ein Arzt einen wichtigen Scan auswertet. Ein paar zusätzliche Sekunden können schwerwiegende Folgen haben. 

Hier kann Echtzeit-KI-Inferenzierung den Unterschied ausmachen. Dank schneller Verarbeitung und Vorhersagen in Echtzeit können Bildverarbeitungslösungen visuelle Daten sofort verarbeiten und auf sie reagieren. Diese blitzschnellen Entscheidungen können die Sicherheit, die Effizienz und den Komfort im Alltag erhöhen. 

Stell dir zum Beispiel einen Chirurgen vor, der einen heiklen Eingriff mit einem Roboterassistenten durchführt. Jede Bewegung wird über eine Hochgeschwindigkeitsverbindung gesteuert, und das Sichtsystem des Roboters verarbeitet das Operationsfeld in Echtzeit und gibt dem Chirurgen ein sofortiges visuelles Feedback. Schon die kleinste Verzögerung in dieser Feedbackschleife könnte zu schwerwiegenden Fehlern führen und den Patienten in Gefahr bringen. Dies ist ein perfektes Beispiel dafür, warum Rückschlüsse in Echtzeit so wichtig sind: Es gibt keinen Platz für Verzögerungen. 

KI-Schlussfolgerungen in realen Anwendungen hängen von drei Schlüsselkonzepten ab: Inferenz-Engines (die Software oder Hardware, die KI-Modelle effizient ausführt), Inferenzlatenz (die Verzögerung zwischen Eingabe und Ausgabe) und Echtzeit-Inferenzierung (die Fähigkeit des KI-Systems, mit minimaler Verzögerung zu verarbeiten und zu reagieren).

In diesem Artikel werden wir uns mit diesen Kernkonzepten befassen und wie Computer Vision Modelle wie Ultralytics YOLO11 Anwendungen ermöglichen, die auf sofortige Vorhersagen angewiesen sind.

Was ist eine KI-Schlussfolgerung?

Beim Inferencing werden neue Daten mithilfe eines trainierten KI-Modells analysiert, um eine Vorhersage zu treffen oder eine Aufgabe zu lösen. Im Gegensatz zum Training, bei dem ein Modell durch die Verarbeitung großer Mengen markierter Daten trainiert wird, geht es beim Inferencing darum, mit einem bereits trainierten Modell schnell und präzise Ergebnisse zu erzielen.

Abb. 1. Verstehen, was Schlussfolgerungen sind.

Im Wildtierschutz zum Beispiel nutzen KI-Kamerafallen Computer-Vision-Modelle, um Tiere in Echtzeit zu identifizieren und zu klassifizieren. Wenn eine Kamera eine Bewegung erfasst, erkennt das KI-Modell sofort, ob es sich um ein Reh, ein Raubtier oder sogar einen Wilderer handelt. So können Forscher/innen Tierpopulationen verfolgen und gefährdete Arten ohne menschliches Eingreifen schützen. Diese schnelle Identifizierung ermöglicht eine Überwachung in Echtzeit und schnellere Reaktionen auf potenzielle Bedrohungen.

Verstehen von Inferenzmaschinen

Ein trainiertes maschinelles Lernmodell ist nicht immer in seiner Rohform einsatzbereit. Eine Inferenz-Engine ist ein spezielles Software- oder Hardware-Tool, mit dem maschinelle Lernmodelle effizient ausgeführt und für den Einsatz in der Praxis optimiert werden können. Sie nutzt Optimierungstechniken wie Modellkomprimierung, Quantisierung und Graphenumwandlung, um die Leistung zu verbessern und den Ressourcenverbrauch zu reduzieren, damit das Modell in verschiedenen Umgebungen eingesetzt werden kann. 

Im Kern konzentriert sich eine Inferenz-Engine auf die Reduzierung des Rechenaufwands, die Minimierung der Latenzzeit und die Verbesserung der Effizienz, um schnelle und genaue Vorhersagen zu ermöglichen. Sobald die Engine optimiert ist, führt sie das Modell auf neuen Daten aus und kann so effizient Schlussfolgerungen in Echtzeit ziehen. Diese Optimierung stellt sicher, dass KI-Modelle sowohl auf leistungsstarken Cloud-Servern als auch auf ressourcenbeschränkten Endgeräten wie Smartphones, IoT-Geräten und eingebetteten Systemen reibungslos funktionieren.

Probleme durch Inferenzlatenz

Die Inferenzlatenz ist die Zeitverzögerung zwischen dem Zeitpunkt, an dem ein KI-System Eingabedaten erhält (z. B. ein Bild von einer Kamera) und dem Zeitpunkt, an dem es eine Ausgabe erzeugt (z. B. die Erkennung von Objekten im Bild). Schon eine kleine Verzögerung kann die Leistung und Nutzbarkeit von Echtzeit-KI-Anwendungen erheblich beeinträchtigen.

Die Schlussfolgerungslatenz tritt in drei wichtigen Phasen auf:

  • Vorverarbeitungszeit: Die Zeit, die benötigt wird, um die Eingabedaten vorzubereiten, bevor sie in das Modell eingespeist werden. Dazu gehören die Größenanpassung der Bilder an die Eingangsmaße des Modells, die Normalisierung der Pixelwerte für eine bessere Genauigkeit und die Umwandlung von Formaten (z. B. RGB in Graustufen oder Video in Bildfolgen).
  • Berechnungszeit: Die tatsächliche Zeit, die das Modell benötigt, um Schlussfolgerungen zu ziehen. Dazu gehören Operationen wie schichtweise Berechnungen in tiefen Netzen, Matrixmultiplikationen, Faltungen und die Datenübertragung zwischen Speicher und Verarbeitungseinheiten.
  • Nachbearbeitungszeit: Die Zeit, die benötigt wird, um die Rohdaten des Modells in aussagekräftige Ergebnisse umzuwandeln. Dazu kann das Zeichnen von Begrenzungsrahmen (Bounding Boxes) bei der Objekterkennung, das Filtern falsch positiver Ergebnisse bei der Bilderkennung oder die Anwendung von Schwellenwerten bei der Erkennung von Anomalien gehören.

Die Inferenzlatenz ist bei Echtzeitanwendungen entscheidend. Bei der automatischen Fehlererkennung an einem Fließband kann die Computer Vision zum Beispiel eingesetzt werden, um die Produkte zu prüfen, während sie über das Förderband laufen. 

Das System muss Fehler schnell erkennen und kennzeichnen, bevor die Produkte in die nächste Phase gehen. Wenn das Modell zu lange braucht, um die Bilder zu verarbeiten, werden fehlerhafte Teile möglicherweise nicht rechtzeitig erkannt, was zu Materialverschwendung, teuren Nacharbeiten oder fehlerhaften Produkten führt, die den Kunden erreichen. Durch die Verringerung der Latenzzeit können die Hersteller die Qualitätskontrolle verbessern, die Effizienz steigern und Verluste reduzieren.

Wie man die Latenzzeit für Schlussfolgerungen reduziert

Bei vielen Bildverarbeitungsanwendungen ist es wichtig, die Latenzzeit so gering wie möglich zu halten. Um dies zu erreichen, können verschiedene Techniken eingesetzt werden. Im Folgenden werden wir einige der gängigsten Techniken zur Verringerung der Inferenzlatenz diskutieren.

Modellbeschneidung

Das Modell Pruning vereinfacht ein neuronales Netzwerk, indem es unnötige Verbindungen (Gewichte) entfernt, wodurch es kleiner und schneller wird. Dieser Prozess reduziert die Rechenlast des Modells und erhöht die Geschwindigkeit, ohne die Genauigkeit zu sehr zu beeinträchtigen. 

Indem nur die wichtigsten Verbindungen beibehalten werden, sorgt Pruning für effiziente Schlussfolgerungen und eine bessere Leistung, insbesondere auf Geräten mit begrenzter Rechenleistung. Es wird häufig in Echtzeitanwendungen wie mobiler KI, Robotik und Edge Computing eingesetzt, um die Effizienz zu steigern und gleichzeitig die Zuverlässigkeit zu gewährleisten.

Abb. 2. Eliminierung weniger effektiver Verbindungen mit Hilfe von Model Pruning.

Modell-Quantisierung

Modellquantisierung ist eine Technik, mit der KI-Modelle schneller laufen und weniger Speicherplatz verbrauchen, indem die Zahlen, die sie für die Berechnungen verwenden, vereinfacht werden. Normalerweise arbeiten diese Modelle mit 32-Bit-Gleitkommazahlen, die sehr genau sind, aber viel Rechenleistung benötigen. Die Quantisierung reduziert diese Zahlen auf 8-Bit-Ganzzahlen, die einfacher zu verarbeiten sind und weniger Speicherplatz benötigen. 

Abb. 3. Modellquantisierung zur Umwandlung von Fließkommawerten in Ganzzahldarstellungen.

Effiziente Modelle verwenden

Das Design eines KI-Modells hat einen großen Einfluss darauf, wie schnell es Vorhersagen machen kann. Modelle wie YOLO11, die auf eine effiziente Inferenz ausgelegt sind, eignen sich ideal für Anwendungen, bei denen die Verarbeitungsgeschwindigkeit entscheidend ist.

Wenn du eine KI-Lösung aufbaust, ist es wichtig, das richtige Modell auf der Grundlage der verfügbaren Ressourcen und Leistungsanforderungen auszuwählen. Wenn du mit einem zu schweren Modell beginnst, wirst du eher mit Problemen wie langsamen Verarbeitungszeiten, höherem Stromverbrauch und Schwierigkeiten beim Einsatz auf Geräten mit begrenzten Ressourcen konfrontiert. Ein leichtgewichtiges Modell sorgt für eine reibungslose Leistung, insbesondere bei Echtzeit- und Edge-Anwendungen.

Geschwindigkeit vs. Genauigkeit: Optimierung von Echtzeit-Schlussfolgerungen

Es gibt zwar verschiedene Techniken, um die Latenzzeit zu verringern, aber ein wichtiger Bestandteil von Echtzeit-Schlussfolgerungen ist der Ausgleich zwischen Geschwindigkeit und Genauigkeit. Es reicht nicht aus, die Modelle schneller zu machen - die Geschwindigkeit der Schlussfolgerungen muss optimiert werden, ohne die Genauigkeit zu beeinträchtigen. Ein System, das schnelle, aber falsche Vorhersagen macht, ist ineffektiv. Deshalb sind gründliche Tests unerlässlich, um sicherzustellen, dass die Modelle in der Praxis gut funktionieren. Ein System, das beim Testen schnell erscheint, aber unter realen Bedingungen versagt, ist nicht wirklich optimiert.

KI-Anwendungen, die Echtzeit-Inferenzen nutzen

Als Nächstes wollen wir uns einige reale Anwendungen ansehen, bei denen Echtzeit-Inferencing die Industrie verändert, indem es sofortige Reaktionen auf visuelle Eingaben ermöglicht.

Selbstbedienungs-Kassensysteme in Einzelhandelsgeschäften

Computer-Vision-Modelle wie YOLO11 können helfen, Self-Checkout-Systeme zu verbessern, indem sie die Artikelerkennung schneller und genauer machen. Die Unterstützung von YOLO11 für verschiedene Bildverarbeitungsaufgaben wie Objekterkennung und Instanzsegmentierung macht es möglich, Produkte zu identifizieren, selbst wenn Barcodes fehlen oder beschädigt sind. Vision AI kann den Bedarf an manuellen Eingaben reduzieren und den Kassiervorgang beschleunigen.

Neben der Produktidentifizierung kann Computer Vision auch in Self-Checkout-Systeme integriert werden, um Preise zu überprüfen, Betrug zu verhindern und den Kundenkomfort zu erhöhen. KI-gestützte Kameras können automatisch zwischen ähnlichen Produkten unterscheiden und verdächtiges Verhalten an der Kasse erkennen. Dazu gehört die Erkennung von "Nicht-Scans", bei denen ein Kunde oder Kassierer versehentlich einen Artikel übersieht, und von vorsätzlichen Betrugsversuchen wie dem "Produktwechsel", bei dem ein billiger Barcode über einen teureren Artikel gelegt wird.

Abb. 4. KI kann Self-Checkout-Schalter verbessern.

Ein gutes Beispiel dafür ist Kroger, ein großer US-amerikanischer Einzelhändler, der Computer Vision und KI in seine Self-Checkout-Systeme integriert hat. Mithilfe von Videoanalysen in Echtzeit konnte Kroger über 75 % der Fehler an den Kassen automatisch korrigieren und damit sowohl das Kundenerlebnis als auch die Abläufe im Laden verbessern.

Qualitätsprüfung mit Computer Vision

Die manuelle Prüfung von Produkten zur Qualitätskontrolle kann langsam und nicht immer präzise sein. Deshalb steigen immer mehr Hersteller auf visuelle Prüfverfahren um, die Computer Vision nutzen, um Fehler früher im Produktionsprozess zu erkennen.

Hochauflösende Kameras und Vision AI können winzige Fehler erkennen, die Menschen übersehen könnten, und Modelle wie YOLO11 helfen bei der Qualitätsprüfung, Sortierung und Zählung in Echtzeit, um sicherzustellen, dass nur perfekte Produkte an die Kunden geliefert werden. Die Automatisierung dieses Prozesses spart Zeit, senkt die Kosten und reduziert den Abfall, wodurch die Produktion reibungsloser und effizienter wird.

Abb. 5. Ein Beispiel für die Verwendung von YOLO11 zum Zählen von Produkten an einem Fließband.

Die wichtigsten Erkenntnisse

Echtzeit-Inferencing hilft KI-Modellen, sofortige Entscheidungen zu treffen, was in vielen Branchen entscheidend ist. Ob ein selbstfahrendes Auto einen Unfall vermeidet, ein Arzt medizinische Scans schnell analysiert oder eine Fabrik Produktfehler erkennt - schnelle und präzise KI-Reaktionen machen einen großen Unterschied.

Indem wir die Geschwindigkeit und Effizienz von KI-Modellen verbessern, können wir intelligentere, zuverlässigere Systeme schaffen, die in realen Situationen nahtlos funktionieren. Mit dem technologischen Fortschritt werden Echtzeit-KI-Lösungen die Zukunft prägen und alltägliche Prozesse schneller, sicherer und effizienter machen.

Um mehr zu erfahren, besuche unser GitHub-Repository und beteilige dich an unserer Community. Entdecke Innovationen in Bereichen wie KI in selbstfahrenden Autos und Computer Vision in der Landwirtschaft auf unseren Lösungsseiten. Schau dir unsere Lizenzierungsoptionen an und erwecke deine Vision AI-Projekte zum Leben.

Facebook-LogoTwitter-LogoLinkedIn-LogoKopier-Link-Symbol

Lies mehr in dieser Kategorie

Lass uns gemeinsam die Zukunft
der KI gestalten!

Beginne deine Reise in die Zukunft des maschinellen Lernens