Entdecken Sie, wie virtuelle Assistenten NLP und Computer Vision nutzen, um Aufgaben auszuführen. Lernen Sie, wie Sie Ultralytics für visuelle Echtzeitkontexte und -anwendungen integrieren können.
Ein virtueller Assistent (VA) ist ein fortschrittlicher Software-Agent, der auf der Grundlage von Befehlen oder Fragen Aufgaben oder Dienste für eine Person ausführen kann. Diese Systeme nutzen eine Kombination aus Technologien der künstlichen Intelligenz (KI), vor allem natürliche Sprachverarbeitung (NLP) und Spracherkennung, um menschliche Sprache oder Text zu interpretieren und entsprechende Aktionen auszuführen. Im Gegensatz zu einfachen Befehlszeilenprogrammen lernen moderne VAs aus den Interaktionen mit den Benutzern, um ihre Leistung im Laufe der Zeit zu verbessern und eine personalisiertere Erfahrung zu bieten.
Die Effizienz eines virtuellen Assistenten hängt von mehreren hochentwickelten Komponenten des maschinellen Lernens (ML) ab, die zusammenarbeiten.
Die nächste Herausforderung für virtuelle Assistenten besteht darin, ihnen die Fähigkeit zu verleihen, die physische Welt zu „sehen” und zu verstehen . Durch die Integration von Computer Vision (CV) kann ein Assistent Fragen auf der Grundlage visueller Eingaben beantworten, beispielsweise die Zutaten in einem Kühlschrank identifizieren oder Hindernisse für sehbehinderte Nutzer erkennen .
Entwickler können diese visuellen Funktionen mithilfe von Hochgeschwindigkeitsarchitekturen zur Objekterkennung aktivieren. Das Ultralytics eignet sich besonders gut dafür und bietet Echtzeitleistung auf Edge-Geräten.
Der folgende Python zeigt, wie ein Bild verarbeitet wird, um einem virtuellen Assistenten visuellen Kontext zu liefern
unter Verwendung der ultralytics Paket:
from ultralytics import YOLO
# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")
# Perform inference on an image to identify objects
# The assistant uses these results to understand the scene
results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects (e.g., 'bus', 'person')
results[0].show()
Virtuelle Assistenten sind über einfache Smartphone-Abfragen hinausgewachsen und mittlerweile in komplexen Industrie- und Verbraucherumgebungen eingebettet .
Obwohl die Begriffe oft synonym verwendet werden, gibt es deutliche Unterschiede zwischen einem virtuellen Assistenten und einem Chatbot.
Die Erstellung eines benutzerdefinierten virtuellen Assistenten erfordert häufig das Training spezialisierter Modelle auf proprietären Datensätzen. Ultralytics vereinfacht diesen Arbeitsablauf und bietet Tools zum Annotieren von Daten, zum Trainieren benutzerdefinierter YOLO für visuelle Aufgaben und zum Bereitstellen dieser Modelle in verschiedenen Formaten. Unabhängig davon, ob die Bereitstellung in der Cloud erfolgt oder Edge-KI für eine geringere Latenz genutzt wird, ist es für eine reaktionsschnelle Benutzererfahrung entscheidend, dass das Modell für die Zielhardware optimiert ist.
Da VAs immer autonomer werden, wird die Einhaltung der KI-Ethik in Bezug auf Datennutzung und Transparenz für Entwickler und Organisationen immer wichtiger.