Entdecken Sie, wie die Vektorsuche Einbettungen nutzt, um ähnliche Daten zu finden. Lernen Sie, wie Sie mit Ultralytics hochwertige Vektoren für eine präzise Informationsgewinnung generieren können.
Die Vektorsuche ist eine hochentwickelte Methode der Informationsgewinnung, die ähnliche Elemente innerhalb eines Datensatzes anhand ihrer mathematischen Eigenschaften und nicht anhand exakter Keyword-Übereinstimmungen identifiziert. Im Gegensatz zur herkömmlichen Stichwortsuche, die auf der Suche nach bestimmten Zeichenfolgen basiert , analysiert die Vektorsuche die zugrunde liegende semantische Bedeutung der Daten. Diese Technik ist für moderne Künstliche Intelligenz (KI)-Anwendungen von grundlegender Bedeutung , da sie es Computern ermöglicht, Beziehungen zwischen abstrakten Konzepten zu verstehen und unstrukturierte Daten wie Bilder, Audiodateien und natürliche Sprache mit bemerkenswerter Genauigkeit zu verarbeiten.
Der Kern der Vektorsuche besteht darin, Rohdaten in hochdimensionale numerische Vektoren umzuwandeln, die als Einbettungen bezeichnet werden. Bei diesem Prozess werden Elemente auf Punkte in einem mehrdimensionalen Raum abgebildet, in dem konzeptionell ähnliche Elemente nahe beieinander liegen.
Um die Vektorsuche zu implementieren, müssen Sie zunächst Ihre Daten in Vektoren umwandeln. Der folgende Codeausschnitt zeigt, wie
Sie Feature-Karten und Einbettungen aus einem Bild
unter Verwendung der ultralytics Paket und ein vortrainiertes YOLO26-Modell.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
Die Vektorsuche ist die Engine hinter vielen intuitiven Funktionen im heutigen Software-Ökosystem und schließt die Lücke zwischen Computervision (CV) und Benutzerabsicht.
Es ist hilfreich, die Vektorsuche von ähnlichen Begriffen zu unterscheiden, um die gesamte Pipeline des maschinellen Lernens (ML) zu verstehen.
Für Teams, die Ähnlichkeitssuchsysteme entwickeln, ist die Verwaltung von Datensätzen und das Trainieren von Einbettungsmodellen ein entscheidender erster Schritt. Ultralytics vereinfacht diesen Arbeitsablauf durch die Bereitstellung von Tools für das Datenmanagement, Cloud-Training und die Modellbereitstellung. Indem Sie sicherstellen, dass Ihre Basismodelle – sei es für die Objekterkennung oder Klassifizierung – leistungsstark sind, stellen Sie sicher, dass die resultierenden Vektoren genaue und aussagekräftige Suchergebnisse liefern.