Glossar

Vektorsuche

Entdecke, wie die Vektorsuche die KI revolutioniert, indem sie semantische Ähnlichkeit bei der Datenabfrage für NLP, visuelle Suche, Empfehlungssysteme und mehr ermöglicht!

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Vektorsuche ist eine leistungsstarke Technik, die in der künstlichen Intelligenz (KI) und beim maschinellen Lernen (ML) eingesetzt wird, um Daten anhand ihrer konzeptionellen Ähnlichkeit und nicht anhand exakter Schlüsselwortübereinstimmungen zu finden. Anstatt nach Text zu suchen, der bestimmte Wörter enthält, können Systeme mit der Vektorsuche Informationen - wie Bilder, Dokumente oder Töne - abrufen, die semantisch verwandt oder kontextuell ähnlich zu einer Anfrage sind. Diese Methode ist für viele moderne KI-Anwendungen von grundlegender Bedeutung, da sie eine intuitivere und menschenähnliche Informationsbeschaffung ermöglicht.

Vektoreinbettungen verstehen

Das Kernkonzept der Vektorsuche ist die Vektoreinbettung. Daten, egal ob Text, Bilder, Audio oder andere Arten, werden mithilfe von Einbettungsmodellen in numerische Darstellungen umgewandelt, die Vektoren genannt werden. Diese Vektoren existieren in einem hochdimensionalen Raum, in dem Elemente mit ähnlichen Bedeutungen oder Eigenschaften nahe beieinander liegen. Bei der Verarbeitung natürlicher Sprache (NLP) beispielsweise wandeln Modelle wie BERT Sätze in Vektoren um und stellen sicher, dass Sätze, die ähnliche Ideen vermitteln, nahe beieinander liegende Vektordarstellungen haben. Auch in der Computer Vision (CV) werden Modelle wie Ultralytics YOLO Merkmalsvektoren für Bilder generieren und so visuelle Ähnlichkeitsvergleiche ermöglichen. Sobald die Daten eingebettet sind, verwenden Vektorsuchalgorithmen Distanzmetriken wie Cosinus Ähnlichkeit oder Euklidische Distanz, um die "Nähe" zwischen Vektoren zu quantifizieren. Eine Abfrage (die ebenfalls in einen Vektor umgewandelt wird) wird mit den Vektoren in der Datenbank verglichen, und die Elemente, die den nächstgelegenen Vektoren entsprechen, werden als Suchergebnisse zurückgegeben.

So funktioniert die Vektorsuche

Die Umsetzung der Vektorsuche umfasst in der Regel diese Schritte:

  1. Erzeugung von Einbettungen: Konvertiere deinen Datensatz (Bilder, Text usw.) in Vektoreinbettungen mit einem vortrainierten oder selbst erstellten Modell.
  2. Indizierung: Speichere diese Vektoren in einer speziellen Vektordatenbank oder einem Index, der für eine effiziente Ähnlichkeitssuche entwickelt wurde. Beispiele sind Pinecone und Milvus.
  3. Abfragen: Konvertiere die Suchanfrage (z. B. ein Bild oder eine Textphrase) in einen Vektor, indem du das gleiche Einbettungsmodell verwendest.
  4. Suche: Verwende einen Algorithmus wie die ANN-Suche (Approximate Nearest Neighbor), um effizient die Vektoren im Index zu finden, die dem Abfragevektor auf der Grundlage der gewählten Abstandsmetrik am nächsten sind.
  5. Abrufen: Gib die Originaldaten zurück, die den nächstgelegenen gefundenen Vektoren entsprechen.

Anwendungen der Vektorsuche

Die Vektorsuche ermöglicht eine breite Palette von anspruchsvollen KI-Anwendungen:

  • Empfehlungssysteme: Plattformen wie Netflix oder Spotify stellen Nutzer und Artikel (Filme, Songs) als Vektoren dar. Die Vektorsuche findet Artikel, deren Vektoren dem Vektor eines Nutzers (der seine Vorlieben repräsentiert) nahe kommen, und führt zu personalisierten Empfehlungen.
  • Visuelle Suche: Auf E-Commerce-Websites können Nutzer/innen ein Bild eines Produkts hochladen, das ihnen gefällt. Das System wandelt das Bild in einen Vektor um und nutzt die Vektorsuche, um visuell ähnliche Produkte im Bestand zu finden. Dies hängt stark von effektiven Bilderkennungseinbettungen ab. Tools auf Plattformen wie Ultralytics HUB können dabei helfen, die Datensätze zu verwalten, die zum Trainieren von Modellen für solche Aufgaben verwendet werden.
  • Semantische Suche: Verbesserung von Suchmaschinen oder Chatbots, um die Bedeutung hinter Anfragen zu verstehen. Anstelle von Schlüsselwörtern findet die Vektorsuche Dokumente oder Antworten, die für den Kontext relevant sind. Dies ist entscheidend für Funktionen wie den Ultralytics Explorer, der die Suche in Datensätzen mit natürlicher Sprache ermöglicht.
  • Anomalie-Erkennung: In der Cybersicherheit oder bei der Betrugserkennung können normale Verhaltensmuster als Cluster von Vektoren dargestellt werden. Die Vektorsuche kann Datenpunkte (potenzielle Anomalien) identifizieren, die weit außerhalb dieser Cluster liegen.
  • Systeme zur Beantwortung von Fragen: Das Auffinden relevanter Passagen in einer großen Wissensdatenbank zur Beantwortung von Nutzerfragen, oft als Teil von Retrieval-Augmented Generation (RAG) -Systemen verwendet.

Vektorsuche vs. Semantische Suche

Obwohl sie oft zusammen verwendet werden, sind Vektorsuche und semantische Suche unterschiedliche Konzepte. Semantische Suche bezieht sich auf das Ziel, die Absicht des Nutzers und die kontextuelle Bedeutung seiner Anfrage zu verstehen, um relevante Ergebnisse zu liefern. Die Vektorsuche ist eine Methode oder ein Mechanismus, der häufig zur Umsetzung der semantischen Suche verwendet wird. Sie erreicht semantische Relevanz, indem sie Suchbegriffe findet, die im Vektorraum "nah" beieinander liegen, wobei die Nähe die semantische Ähnlichkeit darstellt. Daher ist die Vektorsuche der Motor für viele semantische Suchanwendungen, da sie mit den Vektoreinbettungen arbeitet, die die Bedeutung erfassen. Fortschrittliche Modelle wie YOLO nutzen diese Konzepte für die Erkennung von Objekten mit offenem Vokabular.

Alles lesen