Glossar

Vektorsuche

Entdecke, wie die Vektorsuche die KI revolutioniert, indem sie eine auf Ähnlichkeit basierende Datenabfrage für Anwendungen wie NLP, Vision und Anomalieerkennung ermöglicht.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Die Vektorsuche ist eine leistungsstarke Technik der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML), mit der Datenpunkte auf der Grundlage ihrer Vektordarstellung gefunden werden können. Im Gegensatz zur herkömmlichen schlagwortbasierten Suche, die sich auf exakte Übereinstimmungen oder einfache String-Vergleiche stützt, konzentriert sich die Vektorsuche auf die Nähe oder Ähnlichkeit von Datenpunkten innerhalb eines mehrdimensionalen Vektorraums. Dieser Ansatz ist besonders nützlich für Anwendungen mit unstrukturierten Daten wie Bildern, Audio und Text.

Die Vektorsuche verstehen

Im Kern geht es bei der Vektorsuche darum, Daten in Vektordarstellungen umzuwandeln - numerische Arrays, die die semantische Bedeutung oder die Merkmale der Daten erfassen. Modelle zur Verarbeitung natürlicher Sprache (NLP) wie BERT erzeugen beispielsweise Vektoreinbettungen für Sätze, die deren Kontext und Bedeutung in einem hochdimensionalen Raum erfassen. Ähnlich verhält es sich bei Computer-Vision-Aufgaben wie der Bildklassifizierung, wo Modelle wie Ultralytics YOLO Feature Embeddings für Bilder erstellt.

Sobald die Daten als Vektoren dargestellt werden, verwenden Vektorsuchalgorithmen Ähnlichkeitsmaße wie die Kosinusähnlichkeit oder den euklidischen Abstand, um Datenpunkte zu identifizieren, die einem bestimmten Abfragevektor am nächsten liegen. So können Ergebnisse gefunden werden, die semantisch oder kontextuell ähnlich sind, auch wenn es keine exakten Übereinstimmungen gibt.

Wichtige Anwendungen der Vektorsuche

Empfehlungssysteme

Die Vektorsuche wird häufig in Empfehlungsmaschinen eingesetzt, um Produkte, Inhalte oder Dienstleistungen auf der Grundlage von Nutzerpräferenzen vorzuschlagen. Zum Beispiel:

  • Streaming-Plattformen wie Netflix und Spotify nutzen die Vektorsuche, um Filme oder Songs zu empfehlen, die zu der Seh- oder Hörhistorie eines Nutzers passen, indem sie von Deep-Learning-Modellen generierte Einbettungen nutzen.
  • E-Commerce-Plattformen wie Amazon setzen die Vektorsuche ein, um Produkte vorzuschlagen, die denen ähnlich sind, die ein/e Nutzer/in angesehen oder gekauft hat.

Visuelle Suche

In Anwendungen, in denen Nutzer/innen nach Bildern oder Objekten suchen, ermöglicht die Vektorsuche eine effiziente Suche auf der Grundlage visueller Merkmale:

  • Ein Modehändler könnte seinen Kunden erlauben, Fotos von Kleidungsstücken hochzuladen und mit der Vektorsuche ähnliche Produkte in seinem Katalog zu finden.
  • Im Gesundheitswesen können Systeme medizinische Bilder wie Röntgenbilder oder MRTs identifizieren, die ähnliche Muster wie das angefragte Bild enthalten, und so die Diagnose unterstützen. Erfahre mehr über Bilderkennung im Gesundheitswesen.

Natürliche Sprachverarbeitung

Die Vektorsuche unterstützt die semantische Suche im NLP und verbessert Suchmaschinen und Chatbots:

  • Semantische Suchmaschinen, wie sie z. B. von akademischen Datenbanken verwendet werden, finden Artikel oder Abhandlungen auf der Grundlage der Bedeutung einer Suchanfrage und nicht anhand exakter Schlüsselwörter. Erfahre mehr über die semantische Suche.
  • Chatbots nutzen die Vektorsuche, um kontextbezogene Antworten zu geben und so die Nutzerzufriedenheit zu erhöhen.

Anomalie-Erkennung

In Branchen wie Cybersicherheit und Finanzen wird die Vektorsuche eingesetzt, um Ausreißer oder Anomalien zu erkennen:

  • Systeme zur Erkennung von Netzwerkeinbrüchen analysieren Vektordarstellungen von Netzwerkaktivitäten, um ungewöhnliche Muster zu erkennen.
  • Betrugserkennungssysteme im Bankwesen verwenden die Vektorsuche, um Transaktionsvektoren zu vergleichen und diejenigen zu markieren, die erheblich vom normalen Verhalten abweichen. Erforsche die Erkennung von Anomalien.

Technische Informationen

Um eine Vektorsuche in großem Maßstab durchzuführen, werden oft spezielle Tools und Frameworks eingesetzt. Vektordatenbanken wie Milvus und Pinecone sind darauf ausgelegt, große, hochdimensionale Vektordaten effizient zu verarbeiten. Diese Systeme nutzen ANN-Algorithmen (Approximate Nearest Neighbour), um die Suchleistung zu beschleunigen, und sind daher für Echtzeitanwendungen geeignet.

Zusätzlich können Vorverarbeitungsschritte wie die Dimensionalitätsreduzierung mit Techniken wie der Hauptkomponentenanalyse (PCA) die Speicherung und das Abrufen von Vektordaten optimieren, indem die Größe reduziert wird und gleichzeitig sinnvolle Beziehungen erhalten bleiben.

Abgrenzung zu verwandten Konzepten

  • Semantische Suche: Während die Vektorsuche die Grundlage für die semantische Suche bildet, konzentriert sich letztere speziell auf das Abrufen von Ergebnissen auf der Grundlage der kontextuellen Bedeutung von Abfragen, oft in NLP-Anwendungen. Erfahre mehr über die semantische Suche.
  • Vektordatenbanken: Das sind spezialisierte Speichersysteme, die für die Verwaltung und Abfrage von Vektordaten optimiert sind und die Vektorsuche in großem Umfang ermöglichen. Entdecke Vektordatenbanken.

Beispiel aus der realen Welt: Selbstfahrende Autos

Autonome Fahrzeuge verlassen sich auf die Vektorsuche, um ihre Umgebung in Echtzeit zu verarbeiten und zu analysieren. Zum Beispiel:

  • Ein selbstfahrendes Auto nutzt Vektoreinbettungen von Bildern, die von seinen Kameras aufgenommen wurden, um Objekte wie Fußgänger oder Verkehrsschilder mithilfe von Vektorsuchalgorithmen zu identifizieren und zu klassifizieren. Erforsche KI in selbstfahrenden Autos.

Beispiel aus der realen Welt: KI-gestützte Rekrutierung

In der Talentakquise wird die Vektorsuche eingesetzt, um Kandidaten mit Stellenbeschreibungen abzugleichen:

  • KI-Systeme wandeln Lebensläufe und Stellenausschreibungen in Vektor-Embeddings um und ermöglichen es Personalverantwortlichen, Bewerber/innen zu identifizieren, deren Fähigkeiten und Erfahrungen eng mit den Stellenanforderungen übereinstimmen.

Schlussfolgerung

Die Vektorsuche ist eine transformative Technologie, die es KI-Systemen ermöglicht, Ähnlichkeitsrecherchen in verschiedenen Datentypen durchzuführen, von Text über Bilder bis hin zu Audio und Video. Durch die Nutzung fortschrittlicher Einbettungen und Ähnlichkeitsmaße ermöglicht die Vektorsuche Anwendungen, die von personalisierten Empfehlungen bis hin zur Erkennung von Anomalien und mehr reichen. Nutze Tools wie Ultralytics HUB, um KI-Funktionen nahtlos in deine Projekte einzubinden.

Alles lesen