Glossario

Ricerca vettoriale

Scopri come la ricerca vettoriale rivoluziona l'IA consentendo la similarità semantica nel recupero dei dati per l'NLP, la ricerca visiva, i sistemi di raccomandazione e molto altro ancora!

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

La ricerca vettoriale è un metodo utilizzato nell'intelligenza artificiale (AI) e nell'apprendimento automatico (ML) per trovare dati basati sulla somiglianza, piuttosto che su parole chiave esatte. Immagina di cercare immagini che assomigliano a una foto specifica o di trovare documenti semanticamente simili a un determinato testo. È qui che entra in gioco la ricerca vettoriale, che consente alle macchine di comprendere e recuperare le informazioni in base al significato e al contesto.

Capire le incorporazioni vettoriali

Il cuore della ricerca vettoriale è il concetto di embedding vettoriale. Si tratta di rappresentazioni numeriche di dati, come testi, immagini o audio, trasformati in vettori ad alta dimensionalità. Questi vettori catturano le caratteristiche essenziali e il significato semantico dei dati. Ad esempio, nell'elaborazione del linguaggio naturale (NLP), modelli come BERT (Bidirectional Encoder Representations from Transformers) possono convertire le frasi in vettori, dove frasi simili sono posizionate vicine nello spazio vettoriale. Allo stesso modo, nella computer vision, un modello Ultralytics YOLO modello può generare vettori di caratteristiche per le immagini, consentendo di confrontare la somiglianza tra i contenuti visivi.

Una volta convertiti i dati in embedding vettoriali, gli algoritmi di ricerca vettoriale utilizzano metriche di distanza come la somiglianza coseno o la distanza euclidea per misurare la vicinanza tra i vettori. Calcolando queste distanze, il sistema può identificare e recuperare i punti di dati più simili a un vettore di interrogazione, anche se non contengono le parole chiave esatte.

Applicazioni della ricerca vettoriale

La ricerca vettoriale sta rivoluzionando diverse applicazioni di intelligenza artificiale, in particolare quelle che si occupano di dati non strutturati:

  • Sistemi di raccomandazione: Piattaforme come Netflix o Spotify utilizzano la ricerca vettoriale per consigliare film o canzoni in base alle preferenze degli utenti. Incorporando i profili degli utenti e le caratteristiche degli articoli in uno spazio vettoriale, il sistema può trovare rapidamente gli articoli che sono simili alle interazioni passate di un utente, migliorando la personalizzazione e il coinvolgimento degli utenti.

  • Ricerca visiva: Nell'e-commerce o nel reperimento di immagini, la ricerca vettoriale consente di effettuare ricerche visive. Gli utenti possono caricare un'immagine e il sistema, utilizzando le incorporazioni vettoriali delle immagini, può trovare prodotti o immagini visivamente simili da un database. Si tratta di un metodo molto più efficace rispetto alle ricerche di immagini basate su parole chiave, soprattutto quando la descrizione dei contenuti visivi è impegnativa.Scopri di più sul riconoscimento delle immagini

  • Elaborazione del linguaggio naturale: La ricerca semantica, alimentata dalla ricerca vettoriale, consente ai motori di ricerca e ai chatbot di comprendere il significato delle query. Invece di affidarsi alla corrispondenza delle parole chiave, questi sistemi utilizzano le incorporazioni vettoriali del testo per trovare documenti o risposte contestualmente rilevanti, migliorando l'accuratezza e la pertinenza dei risultati di ricerca e dell'IA conversazionale.Scopri la ricerca semantica

  • Rilevamento delle anomalie: In campi come la sicurezza informatica o il rilevamento delle frodi, la ricerca vettoriale può identificare modelli insoliti o anomalie. Rappresentando il comportamento normale come vettori, il sistema può individuare rapidamente i punti di dati che si discostano in modo significativo dalla norma, segnalando potenziali anomalie da indagare ulteriormente.

Aspetti tecnici

Per gestire le esigenze computazionali della ricerca vettoriale, soprattutto con grandi insiemi di dati e vettori ad alta dimensionalità, vengono impiegati strumenti e tecniche specializzate. I database vettoriali, come Pinecone e Milvus, sono progettati per archiviare, indicizzare e interrogare in modo efficiente le incorporazioni vettoriali in scala. Questi database spesso utilizzano algoritmi di prossimità approssimativa (ANN) per accelerare il processo di ricerca, barattando una piccola quantità di accuratezza con un significativo guadagno di velocità, rendendo fattibile la ricerca vettoriale in tempo reale.

Inoltre, tecniche come la riduzione della dimensionalità, come l'analisi delle componenti principali (PCA), possono essere utilizzate per ridurre le dimensioni delle incorporazioni vettoriali preservando le informazioni essenziali, ottimizzando l'efficienza di archiviazione e ricerca.

Esempi del mondo reale

Le auto a guida autonoma si affidano molto alla ricerca vettoriale per la percezione in tempo reale. Ad esempio, quando i sensori di un'auto a guida autonoma rilevano un oggetto, il sistema utilizza la ricerca vettoriale per confrontare il vettore delle caratteristiche dell'oggetto con un database di oggetti noti (pedoni, veicoli, segnali) per identificarlo e classificarlo rapidamente, consentendo un rapido processo decisionale per una navigazione sicura. Esplora l'intelligenza artificiale nelle auto a guida autonoma

Nel reclutamento basato sull'intelligenza artificiale, la ricerca vettoriale è in grado di abbinare in modo efficiente i candidati alle descrizioni del lavoro. I profili dei candidati e le descrizioni dei lavori vengono convertiti in embeddings vettoriali e gli algoritmi di ricerca vettoriale trovano i candidati i cui profili sono più simili ai requisiti di un lavoro, semplificando il processo di acquisizione dei talenti.

Leggi tutto