Glossario

Ricerca vettoriale

Scopri come la ricerca vettoriale rivoluziona l'IA consentendo la similarità semantica nel recupero dei dati per l'NLP, la ricerca visiva, i sistemi di raccomandazione e molto altro ancora!

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

La ricerca vettoriale è una potente tecnica utilizzata nell'intelligenza artificiale (AI) e nell'apprendimento automatico (ML) per trovare elementi di dati basati sulla loro somiglianza concettuale piuttosto che su esatte corrispondenze di parole chiave. Invece di cercare un testo contenente parole specifiche, la ricerca vettoriale permette ai sistemi di recuperare le informazioni - immagini, documenti o suoni - che sono semanticamente correlate o contestualmente simili a una query. Questo metodo è fondamentale per molte applicazioni moderne di intelligenza artificiale, in quanto consente di recuperare le informazioni in modo più intuitivo e simile a quello umano.

Capire le incorporazioni vettoriali

Il concetto centrale della ricerca vettoriale è l'embedding vettoriale. I dati, siano essi testi, immagini, audio o di altro tipo, vengono trasformati in rappresentazioni numeriche chiamate vettori utilizzando modelli di embedding. Questi vettori esistono in uno spazio ad alta dimensione dove gli elementi con significati o caratteristiche simili sono posizionati l'uno vicino all'altro. Ad esempio, nell'elaborazione del linguaggio naturale (NLP), modelli come BERT convertono le frasi in vettori, assicurando che le frasi che trasmettono idee simili abbiano rappresentazioni vettoriali vicine. Allo stesso modo, nella visione artificiale (CV), modelli come Ultralytics YOLO possono generare vettori di caratteristiche per le immagini, consentendo confronti visivi di somiglianza. Una volta incorporati i dati, gli algoritmi di ricerca vettoriale utilizzano metriche di distanza, come la Somiglianza Coseno o la Distanza Euclidea, per quantificare la "vicinanza" tra i vettori. Una query (anch'essa convertita in un vettore) viene confrontata con i vettori presenti nel database e gli elementi corrispondenti ai vettori più vicini vengono restituiti come risultati della ricerca.

Come funziona la ricerca vettoriale

L'implementazione della ricerca vettoriale prevede in genere i seguenti passaggi:

  1. Generazione di incorporazioni: Converti il tuo set di dati (immagini, testo, ecc.) in embedding vettoriali utilizzando un modello pre-addestrato o personalizzato.
  2. Indicizzazione: Memorizzare questi vettori in un database vettoriale specializzato o in un indice progettato per una ricerca efficiente delle somiglianze. Alcuni esempi sono Pinecone e Milvus.
  3. Interrogazione: Convertire la query di ricerca (ad esempio, un'immagine o una frase di testo) in un vettore utilizzando lo stesso modello di incorporazione.
  4. Ricerca: utilizza un algoritmo come la ricerca approssimativa dei vicini (ANN) per trovare in modo efficiente i vettori nell'indice che sono più vicini al vettore dell'interrogazione in base alla metrica di distanza scelta.
  5. Recupero: Restituisce i dati originali corrispondenti ai vettori più vicini trovati.

Applicazioni della ricerca vettoriale

La ricerca vettoriale consente un'ampia gamma di sofisticate applicazioni di intelligenza artificiale:

  • Sistemi di raccomandazione: Piattaforme come Netflix o Spotify rappresentano gli utenti e gli articoli (film, canzoni) come vettori. La ricerca vettoriale trova gli articoli i cui vettori si avvicinano al vettore di un utente (che rappresenta le sue preferenze), portando a raccomandazioni personalizzate.
  • Ricerca visiva: I siti di e-commerce consentono agli utenti di caricare l'immagine di un prodotto di loro gradimento. Il sistema converte l'immagine in un vettore e utilizza la ricerca vettoriale per trovare prodotti visivamente simili nell'inventario. Ciò si basa molto su un efficace riconoscimento delle immagini. Gli strumenti di piattaforme come Ultralytics HUB possono aiutare a gestire i dataset utilizzati per addestrare i modelli per queste attività.
  • Ricerca semantica: Miglioramento dei motori di ricerca o dei chatbot per comprendere il significato delle query. Invece di far corrispondere le parole chiave, la ricerca vettoriale trova documenti o risposte contestualmente rilevanti. Questo aspetto è fondamentale per funzioni come Ultralytics Explorer, che consente di ricercare insiemi di dati utilizzando il linguaggio naturale.
  • Rilevamento delle anomalie: Nella sicurezza informatica o nel rilevamento delle frodi, i modelli di comportamento normali possono essere rappresentati come cluster di vettori. La ricerca vettoriale può identificare i punti di dati (potenziali anomalie) che non rientrano in questi cluster.
  • Sistemi di risposta alle domande: Trovare passaggi rilevanti in un'ampia base di conoscenza per rispondere alle domande degli utenti, spesso utilizzati come parte dei sistemi di Retrieval-Augmented Generation (RAG).

Ricerca vettoriale vs. ricerca semantica

Anche se spesso vengono utilizzate insieme, la Ricerca Vettoriale e la Ricerca Semantica sono concetti distinti. La ricerca semantica si riferisce all'obiettivo di comprendere l'intento dell'utente e il significato contestuale della sua richiesta per fornire risultati pertinenti. La ricerca vettoriale è un metodo o un meccanismo spesso utilizzato per implementare la ricerca semantica. Raggiunge la rilevanza semantica trovando elementi "vicini" nello spazio vettoriale, dove la vicinanza rappresenta la somiglianza semantica. Pertanto, la ricerca vettoriale è il motore che alimenta molte applicazioni di ricerca semantica, operando sulle incorporazioni vettoriali che catturano il significato. Modelli avanzati come YOLO sfruttano questi concetti per il rilevamento di oggetti a vocabolario aperto.

Leggi tutto