Glossário

Pesquisa Vetorial

Descobre como a pesquisa vetorial revoluciona a IA ao permitir a semelhança semântica na recuperação de dados para PNL, pesquisa visual, sistemas de recomendação e muito mais!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A pesquisa vetorial é um método utilizado na inteligência artificial (IA) e na aprendizagem automática (ML) para encontrar dados com base na semelhança, em vez de palavras-chave exactas. Imagina procurar imagens que se assemelhem a uma fotografia específica, ou encontrar documentos que sejam semanticamente semelhantes a um determinado texto. É aqui que a pesquisa vetorial entra em ação, permitindo que as máquinas compreendam e recuperem informações com base no significado e no contexto.

Compreender a incorporação de vectores

No centro da pesquisa vetorial está o conceito de incorporação de vectores. Trata-se de representações numéricas de dados, como texto, imagens ou áudio, transformadas em vectores de alta dimensão. Estes vectores captam as caraterísticas essenciais e o significado semântico dos dados. Por exemplo, no processamento de linguagem natural (PNL), modelos como o BERT (Bidirectional Encoder Representations from Transformers) podem converter frases em vectores, onde frases semelhantes são posicionadas próximas umas das outras no espaço vetorial. Do mesmo modo, na visão por computador, um modelo Ultralytics YOLO modelo pode gerar vectores de caraterísticas para imagens, permitindo comparações de semelhança entre conteúdos visuais.

Uma vez que os dados são convertidos em vetores, os algoritmos de pesquisa vetorial utilizam métricas de distância como a similaridade cosseno ou a distância euclidiana para medir a proximidade entre os vetores. Ao calcular estas distâncias, o sistema pode identificar e recuperar os pontos de dados que são mais semelhantes a um vetor de consulta, mesmo que não contenham as palavras-chave exactas.

Aplicações da pesquisa vetorial

A pesquisa de vectores está a revolucionar várias aplicações de IA, especialmente as que lidam com dados não estruturados:

  • Sistemas de recomendação: Plataformas como a Netflix ou o Spotify utilizam a pesquisa vetorial para recomendar filmes ou músicas com base nas preferências do utilizador. Ao incorporar perfis de utilizador e caraterísticas de itens num espaço vetorial, o sistema pode encontrar rapidamente itens semelhantes às interações anteriores de um utilizador, melhorando a personalização e o envolvimento do utilizador.

  • Pesquisa visual: No comércio eletrónico ou na recuperação de imagens, a pesquisa vetorial potencia as capacidades de pesquisa visual. Os utilizadores podem carregar uma imagem e o sistema, utilizando a incorporação vetorial de imagens, pode encontrar produtos ou imagens visualmente semelhantes a partir de uma base de dados. Isto é muito mais eficaz do que as pesquisas de imagens baseadas em palavras-chave, especialmente quando a descrição do conteúdo visual é um desafio.Explora mais sobre o reconhecimento de imagens

  • Processamento de linguagem natural: A pesquisa semântica, alimentada pela pesquisa vetorial, permite que os motores de busca e os chatbots compreendam o significado subjacente às consultas. Em vez de se basearem na correspondência de palavras-chave, estes sistemas utilizam a incorporação de vectores de texto para encontrar documentos ou respostas que sejam contextualmente relevantes, melhorando a precisão e a relevância dos resultados de pesquisa e da IA de conversação.

  • Deteção de anomalias: Em áreas como a cibersegurança ou a deteção de fraudes, a pesquisa de vectores pode identificar padrões invulgares ou anomalias. Ao representar o comportamento normal como vectores, o sistema pode detetar rapidamente pontos de dados que se desviam significativamente da norma, assinalando potenciais anomalias para investigação adicional.

Aspectos técnicos

Para lidar com as exigências computacionais da pesquisa vetorial, especialmente com grandes conjuntos de dados e vectores de elevada dimensão, são utilizadas ferramentas e técnicas especializadas. As bases de dados vectoriais, como a Pinecone e a Milvus, foram concebidas para armazenar, indexar e consultar eficazmente as incorporações vectoriais em grande escala. Estas bases de dados utilizam frequentemente algoritmos de vizinho mais próximo aproximado (ANN) para acelerar o processo de pesquisa, trocando uma pequena quantidade de precisão por ganhos significativos de velocidade, tornando viável a pesquisa vetorial em tempo real.

Além disso, técnicas como a redução da dimensionalidade, como a Análise de Componentes Principais (PCA), podem ser utilizadas para reduzir o tamanho das incorporações vectoriais, preservando a sua informação essencial, optimizando o armazenamento e a eficiência da pesquisa.

Exemplos do mundo real

Os automóveis autónomos dependem fortemente da pesquisa vetorial para a perceção em tempo real. Por exemplo, quando os sensores de um automóvel autónomo detectam um objeto, o sistema utiliza a pesquisa vetorial para comparar o vetor de caraterísticas do objeto com uma base de dados de objectos conhecidos (peões, veículos, sinais) para o identificar e classificar rapidamente, permitindo uma tomada de decisão rápida para uma navegação segura. Explora a IA nos automóveis autónomos

No recrutamento com base em IA, a pesquisa vetorial pode fazer corresponder eficazmente os candidatos às descrições das funções. Os perfis dos candidatos e as descrições das funções são convertidos em vectores e os algoritmos de pesquisa vetorial encontram os candidatos cujos perfis são mais semelhantes aos requisitos de uma função, simplificando o processo de aquisição de talentos.

Lê tudo