Glossário

Pesquisa Vetorial

Descobre como a pesquisa de vectores revoluciona a IA ao permitir a recuperação de dados baseada na semelhança para aplicações como PNL, visão e deteção de anomalias.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A pesquisa vetorial é uma técnica poderosa em inteligência artificial (IA) e aprendizagem automática (ML) concebida para recuperar pontos de dados com base nas suas representações vectoriais. Ao contrário das pesquisas tradicionais baseadas em palavras-chave, que se baseiam em correspondências exactas ou comparações simples de cadeias de caracteres, a pesquisa vetorial centra-se na proximidade ou semelhança de pontos de dados num espaço vetorial multidimensional. Esta abordagem é especialmente útil para aplicações que envolvem dados não estruturados, como imagens, áudio e texto.

Compreender a pesquisa de vectores

Na sua essência, a pesquisa vetorial envolve a conversão de dados em representações vectoriais - matrizes numéricas que captam o significado semântico ou as caraterísticas dos dados. Por exemplo, os modelos de processamento de linguagem natural (PNL), como o BERT, geram embeddings vectoriais para frases, capturando o seu contexto e significado num espaço de elevada dimensão. Do mesmo modo, em tarefas de visão por computador, como a classificação de imagens, modelos como o Ultralytics YOLO geram incorporações de caraterísticas para imagens.

Quando os dados são representados como vectores, os algoritmos de pesquisa vetorial utilizam medidas de semelhança como a semelhança cosseno ou a distância euclidiana para identificar os pontos de dados mais próximos de um determinado vetor de consulta. Isto permite obter resultados que são semântica ou contextualmente semelhantes, mesmo que não existam correspondências exactas.

Principais aplicações da pesquisa vetorial

Sistemas de recomendação

A pesquisa vetorial é amplamente utilizada em motores de recomendação para sugerir produtos, conteúdos ou serviços com base nas preferências do utilizador. Por exemplo:

  • Plataformas de streaming como a Netflix e o Spotify utilizam a pesquisa vetorial para recomendar filmes ou músicas que se alinham com o histórico de visualização ou audição de um utilizador, tirando partido de incorporação gerada por modelos de aprendizagem profunda.
  • Plataformas de comércio eletrónico como a Amazon implementam a pesquisa vetorial para sugerir produtos semelhantes aos que um utilizador viu ou comprou.

Pesquisa visual

Nas aplicações em que os utilizadores procuram imagens ou objectos, a pesquisa vetorial permite uma recuperação eficiente com base em caraterísticas visuais:

  • Um retalhista de moda pode permitir que os clientes carreguem fotografias de artigos de vestuário, utilizando a pesquisa vetorial para encontrar produtos semelhantes no seu catálogo.
  • Nos cuidados de saúde, os sistemas podem identificar imagens médicas, como raios X ou ressonâncias magnéticas, que contêm padrões semelhantes a uma imagem de consulta, ajudando no diagnóstico. Sabe mais sobre o reconhecimento de imagens nos cuidados de saúde.

Processamento de linguagem natural

A pesquisa vetorial potencia a pesquisa semântica em PNL, melhorando os motores de busca e os chatbots:

  • Os motores de pesquisa semântica, como os utilizados pelas bases de dados académicas, recuperam artigos ou documentos com base no significado de uma consulta e não em palavras-chave exactas. Descobre mais sobre a pesquisa semântica.
  • Os chatbots tiram partido da pesquisa vetorial para fornecer respostas contextualmente relevantes, melhorando a satisfação do utilizador.

Deteção de anomalias

Em sectores como a cibersegurança e as finanças, a pesquisa de vectores é aplicada para detetar anomalias ou valores anómalos:

  • Os sistemas de deteção de intrusões na rede analisam representações vectoriais da atividade da rede para identificar padrões invulgares.
  • Os sistemas de deteção de fraude no sector bancário utilizam a pesquisa de vectores para comparar vectores de transação, assinalando os que se desviam significativamente do comportamento normal. Explora a deteção de anomalias.

Informações técnicas

Para efetuar pesquisas vectoriais em escala, são frequentemente utilizadas ferramentas e estruturas especializadas. As bases de dados vectoriais, como a Milvus e a Pinecone, foram concebidas para tratar eficientemente dados vectoriais de grande escala e de elevada dimensão. Estes sistemas utilizam algoritmos de vizinho mais próximo aproximado (ANN) para acelerar o desempenho da pesquisa, tornando-os adequados para aplicações em tempo real.

Além disso, as etapas de pré-processamento, como a redução da dimensionalidade com técnicas como a análise de componentes principais (PCA), podem otimizar o armazenamento e a recuperação de dados vectoriais, reduzindo a sua dimensão e preservando as relações significativas.

Distinção de conceitos relacionados

  • Pesquisa semântica: Enquanto a pesquisa vetorial está na base da pesquisa semântica, esta última centra-se especificamente na recuperação de resultados com base no significado contextual das consultas, frequentemente em aplicações de PNL. Sabe mais sobre a pesquisa semântica.
  • Bases de dados vectoriais: São sistemas de armazenamento especializados optimizados para gerir e consultar dados vectoriais, permitindo que a pesquisa vetorial seja efectuada em escala. Descobre as bases de dados vectoriais.

Exemplo do mundo real: Carros autónomos

Os veículos autónomos baseiam-se na pesquisa vetorial para processar e analisar o ambiente que os rodeia em tempo real. Por exemplo:

  • Um automóvel de condução autónoma utiliza incorporações vectoriais de imagens captadas pelas suas câmaras para identificar e classificar objectos, como peões ou sinais de trânsito, utilizando algoritmos de pesquisa vetorial. Explora a IA em automóveis autónomos.

Exemplo do mundo real: Recrutamento com base em IA

Na aquisição de talentos, a pesquisa vetorial é utilizada para fazer corresponder os candidatos às descrições de funções:

  • Os sistemas de IA convertem currículos e anúncios de emprego em vectores de incorporação, permitindo aos recrutadores identificar os candidatos cujas competências e experiências se alinham de perto com os requisitos do emprego.

Conclusão

A pesquisa vetorial é uma tecnologia transformadora que permite aos sistemas de IA efetuar uma recuperação baseada na semelhança em vários tipos de dados, desde texto e imagens a áudio e vídeo. Ao tirar partido de medidas avançadas de incorporação e semelhança, a pesquisa vetorial facilita aplicações que vão desde recomendações personalizadas à deteção de anomalias e muito mais. Explora ferramentas como Ultralytics HUB para incorporar capacidades de IA de visão nos teus projectos sem problemas.

Lê tudo