Descobre como a pesquisa vetorial revoluciona a IA ao permitir a semelhança semântica na recuperação de dados para PNL, pesquisa visual, sistemas de recomendação e muito mais!
A pesquisa vetorial é uma técnica poderosa utilizada na inteligência artificial (IA) e na aprendizagem automática (ML) para encontrar itens de dados com base na sua semelhança concetual em vez de correspondências exactas de palavras-chave. Em vez de procurar texto com palavras específicas, a pesquisa vetorial permite que os sistemas recuperem informações - como imagens, documentos ou sons - que estejam semanticamente relacionadas ou contextualmente semelhantes a uma consulta. Este método é fundamental para muitas aplicações modernas de IA, permitindo uma recuperação de informação mais intuitiva e semelhante à humana.
O conceito central da pesquisa vetorial é a incorporação de vectores. Os dados, quer sejam texto, imagens, áudio ou outros tipos, são transformados em representações numéricas denominadas vectores, utilizando modelos de incorporação. Estes vectores existem num espaço de elevada dimensão onde os itens com significados ou caraterísticas semelhantes são posicionados próximos uns dos outros. Por exemplo, no processamento de linguagem natural (PNL), modelos como o BERT convertem frases em vectores, assegurando que as frases que transmitem ideias semelhantes têm representações vectoriais próximas. Da mesma forma, na visão computacional (CV), modelos como o Ultralytics YOLO podem gerar vectores de caraterísticas para imagens, permitindo comparações de semelhanças visuais. Uma vez incorporados os dados, os algoritmos de pesquisa vetorial utilizam métricas de distância, como a semelhança cosseno ou a distância euclidiana, para quantificar a "proximidade" entre vectores. Uma consulta (também convertida num vetor) é comparada com os vectores da base de dados e os itens correspondentes aos vectores mais próximos são devolvidos como resultados da pesquisa.
A implementação da pesquisa vetorial envolve normalmente os seguintes passos:
A pesquisa vetorial permite uma vasta gama de aplicações sofisticadas de IA:
Embora frequentemente utilizados em conjunto, a Pesquisa Vetorial e a Pesquisa Semântica são conceitos distintos. A Pesquisa Semântica refere-se ao objetivo de compreender a intenção do utilizador e o significado contextual da sua consulta para fornecer resultados relevantes. A Pesquisa Vetorial é um método ou mecanismo frequentemente utilizado para implementar a pesquisa semântica. Obtém relevância semântica encontrando itens que estão "próximos" no espaço vetorial, em que a proximidade representa a semelhança semântica. Por conseguinte, a pesquisa vetorial é o motor que alimenta muitas aplicações de pesquisa semântica, operando sobre as incorporações vectoriais que captam o significado. Modelos avançados como o YOLO aproveitam estes conceitos para a deteção de objectos de vocabulário aberto.