용어집

벡터 검색

벡터 검색이 NLP, 비전, 이상 징후 탐지와 같은 애플리케이션에서 유사도 기반 데이터 검색을 지원하여 AI를 혁신하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

벡터 검색은 벡터 표현을 기반으로 데이터 포인트를 검색하도록 설계된 인공 지능(AI) 및 머신 러닝(ML)의 강력한 기술입니다. 정확히 일치하거나 단순한 문자열 비교에 의존하는 기존의 키워드 기반 검색과 달리, 벡터 검색은 다차원 벡터 공간 내에서 데이터 포인트의 근접성 또는 유사성에 초점을 맞춥니다. 이 접근 방식은 이미지, 오디오, 텍스트와 같은 비정형 데이터가 포함된 애플리케이션에 특히 유용합니다.

벡터 검색 이해

벡터 검색의 핵심은 데이터를 데이터의 의미론적 의미나 특징을 포착하는 숫자 배열인 벡터 표현으로 변환하는 것입니다. 예를 들어, BERT와 같은 자연어 처리(NLP) 모델은 문장에 대한 벡터 임베딩을 생성하여 고차원 공간에서 문장의 맥락과 의미를 포착합니다. 마찬가지로 이미지 분류와 같은 컴퓨터 비전 작업에서는 다음과 같은 모델이 Ultralytics YOLO 와 같은 모델은 이미지에 대한 특징 임베딩을 생성합니다.

데이터가 벡터로 표현되면 벡터 검색 알고리즘은 코사인 유사도나 유클리드 거리와 같은 유사성 측정값을 사용해 주어진 쿼리 벡터에 가장 가까운 데이터 포인트를 식별합니다. 이렇게 하면 정확히 일치하는 항목이 없더라도 의미론적으로나 문맥적으로 유사한 결과를 검색할 수 있습니다.

벡터 검색의 주요 애플리케이션

추천 시스템

벡터 검색은 추천 엔진에서 사용자 선호도에 따라 제품, 콘텐츠 또는 서비스를 제안하는 데 널리 사용됩니다. 예를 들어

  • 넷플릭스나 스포티파이 같은 스트리밍 플랫폼은 딥러닝 모델에서 생성한 임베딩을 활용하여 사용자의 시청 또는 청취 기록에 맞는 영화나 노래를 추천하는 벡터 검색을 사용합니다.
  • Amazon과 같은 전자상거래 플랫폼은 벡터 검색을 구현하여 사용자가 보거나 구매한 상품과 유사한 상품을 추천합니다.

시각적 검색

사용자가 이미지나 객체를 검색하는 애플리케이션에서 벡터 검색은 시각적 특징을 기반으로 효율적인 검색을 가능하게 합니다:

  • 패션 소매업체에서는 고객이 의류 품목의 사진을 업로드하고 벡터 검색을 사용하여 카탈로그에서 유사한 제품을 찾을 수 있도록 허용할 수 있습니다.
  • 의료 분야에서 시스템은 쿼리 이미지와 유사한 패턴이 포함된 엑스레이나 MRI와 같은 의료 이미지를 식별하여 진단을 지원할 수 있습니다. 의료 분야의 이미지 인식에 대해 자세히 알아보세요.

자연어 처리

벡터 검색은 NLP에서 시맨틱 검색을 지원하여 검색 엔진과 챗봇을 향상시킵니다:

  • 학술 데이터베이스에서 사용하는 것과 같은 시맨틱 검색 엔진은 정확한 키워드가 아닌 쿼리의 의미를 기반으로 기사나 논문을 검색합니다. 시맨틱 검색에 대해 자세히 알아보세요.
  • 챗봇은 벡터 검색을 활용하여 문맥에 맞는 답변을 제공함으로써 사용자 만족도를 향상시킵니다.

이상 징후 탐지

사이버 보안 및 금융과 같은 산업에서는 이상값이나 이상 징후를 탐지하기 위해 벡터 검색을 적용합니다:

  • 네트워크 침입 탐지 시스템은 네트워크 활동의 벡터 표현을 분석하여 비정상적인 패턴을 식별합니다.
  • 은행의 사기 탐지 시스템은 벡터 검색을 사용하여 거래 벡터를 비교하여 정상적인 행동에서 크게 벗어난 거래 벡터를 표시합니다. 이상 징후 탐지에 대해 알아보세요.

기술 정보

대규모로 벡터 검색을 수행하기 위해 특수 도구와 프레임워크가 사용되는 경우가 많습니다. Milvus나 Pinecone과 같은 벡터 데이터베이스는 대규모의 고차원 벡터 데이터를 효율적으로 처리하도록 설계되었습니다. 이러한 시스템은 근사 근사 이웃(ANN) 알고리즘을 활용하여 검색 성능을 가속화하므로 실시간 애플리케이션에 적합합니다.

또한 주성분 분석(PCA)과 같은 기술을 사용한 차원 축소와 같은 전처리 단계를 통해 벡터 데이터의 크기를 줄이면서 의미 있는 관계를 보존하여 저장 및 검색을 최적화할 수 있습니다.

관련 개념과의 차이점

  • 시맨틱 검색: 벡터 검색은 시맨틱 검색을 뒷받침하지만, 시맨틱 검색은 특히 NLP 애플리케이션에서 쿼리의 문맥적 의미를 기반으로 결과를 검색하는 데 중점을 둡니다. 시맨틱 검색에 대해 자세히 알아보세요.
  • 벡터 데이터베이스: 벡터 데이터를 관리하고 쿼리하는 데 최적화된 전문 스토리지 시스템으로, 대규모 벡터 검색을 수행할 수 있습니다. 벡터 데이터베이스에 대해 알아보세요.

실제 사례: 자율 주행 자동차

자율 주행 차량은 벡터 검색을 통해 실시간으로 주변 환경을 처리하고 분석합니다. 예를 들어

  • 자율 주행 자동차는 카메라로 캡처한 이미지의 벡터 임베딩을 사용하여 벡터 검색 알고리즘을 사용하여 보행자나 교통 표지판과 같은 물체를 식별하고 분류합니다. 자율 주행 차량의 AI에 대해 알아보세요.

실제 사례: AI 기반 채용

인재 확보에서는 벡터 검색을 사용하여 후보자를 직무 설명에 맞게 매칭합니다:

  • AI 시스템은 이력서와 채용 공고를 벡터 임베딩으로 변환하여 채용 담당자가 직무 요구사항에 부합하는 기술과 경험을 가진 지원자를 식별할 수 있도록 지원합니다.

결론

벡터 검색은 AI 시스템이 텍스트, 이미지, 오디오, 동영상 등 다양한 데이터 유형에 걸쳐 유사도 기반 검색을 수행할 수 있도록 하는 혁신적인 기술입니다. 벡터 검색은 고급 임베딩과 유사도 측정을 활용하여 개인화된 추천부터 이상 징후 탐지에 이르기까지 다양한 애플리케이션을 지원합니다. Ultralytics 허브와 같은 도구를 살펴보고 비전 AI 기능을 프로젝트에 원활하게 통합하세요.

모두 보기