Yolo 비전 선전
선전
지금 참여하기
용어집

벡터 검색

벡터 검색이 임베딩을 활용해 유사한 데이터를 찾는 방식을 살펴보세요. 정확한 정보 검색을 위해 Ultralytics YOLO26으로 고품질 벡터를 생성하는 방법을 배워보세요.

벡터 검색은 정확한 키워드 일치 대신 수학적 특성에 기반하여 데이터 세트 내에서 유사한 항목을 식별하는 정교한 정보 검색 방법입니다. 특정 문자열 찾기에 의존하는 기존 키워드 검색과 달리 벡터 검색은 데이터의 근본적인 의미적 의미를 분석합니다. 이 기술은 컴퓨터가 추상적 개념 간의 관계를 이해하고 이미지, 오디오 파일, 자연어 텍스트와 같은 비정형 데이터를 놀라운 정확도로 처리할 수 있게 하므로 현대 인공지능(AI)응용 분야의 핵심입니다.

벡터 검색의 작동 방식

벡터 검색의 핵심은 원시 데이터를 임베딩(embedding)이라 불리는 고차원 수치 벡터로 변환하는 데 있습니다. 이 과정은 항목들을 다차원 공간 내의 점으로 매핑하며, 개념적으로 유사한 항목들은 서로 가까이 위치하게 됩니다.

  1. 벡터화: 딥 러닝(DL) 모델은 입력 데이터(예: 개의 이미지)를 처리하여 특징 벡터를 출력합니다. YOLO26과 같은 고급 모델은 이러한 풍부한 특징 표현을 효율적으로 생성하는 데 자주 사용됩니다.
  2. 색인화: 검색을 신속하게 수행하기 위해 이러한 벡터들은 특수한 알고리즘을 사용하여 구성되며, 종종 전용 벡터 데이터베이스에 저장됩니다.
  3. 유사도 계산: 사용자가 쿼리를 제출하면 시스템은 해당 쿼리를 벡터로 변환하고 저장된 벡터와의 거리를 코사인 유사도나 유클리드 거리 같은 측정법을 사용하여 측정합니다.
  4. 검색: 시스템은 "가장 가까운 이웃"을 반환하며, 이는 가장 문맥적으로 관련성이 높은 결과를 나타냅니다.

Python 예제: 임베딩 생성하기

벡터 검색을 구현하려면 먼저 데이터를 벡터로 변환해야 합니다. 다음 코드 조각은 생성하는 방법을 보여줍니다. 특징 맵 이미지에서 추출한 임베딩을 사용하여 ultralytics 패키지와 사전 훈련된 YOLO26 모델.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

실제 애플리케이션

벡터 검색은 오늘날 소프트웨어 생태계에서 직관적인 기능들을 가능케 하는 핵심 엔진으로, 컴퓨터 비전(CV) 과 사용자 의도 사이의 간극을 메워줍니다.

  • 시각적 추천 시스템: 소매업 AI 분야에서 벡터 검색은 "룩 쇼핑" 기능을 구현합니다. 고객이 특정 핸드백을 선호할 경우, 시스템은 유사한 시각적 벡터(형태, 질감, 스타일 일치)를 가진 상품을 찾아 맞춤형 추천 시스템을 구축합니다.
  • 검색 강화 생성(RAG): 대규모 언어 모델(LLM)의 성능을 향상시키기 위해 개발자들은 벡터 검색을 활용하여 지식 기반에서 관련 문서를 검색합니다. 이는 AI에 맥락을 제공하여 환각 현상을 줄이고 챗봇 상호작용의 정확도를 높입니다.
  • 이상 탐지: "정상" 작업의 벡터를 클러스터링함으로써 시스템은 클러스터에서 크게 벗어난 이상값을 식별할 수 있습니다. 이는 제조 품질 관리 및 데이터 보안 분야의 이상 탐지에 중요한 역할을 합니다.

관련 개념 구분하기

벡터 검색을 유사한 용어와 구분하여 이해하는 것은 전체 머신 러닝(ML) 파이프라인을 이해하는 데 도움이 됩니다.

  • 벡터 검색 대 의미적 검색: 의미적 검색은 사용자 의도(‘무엇’)를 이해하는 광범위한 응용 분야입니다. 벡터 검색은 이를 달성하기 위해 벡터 근접성(‘어떻게’)을 계산하는 특정 알고리즘적 방법입니다.
  • 벡터 검색 대 벡터 데이터베이스: 벡터 데이터베이스는 대규모 임베딩을 저장하고 관리하기 위해 설계된 인프라입니다. 벡터 검색은 해당 데이터베이스에 쿼리를 실행하여 정보를 검색하는 과정입니다.
  • 벡터 검색 vs. 키워드 검색: 키워드 검색은 정확한 텍스트 문자열을 일치시킵니다(예: "apple"은 "apple"과 일치). 벡터 검색은 의미를 일치시키므로, "apple"은 단어가 다르더라도 "fruit"이나 "red"와 일치할 수 있습니다.

Ultralytics 과의 통합

유사성 검색 시스템을 구축하는 팀에게 데이터셋 관리와 임베딩 모델 훈련은 핵심적인 첫 단계입니다. Ultralytics 데이터 관리, 클라우드 훈련, 모델 배포를 위한 도구를 제공하여 이 워크플로를 간소화합니다. 객체 탐지나 분류를 위한 기본 모델이 고성능을 보장함으로써, 결과 벡터가 정확하고 의미 있는 검색 결과를 제공하도록 합니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기