용어집

벡터 데이터베이스

벡터 데이터베이스가 고차원 임베딩을 관리하여 의미적 검색을 수행하는 방식을 알아보세요. Ultralytics 유사도 검색으로 AI 애플리케이션을 강화하는 방법을 익히세요.

벡터 데이터베이스는 고차원 벡터 데이터(흔히 임베딩이라고 함)를 관리, 색인화 및 쿼리하기 위해 설계된 특수 저장 시스템입니다. 정확한 키워드 매칭을 위해 구조화된 데이터를 행과 열로 구성하는 전통적인 관계형 데이터베이스와 달리, 벡터 데이터베이스는 의미적 검색에 최적화되어 있습니다. 이는 지능형 시스템이 동일한 데이터 포인트가 아닌 개념적으로 유사한 데이터 포인트를 찾을 수 있도록 합니다. 이 기능은 현대 인공지능(AI) 인프라의 핵심으로, 애플리케이션이 이미지, 오디오, 비디오, 텍스트와 같은 비정형 데이터를분석하여 수학적 관계를 이해하고 처리할 수 있게 합니다. 이러한 데이터베이스는 지능형 에이전트의 장기 기억 역할을 수행하며, 시각적 검색 및 맞춤형 추천과 같은 작업을 지원합니다.

벡터 데이터베이스 작동 원리

벡터 데이터베이스의 기능은 벡터 공간 개념을 중심으로 하며, 여기서 데이터 항목은 다차원 좌표계 상의 점으로 매핑됩니다. 이 과정은 특징 추출로 시작되며, 여기서 딥러닝(DL) 모델이 원시 입력을 수치 벡터로 변환합니다.

섭취: 데이터는 최첨단 YOLO26과 같은 신경망에 의해 처리되어 임베딩을 생성합니다. 이러한 벡터는 입력의 의미적 의미를 부동 소수점 숫자의 밀집된 목록으로 압축합니다.
색인화: 검색 시 낮은 추론 지연 시간을 보장하기 위해 데이터베이스는 특수 알고리즘을 사용하여 이러한 벡터를 구성합니다. 계층적 탐색 가능 소규모 세계(HNSW) 또는 역파일 색인(IVF) 과 같은 기법을 통해 시스템은 모든 항목을 일일이 스캔하지 않고도 수십억 개의 벡터를 효율적으로 탐색할 수 있습니다.
쿼리 처리: 사용자가 검색 쿼리(예: 특정 신발 스타일의 이미지)를 제출하면 시스템은 해당 쿼리를 벡터로 변환하고 코사인 유사도나 유클리드 거리 같은 거리 측정법을 사용하여 저장된 벡터와의 근접성을 계산합니다.
검색: 데이터베이스는 "가장 가까운 이웃"을 반환하며, 이는 가장 문맥적으로 관련성이 높은 결과를 나타냅니다.

다음 Python 표준을 사용하여 임베딩을 생성하는 방법을 보여줍니다. ultralytics 모델, 이는 벡터 데이터베이스를 채우기 전에 필요한 선행 단계입니다.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image file
# The 'embed' method creates the vector representation needed for the database
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Output the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

실제 애플리케이션

벡터 데이터베이스는 오늘날 기업 환경에서 사용되는 많은 고급 컴퓨터 비전(CV) 및 자연어 처리(NLP)애플리케이션의 핵심 엔진입니다.

검색 강화 생성(RAG): 생성형 AI 시대에 벡터 데이터베이스는 대규모 언어 모델(LLM) 이 방대한 사적 최신 데이터 라이브러리에 접근할 수 있게 합니다. 사용자의 프롬프트 의미론적 의미를 기반으로 관련 문서를 검색함으로써 시스템은 LLM의 환각 현상을 줄이고 사실에 기반한 맥락 인식 응답을 제공합니다.
시각적 추천 엔진: 소매업 AI 분야에서 플랫폼은 벡터 데이터베이스를 활용해 "비슷한 스타일 쇼핑" 기능을 구현합니다. 사용자가 특정 여름 드레스를 조회하면 시스템은 데이터베이스에 질의하여 패턴, 실루엣, 색상이 유사한 시각적 임베딩을 가진 다른 상품 이미지를 찾아냅니다. 이는 단순한 태그 기반 필터링보다 우수한 사용자 경험을 제공합니다.
이상 및 위협 탐지: 보안 시스템은 벡터 데이터베이스를 활용하여 이상 탐지를 수행합니다. "정상" 행동 또는 승인된 인원의 임베딩을 저장함으로써, 시스템은 벡터 공간에서 예상 클러스터 범위를 벗어난 이상값을 즉시 식별하여 데이터 보안 및 시설 모니터링을 강화합니다.

벡터 데이터베이스

산업 전반의 워크플로우를 간소화하기 위한 Ultralytics YOLO 모델 교육

혁신을 강화하는 유연한 엔터프라이즈 라이선스 솔루션

Ultralytics YOLO 몇 초 만에 AI 모델 훈련하기

벡터 데이터베이스 작동 원리

실제 애플리케이션

관련 개념 차별화

최신 AI 워크플로와 통합

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

단안 깊이 추정이란 무엇인가? 개요

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 커뮤니티 가입