용어집

지식 그래프

지식 그래프가 어떻게 복잡한 관계를 모델링하고 시맨틱 검색, 개인화된 추천 등을 가능하게 하여 AI에 혁신을 가져오는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

지식 그래프는 사람, 장소, 조직 또는 개념과 같은 실제 실체를 연결하고 이들 사이의 관계를 설명하여 정보를 정리합니다. 지식 그래프는 점으로 개체를 나타내고 선으로 연결하여 개체의 관계를 나타내는 지능형 지식 지도와 같은 기능을 합니다. 이러한 구조화된 접근 방식은 인공지능(AI)머신러닝(ML) 시스템에 매우 중요하며, 구조화되지 않은 텍스트나 고립된 데이터베이스를 통해 검색하는 것보다 맥락을 이해하고 추론을 도출하며 정보에 더 효과적으로 액세스할 수 있게 해줍니다. KG는 많은 고급 AI 애플리케이션의 시맨틱 백본을 제공합니다.

핵심 개념

지식 그래프는 노드(엔티티 또는 개념을 나타내는)와 에지(이러한 노드를 연결하는 관계 또는 술어를 나타내는)로 구성됩니다. 예를 들어, 노드는Ultralytics YOLO'이고 다른 노드는'객체 감지'일 수 있으며, 'is a type'이라는 레이블이 붙은 에지가 이 두 노드를 연결할 수 있습니다. 이러한 구조를 통해 복잡한 관계를 쿼리하고 기존에 연결된 데이터에서 새로운 사실을 추론하는 등의 추론 작업을 수행할 수 있습니다. 핵심 기술: RDF(Resource Description Framework) 와 같은 표준은 데이터 표현을 위한 공통 모델을 제공하며, SPARQL과 같은 쿼리 언어는 그래프 패턴에 기반한 정보 검색을 가능하게 합니다. KG를 구축하려면 데이터베이스와 같은 정형 데이터와 비정형 텍스트를 포함한 다양한 소스에서 정보를 추출해야 하며, 자연어 처리(NLP) 기술과 잠재적으로 복잡한 추론 시스템을 활용하는 경우가 많습니다. 데이터 품질과 데이터 거버넌스는 신뢰할 수 있는 KG를 유지하는 데 매우 중요합니다.

지식 그래프와 다른 개념 비교

다른 데이터 정리 방법과 관련이 있지만 지식 그래프에는 고유한 특징이 있습니다:

  • 온톨로지: 온톨로지는 특정 도메인 내의 엔티티의 유형, 속성, 상호 관계를 공식적으로 정의합니다(스키마 또는 청사진). KG는 종종 온톨로지를 구조적 기초로 사용하지만 실제 인스턴스 데이터(특정 사실과 개체)도 포함합니다. 온톨로지를 정의하기 위해 웹 온톨로지 언어(OWL) 와 같은 언어가 사용됩니다.
  • 분류학: 분류학은 계층적 분류 체계(예: 왕국, 문, 문에 따라 동물을 분류하는 것)입니다. KG는 보다 유연하여 엄격하게 계층적이지 않은 복잡한 다중 관계형 네트워크를 나타냅니다.
  • 벡터 데이터베이스: 이러한 데이터베이스는 유사성 검색(벡터 검색)에 최적화된 숫자 임베딩으로 데이터를 저장합니다. 반대로 KG는 엔티티 간의 명시적이고 상징적인 관계를 나타냅니다. 두 데이터베이스는 서로 다르지만 상호 보완적일 수 있으며, KG는 벡터 검색을 통해 검색된 정보에 대한 구조화된 컨텍스트를 제공할 수 있습니다.

AI/ML 분야 애플리케이션

지식 그래프는 수많은 지능형 애플리케이션에 필수적인 요소입니다:

  • 시맨틱 검색: Google 같은 검색 엔진은 KG(예: Google 지식 그래프)를 사용하여 쿼리의 의도를 파악하고 단순한 키워드 매칭을 넘어 보다 관련성이 높고 문맥에 맞는 결과를 제공합니다.
  • 추천 시스템: KG는 사용자, 상품, 상품 속성 간의 관계를 모델링함으로써 이커머스(리테일 분야의 AI) 및 콘텐츠 스트리밍과 같은 영역에서 보다 정교하고 개인화된 추천을 가능하게 합니다.
  • 질문 답변챗봇: KG는 AI 시스템이 엔티티 관계를 탐색하여 복잡한 질문에 답할 수 있는 구조화된 지식을 제공하여 대화형 AI 기능을 향상시킵니다.
  • 데이터 통합: KG는 서로 다른 소스의 데이터를 통합하여 조직 전체에서 일관되고 상호 연결된 정보 보기를 만들 수 있습니다. 이는 빅 데이터 분석에 필수적인 요소입니다.
  • 다른 AI 모델 강화하기: KG는 다른 AI 작업에 맥락적 배경 지식을 제공할 수 있습니다. 예를 들어, 컴퓨터 비전(CV)에서 KG는 다음과 같은 모델에서 감지된 객체를 연결할 수 있습니다. Ultralytics YOLOv8 과 같은 모델이 감지한 오브젝트를 속성, 기능 또는 상호 작용에 대한 관련 정보와 연결하여 장면을 더욱 풍부하게 이해할 수 있습니다. Ultralytics HUB와 같은 플랫폼은 잠재적으로 KG를 채우거나 활용할 수 있는 데이터 세트와 모델을 관리합니다.

실제 사례

  1. 이커머스 개인화: 온라인 리테일러는 고객, 제품, 브랜드, 카테고리, 조회 기록, 구매 데이터, 제품 리뷰를 연결하는 지식 그래프를 사용합니다. 예를 들어 사용자가 '운동화'를 검색하면 KG는 시스템이 관련 개념(예: '마라톤', '트레일 러닝', 특정 브랜드)과 사용자 선호도(과거 구매, 조회한 항목)를 이해하여 고도로 개인화된 검색 결과와 의류나 액세서리와 같은 보완적인 제품을 추천할 수 있도록 도와줍니다. 이를 통해 고객 경험이 향상됩니다.
  2. 의료 분야의 AI 솔루션: 의료 연구 기관은 질병, 증상, 유전자, 단백질, 약물, 임상 시험, 연구 출판물(PubMed에 색인된 것과 같은)을 연결하는 지식 그래프를 구축합니다. 이를 통해 연구자와 임상의는 "단백질 X를 표적으로 하고 Y 질병 치료에 사용되는 약물 찾기"와 같은 복잡한 관계를 쿼리하여 약물 발견을 가속화하고 상호 연결된 증상 및 환자 데이터를 기반으로 진단을 위한 의사 결정 지원을 제공하여 의료 이미지 분석을 잠재적으로 개선할 수 있습니다.
모두 보기