용어집

지식 그래프

지식 그래프가 어떻게 복잡한 관계를 모델링하고 시맨틱 검색, 개인화된 추천 등을 가능하게 하여 AI에 혁신을 가져오는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

지식 그래프는 사람, 장소 또는 개념과 같은 실제 실체를 연결하고 이들 사이의 관계를 설명하여 정보를 정리합니다. 점으로 개체를 나타내고 선으로 개체의 관계를 나타내는 지식의 네트워크 또는 지도라고 생각하면 됩니다. 이러한 구조화된 접근 방식을 통해 특히 머신러닝(ML)인공지능(AI) 시스템은 단순히 원시 텍스트나 사일로화된 데이터베이스를 검색하는 것보다 더 지능적으로 문맥을 이해하고 추론을 도출하며 정보에 액세스할 수 있습니다.

핵심 개념

지식 그래프는 노드(엔티티 또는 개념을 나타내는)와 에지(이러한 노드 간의 관계를 나타내는)를 사용하여 구축됩니다. 예를 들어, 한 노드는Ultralytics YOLO'이고 다른 노드는 '개체 감지'일 수 있으며, 이 두 노드는 '유형은'이라는 레이블이 붙은 에지로 연결됩니다. 이 구조는 복잡한 쿼리와 추론 기능을 허용하여 시스템이 기존 데이터에서 새로운 사실을 추론할 수 있게 해줍니다. 리소스 설명 프레임워크(RDF) 와 같은 기술은 데이터 교환을 위한 표준 모델을 제공하며, SPARQL과 같은 쿼리 언어는 사용자가 이러한 관계를 기반으로 정보를 검색할 수 있게 해줍니다. KG를 구축하려면 정형 데이터베이스와 비정형 텍스트를 포함한 다양한 소스에서 정보를 추출해야 하며, 때로는 자연어 처리(NLP) 기술을 사용하거나 복잡한 추론 시스템이 필요할 수도 있습니다.

지식 그래프와 다른 개념 비교

다른 데이터 구조와 관련이 있지만 지식 그래프에는 뚜렷한 특징이 있습니다:

  • 데이터베이스: 기존의 관계형 데이터베이스는 미리 정의된 스키마가 있는 테이블에 데이터를 저장하며, 구조화된 레코드의 효율적인 저장과 검색에 중점을 둡니다. KG는 복잡하고 종종 이질적인 관계를 표현하고 새로운 지식을 추론하는 데 탁월하지만, 표준 데이터베이스에서는 쉽지 않습니다.
  • 온톨로지: 온톨로지는 도메인에 대한 어휘와 규칙(스키마)을 정의하여 엔티티와 관계의 유형을 지정합니다. 지식 그래프는 종종 이러한 규칙에 따라 특정 사실을 나타내는 온톨로지의 인스턴스입니다. 웹 온톨로지 언어(OWL) 는 온톨로지를 정의하기 위한 공통 표준입니다.
  • 벡터 데이터베이스: 데이터를 고차원 벡터(임베딩)로 저장하여 의미적 유사성을 포착합니다. 유사한 항목을 찾는 데는 탁월하지만 KG처럼 관계를 명시적으로 정의하지는 않습니다. KG는 명시적이고 사실적인 연결을 저장합니다.

AI/ML 분야 애플리케이션

지식 그래프는 많은 지능형 애플리케이션을 지원합니다:

  • 향상된 검색 결과: Google 같은 검색 엔진은 검색어를 의미론적으로 이해하고 정보 패널에서 직접 답변, 요약, 관련 엔터티를 제공하기 위해 Google 지식 그래프와 같은 KG를 사용하여 단순한 키워드 매칭을 넘어 더 나은 시맨틱 검색을 가능하게 합니다.
  • 추천 시스템: 플랫폼은 KG를 사용하여 사용자, 제품, 콘텐츠, 그리고 그 속성(예: 장르, 배우, 감독) 간의 관계를 모델링합니다. 이를 통해 발견된 관계를 기반으로 보다 미묘한 추천이 가능해져 패션 리테일의 AI와 같은 분야에서 사용자 경험을 개선할 수 있습니다.
  • 컨텍스트 AI: 컴퓨터 비전(CV)에서 특정 건물과 같은 물체를 감지하는 것은 Ultralytics YOLO 모델과 같은 YOLOv8 과 같은 울트라트래틱스 YOLO 모델을 사용하여 특정 물체를 감지하면 KG 쿼리를 트리거하여 그 역사, 건축가 또는 영업 시간을 검색하여 애플리케이션의 이해를 강화할 수 있습니다. 이러한 컨텍스트 데이터는 Ultralytics 허브와 같은 플랫폼 내에서 관리 및 활용될 수 있습니다. 또한 KG는 구조화된 배경 지식을 제공함으로써 질문 답변 시스템을 향상시킵니다.
  • 약물 발견: KG는 다양한 생물학적 데이터(유전자, 단백질, 질병, 약물)를 통합하여 연구자들이 잠재적인 약물 표적과 상호 작용을 식별할 수 있도록 지원함으로써 의료 분야의 AI 솔루션을 가속화합니다.

지식 그래프 구축 및 사용

KG를 생성하고 유지 관리하려면 자동화된 추출 기술, 수동 큐레이션 또는 이 두 가지를 조합하여 사용할 수 있습니다. DBpedia (Wikipedia에서 파생) 및 Wikidata와 같은 오픈 소스 지식 그래프는 방대한 양의 구조화된 데이터를 제공합니다. Neo4j와 같은 전문화된 그래프 데이터베이스 기술은 그래프 데이터를 효율적으로 저장하고 쿼리하도록 설계되었습니다. 엔티티 인식 및 관계 추출과 같은 작업에서 텍스트 또는 다양한 컴퓨터 비전 데이터 세트에서 파생된 시각적 데이터로부터 자동으로 KG를 채우기 위해 ML 모델이 점점 더 많이 사용되고 있습니다.

모두 보기