용어집

네임드 엔티티 인식(NER)

명명된 개체 인식(NER)으로 인사이트를 확보하세요. AI가 어떻게 비정형 텍스트를 다양한 애플리케이션을 위한 실행 가능한 데이터로 변환하는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

명명된 개체 인식(NER)은 자연어 처리(NLP) 의 기본 작업이자 최신 인공 지능(AI)의 핵심 구성 요소입니다. 여기에는 비정형 텍스트 내에서 '명명된 개체'라고 하는 특정 정보를 자동으로 식별하고 분류하는 작업이 포함됩니다. 이러한 엔티티는 일반적으로 사람, 조직, 위치, 날짜, 제품 이름, 금전적 가치 등과 같은 실제 개체를 나타냅니다. NER의 주요 목표는 원시 텍스트를 구조화된 데이터로 변환하여 기계가 더 쉽게 이해하고, 처리하고, 가치 있는 인사이트를 추출할 수 있도록 하는 것입니다.

네임드 엔티티 인식의 작동 방식

NER 시스템은 텍스트의 언어 구조와 문맥을 분석하여 개체를 찾고 분류합니다. 초기 시스템은 문법 규칙과 사전에 크게 의존했지만, 최신 접근 방식은 머신 러닝(ML), 특히 딥 러닝(DL)을 활용합니다. 트랜스포머와 같은 모델은 문맥과 미묘한 언어 패턴을 이해하는 데 탁월하여 정확도를 높입니다. 이 프로세스에는 일반적으로 잠재적인 개체(단어 또는 구문)를 식별한 다음 이를 미리 정의된 범주(예: 사람, 조직, 위치)로 분류하는 작업이 포함됩니다.

예를 들어 "순다르 피차이가 마운틴뷰에서 열린 행사에서 Google 최신 AI 모델을 발표했다"라는 문장에서 NER 시스템은 "순다르 피차이"를 개인으로,Google"을 조직으로, "마운틴뷰"를 위치로 식별할 수 있습니다. 이렇게 구조화된 출력은 원본 텍스트만 사용하는 것보다 다운스트림 작업에 훨씬 더 유용합니다.

관련성 및 응용 분야

NER은 텍스트 정보를 구조화하여 다양한 영역에 걸쳐 수많은 애플리케이션을 가능하게 하는 초석 기술입니다:

  • 정보 추출: 시스템은 뉴스 기사나 연구 논문과 같은 대량의 문서를 스캔하여 핵심 개체를 추출할 수 있으므로 정보 검색과 분석이 빨라집니다. 예를 들어, 재무 분석가는 수익 보고서에서 회사 이름과 금전적 가치를 추출하기 위해 NER을 사용할 수 있습니다. NER 기법에 대한 설문조사를 읽어보세요.
  • 고객 지원 자동화: 챗봇과 지원 시스템은 NER을 사용하여 고객 문의에 언급된 제품 이름, 사용자 ID 또는 문제 유형과 같은 중요한 세부 정보를 식별하여 효율적인 라우팅 및 응답 생성을 가능하게 합니다. Google Cloud 자연어 AI의 예를 살펴보세요.
  • 콘텐츠 추천: 플랫폼은 기사나 동영상에 언급된 개체(예: 사람, 주제, 위치)를 식별하여 사용자에게 더 관련성 높은 콘텐츠를 추천할 수 있습니다.
  • 의료 정보학: NER은 임상 노트에서 환자 이름, 질병, 약물, 증상 등의 정보를 추출하여 의료 기록 관리 및 연구를 지원하는 데 필수적입니다. 발견한 결과를 텍스트 보고서와 연관시켜 의료 이미지 분석과 같은 작업을 지원할 수 있습니다.
  • 시맨틱 검색: 쿼리 내의 엔터티를 이해하여 검색 엔진의 기능을 향상시켜 보다 정확하고 맥락에 맞는 결과를 도출합니다.

관련 개념과의 주요 차이점

NER은 다른 NLP 작업과 함께 사용되는 경우가 많지만 그 초점이 뚜렷합니다:

  • 감정 분석: 특정 개체를 식별하는 것이 아니라 텍스트에 표현된 감정 어조(긍정, 부정, 중립)를 결정합니다. NER은 감정이 무엇 (예: 제품)에 관한 것인지 식별할 수 있지만, 감성 분석은 사용자가 그것에 대해 어떻게 느끼는지 식별합니다.
  • 텍스트 요약: 긴 텍스트의 짧고 간결한 버전을 만드는 것을 목표로 하며, 핵심 정보를 보존하지만 반드시 모든 명명된 엔티티를 분류하는 데 초점을 맞추지는 않습니다.
  • 객체 감지: 이미지 또는 동영상 내에서 객체를 식별하고 위치를 파악하는 컴퓨터 비전(CV) 작업입니다. NER은 텍스트 데이터만 처리합니다. 그러나 NER은 이미지에서 추출한 텍스트 분석과 같은 멀티모달 애플리케이션에서 CV를 보완할 수 있습니다.
  • 자연어 이해(NLU): 기계가 텍스트의 의미를 이해할 수 있도록 하는 데 중점을 둔 광범위한 분야입니다. NER은 NLU의 기본 하위 작업으로 간주됩니다.

기술 및 도구

여러 라이브러리와 플랫폼이 NER 구현을 용이하게 합니다:

  • spaCyNLTK와 같은 오픈 소스 라이브러리는 강력한 NER 기능을 제공합니다.
  • Hugging Face 는 NER 작업에 맞게 미세 조정된 사전 학습된 방대한 Transformer 모델 컬렉션에 액세스할 수 있습니다.
  • Ultralytics HUB와 같은 플랫폼은 모델 학습 및 배포를 포함한 AI 프로젝트 관리를 위한 도구를 제공합니다. 주로 다음과 같은 비전 모델에 초점을 맞추고 있지만 Ultralytics YOLO와 같은 비전 모델에 중점을 두고 있지만, 이 플랫폼은 특히 시각 데이터와 텍스트 데이터를 모두 분석하는 시스템에서 NER과 같은 NLP 작업을 통합하는 더 큰 파이프라인의 일부가 될 수 있습니다. 모델 관리 및 배포에 대한 자세한 내용은 Ultralytics 설명서를 참조하세요.
모두 보기