용어집

네임드 엔티티 인식(NER)

명명된 개체 인식(NER)으로 인사이트를 확보하세요. AI가 어떻게 비정형 텍스트를 다양한 애플리케이션을 위한 실행 가능한 데이터로 변환하는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

명명된 개체 인식(NER)은 자연어 처리(NLP) 의 기본 작업이자 최신 인공 지능(AI)의 핵심 구성 요소입니다. 여기에는 비정형 텍스트 내에서 '명명된 개체'라고 하는 특정 정보를 자동으로 식별하고 분류하는 작업이 포함됩니다. 이러한 엔티티는 일반적으로 사람, 조직, 위치, 날짜, 제품 이름, 금전적 가치 등과 같은 실제 개체를 나타냅니다. NER의 주요 목표는 원시 텍스트를 구조화된 데이터로 변환하여 기계가 다양한 AI 사용 사례를 위한 가치 있는 인사이트를 쉽게 이해하고, 처리하고, 추출할 수 있도록 하는 것입니다.

네임드 엔티티 인식의 작동 방식

NER 시스템은 텍스트의 언어 구조와 문맥을 분석하여 개체를 찾고 분류합니다. 초기 시스템은 문법 규칙과 사전( 기호적 AI의 한 형태)에 크게 의존했지만, 최신 접근 방식은 머신 러닝(ML), 특히 딥 러닝(DL)을 활용합니다. 트랜스포머와 같은 모델은 다음과 같은 플랫폼에서 흔히 볼 수 있습니다. Hugging Face와 같은 플랫폼에서 흔히 볼 수 있는 트랜스포머와 같은 모델은 문맥과 미묘한 언어 패턴을 이해하는 데 탁월하여 정확도를 높입니다. 이 프로세스에는 일반적으로 토큰화와 관련된 기술을 사용하여 잠재적 엔티티(단어 또는 구문)를 식별한 다음 미리 정의된 범주(예: 사람, 조직, 위치, 날짜, 오타)로 분류하는 작업이 포함됩니다. 이 분류는 대규모 데이터 세트에 대한 학습 중에 학습된 특징에 의존하며, 종종 NER 작업을 위해 특별히 주석을 달기도 합니다.

예를 들어, "7월 4일에 사라 존스는 에펠탑을 방문했다."라는 문장에서 NER 시스템은 에펠탑이 Acme Corp의 대표임을 식별할 수 있습니다:

  • "7월 4일"을 날짜로 사용
  • "사라 존스" 개인
  • 위치로 "에펠탑"
  • 조직으로서의 "Acme Corp"

이 구조화된 출력물은 원본 텍스트만 사용하는 것보다 데이터 분석이나 지식 그래프 채우기와 같은 다운스트림 작업에 훨씬 더 유용합니다. 더 깊은 기술적 인사이트를 얻으려면 NER 기술에 대한 설문조사를 살펴보세요.

관련성 및 응용 분야

NER은 텍스트 정보를 구조화하여 다양한 영역에 걸쳐 수많은 애플리케이션을 가능하게 하는 초석 기술입니다:

  • 정보 추출: 뉴스 기사, 보고서 또는 이메일과 같은 문서에서 주요 세부 정보를 자동으로 추출합니다. 예를 들어, 금융 뉴스 피드에서 회사 이름, 임원 직함, 위치를 추출할 수 있습니다.
  • 콘텐츠 분류 및 추천: 조직 및 파워 추천 시스템을 개선하기 위해 관련 엔터티로 문서 또는 게시물에 태그를 지정합니다.
  • 고객 지원: 고객 피드백이나 지원 티켓을 분석하여 언급된 제품, 위치 또는 특정 문제를 식별하여 더 빠르게 라우팅하고 해결할 수 있습니다. '아이폰 16'과 '뉴욕 스토어'가 언급된 지원 이메일에 자동으로 태그를 지정하는 시스템을 상상해 보세요.
  • 헬스케어: 임상 기록에서 환자 이름, 진단명, 약물, 복용량을 추출하여 의료 기록 관리를 간소화하고 보고서와 결합하면 의료 이미지 분석과 같은 분야에 기여할 수 있습니다.
  • 시맨틱 검색: 검색 엔진이 검색어 내의 개체를 인식하여 검색어의 의미를 이해하도록 개선하는 것입니다(예: '루브르 박물관 근처 레스토랑'을 검색하려면 '루브르'를 LOCATION으로 식별해야 함). Google Cloud 자연어 AI와 같은 도구는 NER 기능을 제공합니다.
  • 재무 분석: 시장 분석 및 예측 모델링을 위해 재무 보고서에서 회사 이름, 화폐 가치, 날짜를 추출합니다.
  • 규정 준수 및 보안: 문서에서 이름이나 주소와 같은 민감한 정보를 식별하여 데이터 프라이버시를 보장하고 GDPR과 같은 규정을 준수합니다.

데이터 주석모델 배포를 포함한 NER 모델의 ML 수명 주기를 관리하는 것은 Ultralytics HUB와 같은 플랫폼을 통해 용이하게 할 수 있습니다.

관련 개념과의 주요 차이점

NER은 다른 NLP 작업과 함께 사용되는 경우가 많지만 그 초점이 뚜렷합니다:

  • 감정 분석: 텍스트에 표현된 감정 어조(긍정, 부정, 중립)를 결정합니다. NER은 논의 중인 내용을 식별하는 반면, 감성 분석은 작성자가 이에 대해 어떻게 느끼는지 파악합니다.
  • 텍스트 요약: 핵심 정보를 보존하면서 더 짧은 버전의 텍스트를 만드는 것을 목표로 합니다. NER은 전체 텍스트의 요약된 개요가 아니라 특정 엔티티 멘션을 추출합니다.
  • 객체 감지: 경계 상자를 사용하여 이미지 내에서 객체를 식별하고 위치를 파악하는 컴퓨터 비전(CV) 작업입니다. NER은 다음과 같은 시각적 데이터가 아닌 텍스트 데이터로만 작동합니다. Ultralytics YOLO 모델처럼 시각적 데이터가 아닌 텍스트 데이터로만 작동합니다.
  • 자연어 이해(NLU): 의도 인식, 관계 추출, 핵심 참조 해결 등 텍스트 의미에 대한 전반적인 이해를 포괄하는 광범위한 분야입니다. NER은 엔티티 식별 및 분류에만 초점을 맞춘 NLU 내의 특정 하위 작업입니다.
  • 키워드 추출: 텍스트에서 중요한 용어나 구문을 식별하며, 이 용어나 구문은 명명된 엔티티일 수도 있고 아닐 수도 있습니다. NER은 특히 사람, 장소, 조직과 같은 사전 정의된 카테고리를 찾습니다.

이러한 차이점을 이해하는 것은 컴퓨터 비전 프로젝트의 단계와 같은 가이드에 설명된 대로 주어진 문제에 적합한 NLP 기술을 선택하는 데 매우 중요합니다(CV에 중점을 두지만 원칙은 동일하게 적용됨).

모두 보기