용어집

기계 번역

기계 번역이 AI와 딥러닝을 사용하여 언어 장벽을 허물고 원활한 글로벌 커뮤니케이션과 접근성을 지원하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

기계 번역(MT)은 한 자연어에서 다른 자연어로 텍스트나 음성을 자동으로 번역하는 데 중점을 둔 인공 지능(AI)자연어 처리(NLP) 의 하위 분야입니다. 컴퓨터 언어학 및 기계 학습(ML) 알고리즘을 활용하여 사람의 개입 없이 서로 다른 언어 간의 커뮤니케이션 격차를 해소합니다. 단순히 단어 대 단어로 대체하는 것이 아니라 소스 텍스트의 의미와 의도를 대상 언어로 정확하고 유창하게 전달하는 것이 목표입니다. 이 기술은 초기 규칙 기반 시스템에서 복잡한 딥러닝(DL) 모델로 발전하면서 점점 더 정교해지고 있습니다.

기계 번역의 작동 방식

초기 MT 시스템은 광범위한 문법 규칙 세트와 이중 언어 사전에 의존했습니다. 이후 대규모 병렬 말뭉치(번역과 쌍을 이루는 텍스트)에서 번역 패턴을 학습하는 통계적 기계 번역(SMT)이 등장했습니다. 그러나 현재 가장 최신의 기술은 신경망 기계 번역(NMT)입니다. NMT는 인공 신경망(NN) 을 사용하여 언어 간의 매핑을 학습합니다.

NMT 모델, 특히 시퀀스 간 모델에 기반한 모델은 순환 신경망(RNN), 특히 LSTM 또는 GRU와 같은 아키텍처를 사용하거나 지금은 트랜스포머 아키텍처를 사용하는 경우가 많습니다. 트랜스포머는 출력 시퀀스에서 각 단어를 생성할 때 입력 시퀀스에서 여러 단어의 중요도를 평가하는 자체 주의 메커니즘(Attention Is All You Need 논문)을 활용하여 장거리 종속성을 보다 효과적으로 포착합니다. 이러한 모델을 훈련하려면 방대한 양의 병렬 텍스트 데이터와 상당한 컴퓨팅 리소스가 필요하며, 효율적인 분산 훈련을 위해 GPU 또는 TPU를 활용하는 경우가 많습니다. 다음과 같은 주요 프레임워크 PyTorchTensorFlow 과 같은 주요 프레임워크가 NMT 시스템 개발에 널리 사용됩니다.

주요 개념 및 기술

현대 MT의 중심에는 몇 가지 개념이 있습니다:

  • 토큰화: 입력 텍스트를 토큰이라는 작은 단위(단어, 하위 단어 또는 문자)로 분해하여 모델이 처리할 수 있도록 합니다.(토큰화에 대해 자세히 알아보기).
  • 임베딩: 토큰을 의미적 의미를 포착하는 조밀한 숫자 벡터로 표현하여 모델이 단어 간의 관계를 이해할 수 있도록 합니다.(임베딩 살펴보기).
  • 주의 메커니즘: 모델이 출력을 생성할 때 입력 시퀀스의 관련 부분에 집중할 수 있도록 하여 긴 문장을 처리하고 번역 품질을 개선하는 데 중요한 역할을 합니다.(주의 메커니즘 이해하기).
  • BLEU 점수: 기계 생성 번역을 하나 이상의 인간 참조 번역과 비교하여 MT 품질을 평가하는 일반적인 지표입니다(Papineni et al., 2002).
  • 빔 검색: 추론 중에 여러 개의 잠재적 번역 후보를 생성하고 가장 가능성이 높은 후보를 선택하는 데 사용되는 알고리즘으로, 각 단계에서 단순히 가장 가능성이 높은 다음 단어를 선택하는 것보다 유창성을 향상시킵니다.

관련 용어와의 차이점

다른 NLP 작업과 관련이 있지만 MT에는 특정한 초점이 있습니다:

  • 자연어 처리(NLP): MT, 텍스트 요약, 감정 분석, 질문 답변 등을 포괄하는 광범위한 분야입니다. MT는 NLP 내의 하나의 애플리케이션입니다.
  • 자연어 이해(NLU): 의도 인식 및 엔티티 추출을 포함하여 텍스트 의미의 기계 이해에 중점을 둡니다. NLU 기능은 MT를 향상시키지만, NLU 자체는 번역이 아닌 이해에 관한 것입니다.(NLU 용어집 항목 참조).
  • 음성 인식: 음성 오디오를 텍스트로 변환합니다. 그러면 이 텍스트를 MT 시스템의 입력으로 사용할 수 있습니다.(음성 인식 용어집 항목 참조).
  • 텍스트 음성 변환(TTS): 텍스트 출력(MT 시스템의 경우)을 합성된 음성으로 변환합니다.(텍스트 음성 변환 용어집 항목 참조).
  • 언어 모델링: 시퀀스에서 다음 단어를 예측하는 작업으로, NMT를 비롯한 많은 NLP 작업의 기본이지만 번역 자체는 아닙니다.(언어 모델링 살펴보기).

실제 애플리케이션

기계 번역은 수많은 애플리케이션을 지원합니다:

  • 즉각적인 커뮤니케이션: Google 번역DeepL 번역기와 같은 서비스를 통해 사용자는 웹 페이지, 문서, 메시지를 실시간으로 번역하여 전 세계의 언어 장벽을 허물 수 있습니다.
  • 콘텐츠 로컬라이제이션: 기업들은 제품 설명, 사용자 설명서, 마케팅 캠페인, 웹사이트를 번역할 때 MT를 사용하여 수동 번역만 하는 것보다 더 효율적으로 해외 시장에 진출할 수 있으며, 종종 MT를 1차로 사용한 후 사람이 검토(편집 후 MT)합니다.
  • 다국어 고객 지원: MT를 챗봇 및 고객 서비스 플랫폼에 통합하면 기업은 여러 언어로 지원을 제공할 수 있습니다.
  • 정보 접근: 연구 논문, 뉴스 기사(로이터에서는 MT를 사용), 서적 번역을 통해 언어적 장벽을 넘어 정보에 접근할 수 있습니다.
  • 실시간 번역 앱: 커뮤니케이션 앱 또는 전용 디바이스에 통합된 도구는 여행자와 국제 공동 작업을 위해 실시간에 가까운 번역을 제공합니다(Skype 번역기).

상당한 진전에도 불구하고 뉘앙스, 관용구, 문화적 맥락, 자원이 부족한 언어 처리, 데이터에서 학습된 알고리즘 편향성 완화 등의 과제가 남아 있습니다. 향후 작업은 문맥 인식 개선, 모호성 처리, 더 높은 유창성 달성, 다중 모달 모델에서 컴퓨터 비전과 같은 다른 양식과 MT를 통합하는 데 초점을 맞추고 있습니다. Ultralytics HUB와 같은 플랫폼은 향후 맞춤형 MT 솔루션을 포함한 정교한 AI 모델의 훈련과 배포를 용이하게 합니다.

모두 보기