术语表

机器翻译

了解机器翻译如何利用人工智能和深度学习打破语言障碍,实现全球无缝沟通和无障碍访问。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

机器翻译(MT)是人工智能(AI)自然语言处理(NLP)的一个子领域,侧重于将文本或语音从一种自然语言自动翻译成另一种自然语言。它利用计算语言学和机器学习(ML)算法,在没有人工干预的情况下弥合不同语言之间的交流鸿沟。其目标不仅仅是逐字替换,而是用目标语言准确流畅地传达源文本的含义和意图。这项技术已经变得越来越复杂,从早期的基于规则的系统发展到复杂的深度学习(DL)模型。

机器翻译如何工作

早期的 MT 系统依赖于大量语法规则和双语词典。后来,出现了统计机器翻译(SMT),从大型平行语料库(与译文配对的文本)中学习翻译模式。不过,目前最先进的是神经机器翻译(NMT)。NMT 使用人工神经网络 (NN)来学习语言之间的映射。

NMT 模型,尤其是那些基于序列到序列模型的模型,通常采用递归神经网络(RNN)等架构,特别是LSTMGRU,或者现在更常见的Transformer 架构。变形器利用自我注意机制(Attention Is All You Need 论文),在生成输出序列中的每个单词时,权衡输入序列中不同单词的重要性,从而更有效地捕捉长距离依赖关系。训练这些模型需要大量的并行文本数据和大量的计算资源,通常利用GPUTPU进行高效的分布式训练。关键框架如 PyTorchTensorFlow等关键框架被广泛用于开发 NMT 系统。

关键概念和技术

有几个概念是现代 MT 的核心:

  • 标记化:将输入文本分解为更小的单位(单词、子单词或字符),称为标记,供模型处理。(进一步了解标记化)。
  • 嵌入:将词组表示为密集的数字向量,从而捕捉语义,使模型能够理解词与词之间的关系。(探索嵌入)。
  • 注意力机制:让模型在生成输出时专注于输入序列的相关部分,这对处理长句和提高翻译质量至关重要。(了解注意力机制)。
  • BLEU 分数:通过将机器生成的译文与一个或多个人类参考译文进行比较来评估 MT 质量的常用指标(Papineni 等,2002 年)。
  • 波束搜索:推理过程中使用的一种算法,用于生成多个潜在候选翻译,并选择最有可能的一个,从而提高流畅性,而不是简单地在每一步中选择最有可能的下一个单词。

与相关术语的区别

虽然与其他 NLP 任务相关,但 MT 有其特定的重点:

  • 自然语言处理(NLP):更广泛的领域,包括 MT、文本摘要情感分析问题解答等。MT 是 NLP一种应用。
  • 自然语言理解(NLU):侧重于文本意义的机器理解,包括意图识别和实体提取。虽然自然语言理解能力增强了 MT 的功能,但自然语言理解本身是关于理解,而不一定是翻译。(参见 NLU 术语表条目)。
  • 语音识别:将口语音频转换为文本。该文本可用作 MT 系统的输入。(见语音识别词汇条目)。
  • 文本到语音(TTS):将文本输出(可能来自 MT 系统)转换为合成语音。(见文本到语音词汇条目)。
  • 语言建模:预测序列中下一个单词的任务,是包括 NMT 在内的许多 NLP 任务的基础,但不是翻译本身。(探索语言建模)。

实际应用

机器翻译为众多应用提供了动力:

  • 即时通信: Google 翻译DeepL Translator等服务可让用户实时翻译网页、文件和信息,从而打破全球语言障碍。
  • 内容本地化:企业使用 MT 翻译产品说明、用户手册、营销活动和网站,以比人工翻译更高效的方式进入国际市场。
  • 多语言客户支持:将 MT 整合到聊天机器人和客户服务平台中,使公司能够提供多语言支持。
  • 信息获取:翻译研究论文、新闻报道(路透社使用 MT)和书籍可跨越语言鸿沟获取信息。
  • 实时翻译应用程序:集成到通信应用程序或专用设备中的工具可为旅行者和国际合作提供近乎实时的翻译(Skype Translator)。

尽管取得了重大进展,但挑战依然存在,如处理细微差别、成语、文化背景、低资源语言,以及减少从数据中学到的算法偏差。未来的工作重点是提高语境意识、处理歧义、实现更高的流畅度,以及将 MT 与计算机视觉等其他模态整合到多模态模型中。Ultralytics HUB等平台有助于训练部署复杂的人工智能模型,未来可能包括定制的 MT 解决方案。

阅读全部