了解人工智能模型的构件--标记如何为 NLP、计算机视觉以及情感分析和物体检测等任务提供支持。
在人工智能和机器学习领域,尤其是自然语言处理(NLP)领域,以及越来越多的计算机视觉领域,"标记 "代表了模型处理数据的最小单位。将标记视为人工智能模型用来理解和分析信息(无论是文本、图像还是其他形式的数据)的基本构件。
标记化是将原始数据分解成更小、更易消化的片段的过程。例如,在 NLP 中,文本被标记为单词、子单词单元甚至字符。这一过程将连续的文本转化为离散的单元,机器学习模型可以有效地处理这些单元。数据标记化的方式会极大地影响模型的性能和效率。
令牌至关重要,因为机器学习模型,尤其是深度学习模型(如Ultralytics YOLO 中使用的模型),无法直接处理原始的非结构化数据。它们要求数据采用数值或离散格式。标记化就像一座桥梁,将复杂的输入转换成算法可以理解和学习的格式。这种转换对于文本生成、情感分析和对象检测等任务至关重要。
代币在各种人工智能和 ML 任务中都有应用。下面是几个具体的例子:
自然语言处理(NLP):在 NLP 中,标记是语言模型的工作母机。例如,在进行情感分析时,像 "这部电影太棒了!"这样的句子可能会被标记为["这部"、"电影"、"是"、"太棒了"、"!"]。然后,每个标记都会被转换成数字表示(如词嵌入),模型利用这些数字表示来理解情感。GPT-4和GPT-3等大型语言模型在处理和生成文本时严重依赖于标记。提示链和提示调整等技术都是围绕操作和优化标记序列来设计的,以实现这些模型的预期输出。
计算机视觉:虽然传统上与 NLP 相关联,但在现代计算机视觉模型中,特别是随着视觉转换器(ViT)的兴起,标记的重要性与日俱增。在像Segment Anything Model (SAM) 这样的模型中,图像通常被分解成片段,这些片段可被视为视觉标记。这些视觉标记随后由变换器网络进行处理,利用注意力机制来理解图像不同部分之间的关系,从而完成图像分割和物体检测等任务。即使在物体检测模型中,如 Ultralytics YOLOv8等物体检测模型中,虽然没有像 ViTs 那样明确使用 "视觉标记",但将图像分解成网格并处理每个网格单元的概念可视为一种隐式标记化,其中每个网格单元都成为一个分析单位。
了解标记是掌握人工智能模型如何处理信息的基础。随着人工智能的不断发展,令牌和令牌化的概念很可能会成为处理各种数据类型和建立更复杂、更高效模型的核心。