术语表

注意机制

探索注意力机制如何通过增强 NLP 和计算机视觉任务（如翻译、物体检测等）来彻底改变人工智能！

注意力机制是神经网络中模拟人类认知注意力的一种技术。它允许模型在产生输出时动态地关注输入数据中最相关的部分。模型不会对输入数据的所有部分一视同仁，而是学会给每个部分分配不同的 "注意力 "分数，从而放大重要信息的影响，减弱无关数据的影响。从自然语言处理 (NLP)到计算机视觉 (CV )，这种能力在提高各领域模型的性能方面发挥了重要作用。

注意力如何发挥作用

注意力机制的核心是为输入计算一组注意力权重。这些权重决定了模型对输入序列或图像中每个元素的关注程度。例如，在翻译一个长句时，模型需要关注特定的源词，以便在翻译中生成正确的下一个词。在没有注意力机制之前，传统的递归神经网络（RNN）等模型在处理长序列时很吃力，经常会 "遗忘 "输入的早期部分--这就是所谓的梯度消失问题。注意力克服了这一问题，它提供了与输入所有部分的直接连接，允许模型根据需要回看序列的任何部分，而不管其长度如何。这种处理长程依赖关系的能力是一项重大突破，在著名的论文"注意力就是你所需要的一切 "中进行了详细阐述。

关注与自我关注

虽然两者经常交替使用，但重要的是要区分一般注意机制和自我注意。

注意力通常涉及两个不同的序列。例如，在机器翻译中，注意力映射源句和目标句之间的关系。
自我关注 "以单个序列为基础，允许模型权衡同一序列中不同单词或元素的重要性。这有助于模型理解上下文、语法和关系，例如识别句子中的 "它 "是指前面提到的特定名词。自我关注是Transformer 架构的基础模块。

实际应用

注意力机制是众多现代人工智能应用不可或缺的一部分：

机器翻译：在谷歌翻译等服务中，注意力可以帮助模型在生成目标语言中的每个单词时，将注意力集中在相关的源词上。这大大提高了翻译质量和流畅性，捕捉到了之前丢失的细微差别。
物体检测与计算机视觉： Ultralytics YOLO11等模型可以利用注意力机制，将计算资源集中在图像中的重要区域。这样既能提高检测精度，又能保持实时推理所需的效率。这对于自动驾驶汽车和机器人的应用至关重要。
文本摘要：注意力可帮助识别长篇文档中的关键句子或短语，从而生成简明摘要，SummarizeBot 等工具就利用了这一功能。
图像标题： 斯坦福大学的研究表明，在生成描述性文字说明时，模型会学习将注意力集中在图像中的突出物体或区域上。
医学图像分析：注意力可以突出医疗扫描中的关键区域（如核磁共振成像中的肿瘤），以便进行诊断或分析，从而为放射科医生提供帮助。您可以探索公共医疗成像数据集中的示例。

Ultralytics HUB等平台允许用户训练、验证和部署高级模型，包括包含注意力机制的模型。此类模型通常利用Hugging Face等平台上提供的预训练模型权重，并使用PyTorch和TensorFlow 等强大的框架构建。注意力的发展突破了机器学习的极限，使其成为DeepMind 等机构现代人工智能研发的基石。

注意机制

灵活的企业许可解决方案为您的创新提供动力

使用 Ultralytics YOLO 在数秒内训练人工智能模型

使用 Ultralytics HUB 简单训练 YOLO 模型

注意力如何发挥作用

关注与自我关注

实际应用

在此类别中阅读更多内容

探索 OpenAI 的 GPT-5：智能统一系统

谷歌 AlphaEarth 利用观测数据绘制全球地图

FastVLM：苹果公司推出新的快速视觉语言模型

加入 Ultralytics 社区