术语表

无监督学习

了解无监督学习如何利用聚类、降维和异常检测来发现数据中隐藏的模式。

无监督学习是机器学习（ML）中的一种基本范式，即在未经标记、分类或归类的数据上训练算法。与其他方法不同，该系统试图直接从数据本身学习模式和结构，而不需要任何相应的输出标签。其主要目标是探索数据并找到有意义的结构或模式，因此成为人工智能（AI）领域数据探索和分析的重要工具。

核心无监督学习任务

无监督学习算法通常用于探索性数据分析，可分为几个主要任务：

聚类：这是最常见的无监督学习任务，涉及根据数据点的相似性将数据点分组成簇。其目的是使单个聚类中的数据点彼此高度相似，而与其他聚类中的数据点不相似。流行的算法包括K-Means 聚类和DBSCAN。
降维：这种技术用于减少数据集中输入变量的数量。它在处理高维数据时非常有用，因为它可以简化模型，减少计算时间，并有助于数据可视化。主成分分析法（PCA）是一种广泛应用的方法。
关联规则挖掘：这种方法可以发现大型数据库中变量之间有趣的关系或关联规则。一个典型的例子是 "市场篮子分析"，它能发现商店里经常一起购买的商品之间的关系。

实际应用

无监督学习推动了许多行业的创新。下面是几个具体的例子：

客户细分：零售和电子商务公司使用聚类算法将具有相似行为和偏好的客户分组。通过分析购买历史、浏览活动和人口统计数据，企业可以创建有针对性的营销活动，提供个性化推荐，改善客户体验，最终促进零售业的人工智能发展。
异常检测：在网络安全领域，无监督学习模型可以识别可能预示着安全漏洞的异常网络流量。同样，在制造业中，这些算法可以通过识别与标准的偏差来检测装配线上产品的缺陷，这是现代质量检测的关键组成部分。

与其他学习范式的比较

无监督学习与其他 ML 方法有很大不同：

监督学习：依靠标记数据（输入-输出对）来训练分类或回归等任务的模型。目标是将输入映射到已知输出。你可以在监督学习和非监督学习的比较中找到更多细节。
强化学习：是指代理通过在环境中执行行动来学习决策，从而最大限度地提高累积奖励。它在反馈信号（奖励或惩罚）的引导下，通过试错进行学习。请参阅深度强化学习概述。
半监督学习：结合使用少量标记数据和大量非标记数据，在有监督学习和无监督学习之间架起一座桥梁。
自我监督学习（Self-Supervised Learning）：无监督学习的一个子集，标签由输入数据本身自动生成，通常用于预训练大型模型，如自然语言处理（NLP）或计算机视觉（CV）中的模型。

无监督学习是探索数据、发现隐藏结构和提取有价值特征的强大工具。它通常是复杂数据科学管道中关键的第一步，例如在将数据输入有监督模型之前进行数据预处理。Ultralytics HUB等平台提供了开发和管理各种 ML 模型的环境，其中可能包含用于分析数据集的无监督技术。PyTorch和TensorFlow等框架提供了大量支持无监督算法实施的库，您还可以利用Scikit-learn 的无监督学习指南等资源探索更多内容。

无监督学习

灵活的企业许可解决方案为您的创新提供动力

使用 Ultralytics YOLO 在数秒内训练人工智能模型

使用 Ultralytics HUB 简单训练 YOLO 模型

核心无监督学习任务

实际应用

与其他学习范式的比较

在此类别中阅读更多内容

了解快速成型制造：技术和使用案例

使用 Ultralytics YOLO 监测机场地面运行11

机器人技术在制造业中的发展与未来

加入 Ultralytics 社区