了解无监督学习如何利用聚类、降维和异常检测来发现数据中隐藏的模式。
无监督学习是机器学习(ML)的一种,算法从无标签数据中学习模式。有监督学习依赖于预定义的标签或 "正确答案",而无监督学习则不同,它是在没有事先指导的情况下,通过探索数据的内在结构来发现隐藏的关系、分组或异常。在人工智能(AI)中,这种方法尤其适用于初始数据探索和理解复杂的数据集,因为在这些数据集上贴标签是不切实际或不可能的。它允许模型直接从数据中发现模式和见解。
无监督学习的主要目标是对数据的基本结构或分布进行建模,从而了解更多信息。算法可以自行发现数据的相似性、差异性和结构。常见的技术包括
在现实世界的各种场景中,尤其是在处理大量无标记数据时,都会用到无监督学习技术:
无监督学习在理解大数据特有的大量原始、无标记数据方面发挥着至关重要的作用。它通常是数据预处理和特征工程的重要步骤,有助于在应用其他 ML 技术之前发现隐藏结构或降低数据复杂性。虽然像Ultralytics YOLO 这样的模型主要是使用监督方法对物体检测等任务进行训练,但通过无监督方法了解数据结构可以极大地帮助数据集的准备和分析,从而潜在地提高模型性能。您可以探索用于准备数据集的数据收集和注释指南,并使用Ultralytics HUB 等平台管理您的数据和模型。
必须将无监督学习与相关的深度学习(DL)和 ML 范式区分开来:
无监督学习仍是人工智能的一个基本领域,它能在标签稀缺或不可用的复杂数据集中推动发现和理解。