术语表

数据分析

了解数据分析如何通过优化数据质量、发掘洞察力和实现智能决策来推动人工智能和 ML 取得成功。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

数据分析是对数据或统计数据进行系统的计算分析。它涉及对数据进行检查、清理、转换和建模,目的是发现有用的信息,为结论提供信息并支持决策。在人工智能(AI)和机器学习(ML)领域,数据分析对于准备数据集、了解数据特征、提取有意义的特征和评估模型性能是不可或缺的,最终将带来更强大、更可靠的人工智能系统。

数据分析与人工智能和机器学习的相关性

数据分析是人工智能和 ML 项目取得成功的基石。在训练像 Ultralytics YOLO等复杂模型之前,必须对原始数据进行严格的分析。这包括处理错误和不一致性的数据清理以及为算法适当格式化数据的数据预处理等基本步骤。探索性数据分析 (EDA) 等技术通常涉及数据可视化,有助于发现数据中的潜在结构、模式、异常值和潜在偏差。了解这些方面对于选择合适的模型和确保有效训练所需的数据质量至关重要。

此外,数据分析在模型训练后也发挥着重要作用。使用准确率平均精度(mAP)等指标评估模型性能,需要对照地面实况数据分析预测结果。这一分析过程有助于找出模型的弱点,了解错误类型,并通过超参数调整等技术指导进一步改进。

数据分析与相关概念

虽然数据分析经常被交替使用,但它与相关术语有着微妙的区别:

  • 数据挖掘:特别侧重于在大型数据集中发现以前未知的新模式和关系。它通常被认为是更广泛的数据分析领域中的一种特定技术,该领域还包括描述数据(描述性分析)和诊断过去的事件(诊断性分析)。您可以进一步探索数据挖掘的概念
  • 机器学习:涉及从数据中学习算法,无需明确编程即可做出预测或决策。机器学习通常是数据分析(特别是预测性和描述性分析)中使用的一种工具,但数据分析本身是一个涉及数据收集、清理、探索、可视化和解释的更广泛的过程,其中可能涉及也可能不涉及建立复杂的机器学习模型。了解有关机器学习 (ML) 的更多信息。

真实世界的人工智能/移动语言应用

数据分析推动了各种人工智能应用的重大进步:

  1. 医疗诊断:医疗图像分析中,数据分析用于检查大型医疗扫描数据集(如核磁共振成像或 CT,如脑肿瘤数据集),以识别可能预示疾病的微妙模式。在训练人工智能诊断模型之前,分析技术有助于了解不同患者群体的特征分布,确保数据集具有代表性并识别潜在的偏差。训练结束后,分析技术会评估模型的诊断准确性并识别错误类型,从而指导改进工作。美国国立卫生研究院生物医学数据科学等资源凸显了其重要性。
  2. 零售客户行为分析:零售商利用数据分析了解购买模式并优化运营。分析交易数据有助于建立向用户推荐产品的推荐系统。在实体店中,利用计算机视觉(CV)模型分析视频馈送,可以深入了解顾客流量和货架互动情况,帮助人工智能实现更智能的零售库存管理。分析有助于解读这些数据,从而优化店铺布局和产品摆放。公司利用Google 零售云人工智能等平台来实现这些目的。

工具和技术

数据分析师使用各种工具和技术。包括回归和时间序列分析在内的统计方法是基础。Python 等编程语言以及用于数据处理的Pandas和用于 ML 任务的Scikit-learn等库被广泛使用。TableauMicrosoft Power BI数据可视化工具对于交流研究结果至关重要。对于具体的 ML 性能洞察,Ultralytics HUB等平台可提供集成分析,详见Ultralytics 分析指南

阅读全部