术语表

数据分析

了解数据分析如何通过优化数据质量、发掘洞察力和实现智能决策来推动人工智能和 ML 取得成功。

数据分析是一门分析原始数据以对信息做出结论的科学。它包括对数据进行检查、清理、转换和建模,以发现有用信息、提供结论和支持决策。在人工智能(AI)机器学习(ML)领域,数据分析是构建、训练和评估高性能模型的基础步骤。通过发现数据集中的模式、相关性和异常现象,分析师可以提供指导模型开发和确保其有效性所需的重要见解。

这一过程通常遵循一个生命周期,将原始数据转化为可操作的见解。这包括处理缺失值和不一致性的数据预处理、了解关键特征的探索性数据分析,以及应用统计技术测试假设。分析得出的见解对于特征工程、选择适当的模型架构和执行超参数调整等任务至关重要。数据分析通常有四种类型,每种类型都能提供不同程度的洞察力,从回顾过去到展望未来。正如哈佛商学院在线等资源所解释的,这些类型包括描述性分析、诊断性分析、预测性分析和规范性分析。

真实世界的人工智能/移动语言应用

数据分析有助于推动众多人工智能应用取得进展:

  1. 医学图像分析在人工智能模型检测医学扫描中的异常之前,需要广泛使用数据分析技术。对原始图像进行预处理(归一化、调整大小)和清理。探索性分析有助于了解数据集(如脑肿瘤数据集)中图像质量或患者人口统计学方面的差异。分析有助于确定相关特征,并根据专家注释评估诊断模型的性能(准确性、灵敏度、特异性),从而指导临床使用的改进。美国国立卫生研究院生物医学数据科学计划等资源凸显了其重要性。了解 YOLO 模型如何用于医学成像中的肿瘤检测
  2. 人工智能驱动的零售库存管理零售商利用数据分析来优化库存水平,减少浪费。这包括分析历史销售数据、识别季节性趋势、了解客户购买模式以建立预测模型。此外,计算机视觉(CV)系统由利用分析的视觉数据训练的模型驱动,可以实时监控货架库存。数据分析通过分析检测准确性以及将库存数据与销售结果联系起来,评估这些系统的有效性,从而实现更智能的补货策略。了解Google Cloud AI for Retail行业解决方案。Ultralytics 提供利用人工智能提高零售效率的见解。

与相关术语的区别

  • 数据可视化数据可视化是信息和数据的图形表示。它是数据分析的一个组成部分,用于通过图表、图形和地图交流研究结果或探索数据。分析包含数据检查的整个过程,而可视化则是用于使结果易于理解的特定工具。Tableau等工具在创建引人注目的可视化效果方面很受欢迎。
  • 数据挖掘这是在更广泛的数据分析领域中使用的一种特定技术。数据挖掘侧重于在大型数据集中发现以前未知的模式和趋势,通常使用复杂的算法。正如Oracle 所解释的,分析使用这些发现的模式来做出明智的决策和测试假设。
  • 机器学习机器学习是人工智能的一个子集,侧重于构建从数据中学习的系统。数据分析通常通过准备数据、识别特征和使用平均精度(mAP)等指标评估模型输出来ML 生命周期提供支持。分析为人类提供解读见解,而 ML 则利用这些见解使模型能够进行自主预测。

数据分析为构建、完善和验证从医疗保健农业制造业等不同领域的有效人工智能和 ML 系统提供了所需的重要见解。利用Ultralytics HUB等平台可以简化从数据分析到模型部署的流程。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板