术语表

数据可视化

利用强大的可视化技术和工具,将复杂的 AI/ML 数据转化为可操作的见解。了解更多信息,请访问Ultralytics !

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

数据可视化是将复杂信息和原始数据转化为图表、图形和地图等可视化环境的做法。这使人脑更容易理解底层数据,有助于提取有意义的见解。在人工智能(AI)和机器学习(ML)领域,数据可视化对于探索数据集、理解模型在训练过程中的行为、评估性能以及有效交流研究结果至关重要。它将可能令人难以承受的数字数据转化为直观的可视化表示,突出显示原始数据或文本报告中可能被掩盖的模式、趋势、异常和关系。

核心概念与技术

数据可视化的主要目的是清晰地展示数据并促进理解。这可以通过各种图形方法来实现,包括

  • 条形图:比较不同类别的数量。
  • 折线图:显示时间或连续间隔的趋势。
  • 散点图:揭示两个数字变量之间的关系和相关性。
  • 热图显示矩阵数据,通过颜色强度描述数值,常用于相关矩阵或神经网络激活的可视化。请参阅Ultralytics 热图指南
  • 直方图显示单一数值变量的分布。
  • 箱形图:通过四分位数总结数据分布。

选择正确的可视化技术在很大程度上取决于数据类型和您想要表达的具体见解。有效的可视化还需要仔细考虑调色板、缩放比例、坐标轴和标签等设计元素,以确保在不误导观众的情况下准确呈现。MatplotlibSeaborn等流行的Python 库为创建数据科学中常用的各种静态、动画和交互式可视化提供了强大的工具。遵守可视化展示的基本原则是讲述有影响力的数据故事的关键。

人工智能和机器学习的重要性

数据可视化在整个人工智能/人工智能项目生命周期中都不可或缺:

真实世界的人工智能/移动语言应用

  1. 医学图像分析:在医疗人工智能领域,可视化有助于解释复杂的医学扫描。在脑肿瘤数据集等数据集上训练的物体检测模型可以输出边界框,识别潜在的异常。将这些方框直接叠加到核磁共振或 CT 扫描图像上进行可视化,可让放射科医生快速评估模型的发现,从而帮助诊断。此外,根据成像特征可视化患者结果集群有助于识别疾病亚型。医疗保健领域的人工智能在很大程度上依赖于此类可视化辅助工具。您可以在美国国家生物医学成像和生物工程研究所(NIBIB)探索更多应用。
  2. 自动驾驶汽车开发:自动驾驶汽车系统处理大量传感器数据。可视化技术在开发和测试过程中得到广泛应用。工程师在三维模拟环境中对激光雷达点云、雷达信号和摄像头馈送进行可视化。检测到的物体(汽车、行人、骑车人)由以下模型识别 YOLO等模型识别出的物体(汽车、行人、骑车人)通常会以边界框、跟踪路径和置信度分数显示出来,让开发人员能够在各种场景中验证感知系统的准确性和安全性。查看人工智能汽车解决方案中的示例,了解Mobileye 等公司的行业方法。

与相关术语的区别

  • 数据分析:这是一个更广泛的领域,涉及检查、清理、转换和建模数据以发现有用信息和支持决策的整个过程。数据可视化是数据分析的一个组成部分工具,用于展示研究结果或探索数据,但分析还包括统计建模、假设检验和其他非可视化方法。了解有关数据分析基础的更多信息。
  • 图像处理:该领域侧重于处理数字图像,以增强图像效果或直接从像素数据中提取信息(如过滤、边缘检测、对比度调整)。虽然可视化可能涉及显示图像,但人工智能/人工智能领域的数据可视化通常是将抽象数据(如模型性能指标或特征关系)或模型解释(如检测)叠加到图像上,而不是转换图像本身。请阅读这篇《计算机视觉与图像处理》博文,了解两者的区别。
  • 探索性数据分析(EDA):EDA 是分析数据集以了解其主要特征的过程,通常使用可视化方法。数据可视化技术是 EDA 期间使用的主要工具,用于发现模式、异常、测试假设和检查假设。注释数据预处理指南涉及与计算机视觉数据集相关的 EDA 概念。
阅读全部