术语表

神经架构搜索(NAS)

了解神经架构搜索 (NAS) 如何自动进行神经网络设计,以优化物体检测、人工智能等方面的性能。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

神经架构搜索(NAS)是机器学习(ML)领域中的一种自动化技术,专注于设计神经网络(NN)的最佳结构或架构。NAS 不依赖人类专家通过试验和错误来手动设计网络布局,而是采用算法来探索广阔的可能架构空间,并为给定任务和数据集找出最有效的架构。这种自动化加速了开发过程,并能发现新颖、高性能的架构,而这些架构对于人类设计师来说可能并不直观,同时还能优化准确性、速度(推理延迟)或计算效率等指标。

神经架构搜索如何工作

NAS 的基本流程包括三个主要部分:搜索空间、搜索策略和性能评估策略。搜索空间定义了可以设计的一系列可能的网络架构,基本上概括了构建模块(如不同类型的卷积激活函数)及其连接方式。搜索策略指导对这一空间的探索,使用的方法包括随机搜索、强化学习进化算法。最后,性能评估策略是对候选架构的性能进行评估,通常包括在数据集上对网络进行部分或全部训练,并测量其性能,不过也会使用权重共享或性能预测器等技术来加快这一过程, Google 人工智能的研究对此进行了详细说明。

NAS 的主要优势

利用 NAS 实现架构设计自动化具有显著优势:

  • 减少人工工作量:它减少了架构设计对深度学习专家和大量实验的依赖。
  • 优化性能:NAS 可以发现针对特定任务(如物体检测图像分类)或硬件限制(如移动设备或边缘人工智能平台)量身定制的架构,其性能往往超过人类设计的同类产品。您可以探索针对不同任务优化的各种Ultralytics 模型
  • 加速开发:通过将耗时的关键阶段自动化,NAS 可以加快整个 ML 模型开发生命周期。
  • 新颖的架构:它能发现非常规但高效的网络结构,推动深度学习研究的发展。

人工智能和机器学习的应用

1.优化的物体检测模型

一个突出的例子是Deci AI 公司利用 NAS 技术开发的YOLO。该模型专门针对Ultralytics YOLO 先前版本中的局限性,通过 NAS 技术整合了量化友好的区块。这使得模型在准确性和延迟之间实现了出色的平衡,从而使其在汽车解决方案和智能交通管理中的人工智能等实时应用中非常有效,甚至在将模型量化为 INT8 等格式以实现高效部署之后也是如此。有关量化技术的更多信息,请参阅NVIDIA TensorRT 文档等资源。

2.医学图像分析

在医疗保健领域,NAS 被用来设计用于分析医疗图像的定制卷积神经网络(CNN)。例如,NAS 可以针对磁共振成像扫描中的肿瘤检测或 CT 图像中的器官分割等任务优化架构,从而为临床医生提供更快、更准确的诊断工具。正如美国国立卫生研究院(NIH)等机构所强调的那样,人工智能在医学图像分析中的应用是一个快速发展的领域。使用Ultralytics HUB 等平台可以简化对此类专业模型和数据集的管理。

NAS 和相关概念

NAS 是自动机器学习(AutoML)这一更广泛领域中的一个特定组件。NAS 专注于寻找最佳神经网络架构,而 AutoML 则旨在自动化整个 ML 管道,包括数据预处理特征工程、模型选择和超参数调整等步骤。区分 NAS 和超参数调优至关重要:超参数调优是针对给定的固定模型架构优化配置设置(如学习率批量大小),而 NAS 则是搜索架构本身。这两种技术通常一起使用,以达到最佳模型性能。OptunaRay Tune等工具是超参数优化的常用工具。

阅读全部