了解神经架构搜索 (NAS) 如何自动进行神经网络设计,以优化物体检测、人工智能等方面的性能。
神经架构搜索(NAS)是机器学习(ML)领域中的一种自动化技术,专注于设计神经网络(NN)的最佳结构或架构。NAS 不依赖人类专家通过试验和错误来手动设计网络布局,而是采用算法来探索广阔的可能架构空间,并为给定任务和数据集找出最有效的架构。这种自动化加速了开发过程,并能发现新颖、高性能的架构,而这些架构对于人类设计师来说可能并不直观,同时还能优化准确性、速度(推理延迟)或计算效率等指标。
NAS 的基本流程包括三个主要部分:搜索空间、搜索策略和性能评估策略。搜索空间定义了可以设计的一系列可能的网络架构,基本上概括了构建模块(如不同类型的卷积或激活函数)及其连接方式。搜索策略指导对这一空间的探索,使用的方法包括随机搜索、强化学习和进化算法。最后,性能评估策略是对候选架构的性能进行评估,通常包括在数据集上对网络进行部分或全部训练,并测量其性能,不过也会使用权重共享或性能预测器等技术来加快这一过程, Google 人工智能的研究对此进行了详细说明。
利用 NAS 实现架构设计自动化具有显著优势:
一个突出的例子是Deci AI 公司利用 NAS 技术开发的YOLO。该模型专门针对Ultralytics YOLO 先前版本中的局限性,通过 NAS 技术整合了量化友好的区块。这使得模型在准确性和延迟之间实现了出色的平衡,从而使其在汽车解决方案和智能交通管理中的人工智能等实时应用中非常有效,甚至在将模型量化为 INT8 等格式以实现高效部署之后也是如此。有关量化技术的更多信息,请参阅NVIDIA TensorRT 文档等资源。
在医疗保健领域,NAS 被用来设计用于分析医疗图像的定制卷积神经网络(CNN)。例如,NAS 可以针对磁共振成像扫描中的肿瘤检测或 CT 图像中的器官分割等任务优化架构,从而为临床医生提供更快、更准确的诊断工具。正如美国国立卫生研究院(NIH)等机构所强调的那样,人工智能在医学图像分析中的应用是一个快速发展的领域。使用Ultralytics HUB 等平台可以简化对此类专业模型和数据集的管理。