自动化机器学习(AutoML)是指将开发机器学习(ML)模型所涉及的耗时、迭代任务自动化的过程。其目的是让非该领域专家(如数据科学家)更容易掌握 ML 技术,并加快经验丰富的从业人员的开发进程。AutoML 工具和平台可将 ML 管道的各个阶段自动化,使用户只需最少的人工干预即可构建高质量的模型。
AutoML 中的关键自动任务
AutoML 系统通常会自动执行机器学习工作流程中的几个关键步骤:
- 数据预处理:处理缺失值、缩放特征并对训练数据进行必要的转换。这可确保数据适合模型训练。归一化等技术通常是自动化的。
- 特征工程:自动从现有特征中创建新特征,或选择最相关的特征来提高模型性能。这可能涉及特征工程概念中涵盖的技术。
- 模型选择:选择最佳算法(如决策树、神经网络等 Ultralytics YOLO或支持向量机)。AutoML 平台通常会探索各种对象检测架构或分类模型。
- 超参数调整:优化所选模型的配置设置(超参数),以实现最佳性能。这是一个关键步骤,详见超参数调整指南。
AutoML 的优势
使用 AutoML 有几个优点:
- 提高效率:自动执行重复性任务,大大减少开发和部署 ML 模型所需的时间。
- 更易于使用:让领域专家和缺乏 ML 专业知识的开发人员也能利用强大的建模技术。
- 增强性能:与人工方法相比,可以探索更广泛的模型和超参数,从而建立更准确、更稳健的模型。Ultralytics HUB等平台简化了训练过程,从而提高了效率。
- 减少偏差:自动化可帮助减少人工智能模型选择和调整过程中的人为偏差,但仍需谨慎监督。
实际应用
AutoML 广泛应用于各行各业:
- 欺诈检测:金融机构利用 AutoML 快速建立和更新模型,通过自动测试交易数据的不同算法和特征来检测欺诈交易。与人工建模相比,这能更快地提高检测率并适应新的欺诈模式。
- 医学图像分析:在医疗保健领域,AutoML 协助开发用于医疗图像分析等任务的模型,例如识别 X 射线或核磁共振成像中的肿瘤或异常。AutoML 可以优化复杂的深度学习模型,以实现高准确性。
AutoML 工具和平台
一些工具和平台提供了 AutoML 功能:
AutoML 与 MLOps
AutoML 专注于模型构建流程(选择、训练、调整)的自动化,而机器学习运营 (MLOps)则涵盖了 ML 模型的整个生命周期,包括部署、监控、管理和治理。AutoML 可被视为更广泛的 MLOps 战略中的一个组成部分,可在移交给部署和模型监控管道之前简化初始模型创建阶段。