探索在YOLO Vision 2024 上展示的 Lightning AI 如何通过更快的模型训练、部署和协作来简化可扩展的视觉 AI 开发。
无论您是经验丰富的人工智能开发人员,还是刚刚开始探索视觉人工智能,拥有一个可靠的环境都是玩转和实验计算机视觉模型(如UltralytricsYOLO11)的关键。环境指的是高效设计、测试和部署人工智能模型所需的工具、资源和基础设施。
虽然有多个在线平台提供不同的人工智能工具,但许多平台并没有为从数据准备到模型部署的整个人工智能生命周期提供统一的环境。这时,Lightning AI(人工智能开发的一体化平台)就可以介入,简化从数据准备到部署的流程。
YOLO Vision 2024 (YV24)展示了让人工智能开发变得更容易的现实意义,YV24 是由Ultralytics 主办的年度混合活动,重点关注人工智能和计算机视觉领域的进展。Lightning AI首席技术官Luca Antiga发表了题为"GoingYOLO on Lightning Studios"的主题演讲,详细介绍了如何利用Lightning AI快速、顺利地训练Ultralytics YOLO 模型,而无需涉足复杂的技术问题。
在本文中,我们将深入探讨卢卡演讲的主要内容,包括从真实世界的计算机视觉应用到使用 Lightning AI 训练和部署Ultralytics YOLO 模型的现场演示。让我们开始吧!
Luca 在主题发言中首先分享了他对YOLO 模型在各行各业的影响的看法和赞赏。他强调了YOLO 模型如何应用于制造业和农业等行业。他说:"我很欣赏YOLO 对建设者社区的影响--他们需要解决实际、实用的问题--这与我非常接近。
他将这一点与对人工智能培训日益增长的兴趣联系起来,介绍了 Lightning AI,这是一个旨在让人工智能模型开发更快、更简单、更易于为每个人所用的平台。它尤其适用于支持人工智能的迭代进步,帮助开发人员完善和改进模型。
他还指出,Lightning AI 类似于PyTorch Lightning,后者是一个简化人工智能模型训练过程的框架。但不同之处在于,Lightning AI 是一个更全面的平台,为整个人工智能开发过程提供了更广泛的工具和功能,而不仅仅是训练人工智能模型。
Lightning Studios是Lightning AI的重要组成部分,它为设计、训练和部署人工智能模型提供了一个直观的工作空间,使整个工作流程无缝高效。你可以把Lightning Studios看作是在云上运行的可复制的人工智能开发环境。例如,它提供了一个类似于 Jupyter Notebook 的环境,可以复制并与其他开发人员共享,有助于改善协作。
Luca 接着阐述了 Lightning Studios 的优势,他说:"复制环境不再是问题。如果你需要从CPU [中央处理器] 机器换到GPU [图形处理器] 机器,或者在上千台机器上开展培训,你的环境将是持久的。"
接下来,Luca 演示了如何快速上手 Lightning Studios。只需点击几下,您就可以打开一个新的工作室,访问 Jupyter Notebooks 和VS Code 等工具和环境,所有设置都已准备就绪,随时可以进行编码。他展示了在不同机器之间切换的便捷性。如果您正在执行的任务需要更强大的功能,您可以轻松地从CPU 切换到功能更强大的GPU 。只有在使用过程中,GPU 才会保持激活状态;否则,它将进入睡眠模式,为您节省功耗。
卢卡还提到了使用工作室模板的好处。它们是社区预制的人工智能编码环境,您可以使用它们,而无需进行任何设置。为人工智能项目设置环境可能很费时间,而 Studio Templates 可以帮助提高工作效率。这些环境预装了人工智能项目所需的一切,如已安装的依赖项、模型权重、数据、代码等。
随后,卢卡开始了现场演示,重点介绍了如何使用 Lightning Studio 训练Ultralytics YOLO 模型。他打开了一个Studio模板,该模板已经安装了所有的依赖项,并启动了一台带有四个GPU的机器,以加快训练过程。关于数据,他说您可以选择将数据直接存储在机器上,也可以从云端流式传输数据,从而使训练过程更快、更高效。
几秒钟后,机器就准备就绪,卢卡迅速启动了培训课程。在演示过程中,一个小问题导致机器意外停止,但闪电工作室无缝地从中断处恢复,确保不会丢失任何进度。卢卡指出,即使面对意外中断,这种可靠性也能支持流畅的工作流程。
接着,他演示了如何使用TensorBoard(一种实时可视化机器学习指标的工具)轻松监控训练进度。Lightning Studio可以自动生成URL,让您或同一工作区的队友无需任何额外设置即可访问TensorBoard视图,从而让这一切变得更加简单。这样可以简化协作,让每个人都站在同一起跑线上。
演示结束后,卢卡把话题转移到了闪电人工智能公司最近推出的一个新项目--LitServe。LitServe 简化了将训练有素的模型转化为可供他人使用的可扩展服务的过程,消除了对复杂部署管道的需求。它旨在以最小的工作量处理从打包模型到部署模型的所有工作。
为了实时展示这一点,卢卡用一个预先训练好的 Ultralytics YOLOv8模型进行了快速演示。他能够创建一个简单的应用程序接口来处理传入的请求,并在几秒钟内返回图像预测结果。这意味着,任何人都可以通过图像向该应用程序接口发送请求,几乎在瞬间就能获得计算机视觉任务(如物体检测)的结果。在幕后,Ultralytics YOLOv8 模型作为一项服务部署,高效地处理请求、处理图像,并以最小的延迟提供预测结果。
他对一张披萨图片进行了推理,Ultralytics YOLOv8 ,成功识别出披萨、勺子和餐桌等物体。他解释说,虽然第一次请求由于 "冷启动 "而耗时稍长,但系统一旦热起来,随后的请求就会快得多。
卢卡接着问:"如果我想向外界公开这些信息呢?他简要介绍了 API Builder 插件是如何将您的模型简单转化为实时、生产就绪的服务的。通过自定义域、增加安全性和无缝集成等功能,您可以轻松地让任何人都能访问您的模型。
最后,Luca谈到了Lightning Studio在人工智能开发方面的可扩展性和灵活性。他提到了该平台如何通过容错训练在多台机器上训练模型,最多可扩展到 10,000 个节点,并在中断后自动恢复。
例如,如果GPU 集群上的训练作业因硬件问题或服务器重启而中断,Lightning Studios 可确保进程从中断的位置恢复。这使它成为大规模人工智能项目的理想选择,例如在 ImageNet 或COCO 等海量数据集上训练深度学习模型。
以下是卢卡谈到的闪电工作室的其他一些主要优势:
卢卡在 YV24 上的主题演讲强调了人工智能如何与Ultralytics YOLO 模型和 Lightning AI 等工具相结合,改变我们解决现实世界问题的方式。它们使开发人员更容易训练和部署模型,这些模型是为解决各行各业的具体问题而设计的。
他介绍了Lightning Studios如何使整个开发过程更快、更方便,让开发人员轻松创建强大的解决方案。作为Lightning AI等尖端平台的核心,计算机视觉模型正在改变人工智能解决方案应对挑战的方式。特别是利用最新的Ultralytics YOLO11 模型,开发人员可以构建具有重大影响的解决方案。
加入我们的社区,了解人工智能及其实际应用的最新进展。查看我们的 GitHub 存储库,探索自动驾驶汽车中的人工智能和医疗保健中的计算机视觉等领域的创新。