术语表

PyTorch

了解 PyTorch,这是一个灵活的 Python 机器学习框架,为 Ultralytics YOLO 等人工智能创新提供动力。今天就开始更智能、更快速地构建!

PyTorch 是一个强大的开源机器学习(ML)框架,基于 Torch 库,广泛应用于计算机视觉(CV)自然语言处理(NLP)等应用。它由Meta AI开发,现在由独立的PyTorch 基金会管理,因其简单、灵活和 Python 优先的设计而闻名。这使它成为研究人员和开发人员快速原型开发和构建复杂神经网络架构的最爱。该框架的核心是围绕Tensors 构建的,Tensors 是一种多维数组,类似于NumPy数组,但能在GPU上运行以加速计算。

PyTorch 的主要功能

PyTorch 的设计理念将用户体验和速度放在首位,因此具有多项突出功能:

  • 动态计算图:与需要预先定义静态图的框架不同,PyTorch 采用 "边运行边定义 "的方法。这种动态计算图(也称为急迫执行)允许开发人员在运行时检查和更改计算图,因此更具灵活性,调试也更容易。这对于具有可变结构的模型尤其有用,例如递归神经网络(RNN)
  • Pythonic 集成:它与 Python 数据科学堆栈无缝集成,使开发人员使用起来更加直观。有了Ultralytics 快速入门指南PyTorch 官方安装说明,上手非常容易。
  • 丰富的工具生态系统:PyTorch 由一套特定领域的库提供支持,如用于计算机视觉的TorchVision、用于 NLP 的 TorchText 和用于音频处理的 TorchAudio,这些库提供了流行的架构、数据集和转换。
  • 无缝过渡到生产:借助用于创建可序列化和可优化模型的 TorchScript 和用于提供面向性能的模型服务的TorchServe等工具,PyTorch 在研究与生产之间架起了一座桥梁。Ultralytics 为在 PyTorch 中训练的模型提供各种模型部署选项

实际应用

PyTorch 的灵活性和强大功能已被许多尖端人工智能应用所采用:

  1. 自动驾驶:特斯拉自动驾驶系统在其开发管道中大量使用了 PyTorch。正如他们在人工智能日的演讲中所强调的,特斯拉的工程师使用 PyTorch 来构建和训练复杂的深度学习模型,以执行实时物体检测和场景理解。
  2. 医学图像分析:医疗保健领域的人工智能中,PyTorch 被用于开发医疗扫描分析模型。例如,NVIDIA Clara是一个医疗保健应用框架,它使用 PyTorch 完成图像分割等任务,自动划分肿瘤,帮助放射科医生做出更快、更准确的诊断。

人工智能生态系统中的 PyTorch

PyTorch 是与TensorFlow 等其他框架并驾齐驱的重要工具。虽然两者都很强大,但如何选择往往取决于项目需求。详细比较可参见我们的博文《探索视觉人工智能框架》。将 PyTorch 与OpenCV 等计算机视觉库区分开来也很重要,后者提供图像和视频处理工具,但不是端到端的深度学习框架。

所有Ultralytics YOLO模型,包括最先进的YOLO11,都是使用 PyTorch 构建的。这使得它们能够充分利用该框架的性能和灵活性。Ultralytics HUB等平台简化了训练自定义模型、管理数据集和部署模型的整个生命周期。

PyTorch 通过其官方PyTorch 网站、广泛的文档和活跃的开发者社区获得了强大的支持。对于那些希望优化训练过程的人来说,超参数调整指南和模型训练技巧是非常宝贵的资源。该框架的官方GitHub 存储库是社区支持和贡献的另一个绝佳场所。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板