深圳Yolo 视觉
深圳
立即加入
词汇表

TensorRT

探索TensorRT 如何为NVIDIA TensorRT 深度学习模型。立即学习如何将Ultralytics 导出至TensorRT 低延迟、高速推理。

TensorRT NVIDIATensorRT 性能深度学习推理软件开发工具包(SDK)。它旨在优化神经网络模型的部署,为深度学习应用提供低推理延迟和高吞吐量。作为优化编译器TensorRT 流行框架(如 PyTorchTensorFlow 将其重构为NVIDIA GPU上高效执行的形式。 这种能力对于在速度和效率至关重要的生产环境中运行复杂AI模型具有关键意义。

TensorRT 如何TensorRT

TensorRT 的核心功能TensorRT 训练好的神经网络转换为针对目标硬件专门优化的"引擎"。它通过以下几种先进技术实现这一目标:

  • 层融合:优化器将神经网络的多层结构合并为单个核,从而减少内存访问开销并提升执行速度。
  • 精密校准: TensorRT 精简精度模式,例如混合精度(FP16)和整数量化(INT8)。通过减少表示数字的位数——通常仅伴随极小的精度损失——开发者可显著加速数学运算并降低内存占用。这属于模型量化的一种形式。
  • 内核自动调优:该软件能自动为GPU 选择最佳数据层与算法,通过 CUDA实现。

实际应用

由于能够以极低延迟处理海量数据,TensorRT 广泛应用于依赖计算机视觉和复杂AI任务的行业,这些领域对时效性要求极高。

  1. 自动驾驶系统:汽车人工智能领域,自动驾驶汽车必须即时处理来自多路摄像头的视频流以detect 、路标和障碍物。借助TensorRT,物体检测网络等感知模型能在毫秒级完成帧分析,使车辆控制系统得以无延迟地做出关键安全决策。
  2. 工业自动化:现代工厂在制造过程中运用人工智能实现自动化光学检测。高速摄像机捕捉装配线上的产品图像,TensorRT模型实时识别缺陷或异常。这种方案确保质量控制与高速生产环境同步,通常直接部署在工厂车间边缘AI设备上,NVIDIA 平台。

Ultralytics YOLO TensorRT 使用TensorRT

使用现代人工智能工具,将TensorRT 集成到工作流程中非常简单。TensorRT ultralytics 该软件包 提供了一种无缝方法,可将标准PyTorch 转换为TensorRT 。这使用户能够利用 最先进的架构 Ultralytics YOLO26 借助NVIDIA 硬件加速。对于希望在导出前管理数据集和训练管道的团队, Ultralytics 平台 提供了一个全面的环境,用于为这类高性能部署准备模型。

以下示例演示了如何将YOLO26模型TensorRT 文件(.engine) 并 用于 实时推理:

from ultralytics import YOLO

# Load the latest stable YOLO26 model (nano size)
model = YOLO("yolo26n.pt")

# Export the model to TensorRT format (creates 'yolo26n.engine')
# This step optimizes the computational graph for your specific GPU
model.export(format="engine")

# Load the optimized TensorRT engine for high-speed inference
trt_model = YOLO("yolo26n.engine")

# Run inference on an image source
results = trt_model("https://ultralytics.com/images/bus.jpg")

TensorRT ONNX 训练框架

TensorRT 模型部署领域中常见的其他术语至关重要:

  • TensorFlow对比: PyTorch 主要PyTorch 模型训练和研究,提供灵活性和易调试性。TensorRT 专为尽可能快速执行训练模型而设计的推理引擎 TensorRT 不适用于训练场景。
  • VS.ONNX: ONNX (开放神经网络交换)格式充当框架间的中介桥梁。ONNX 互操作性(例如将模型PyTorch 其他平台),TensorRT 硬件特定优化。通常,模型ONNX 转换为ONNX ,再由TensorRT 解析TensorRT 生成最终引擎。

对于希望最大化其AI代理或视觉系统性能的开发者而言,理解从训练框架向TensorRT 等优化运行时环境的过渡TensorRT 专业MLOps实践中的关键步骤。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入