项目简介
本项目是基于Python的Polygraphy工具包的使用示例集合。Polygraphy由NVIDIA开发,是一个强大工具,具备Python API和命令行界面(CLI),可助力用户在各类深度学习框架中运行和调试模型,能执行模型构建、校准、推理和性能比较等深度学习任务。
项目的主要特性和功能
- 模型构建和推理:利用Polygraphy,通过TensorRT网络API和立即评估API进行模型构建与推理。
- 模型校准:借助Polygraphy的Calibrator API对TensorRT模型开展INT8精度校准。
- 模型修改和精度约束:可修改模型特定层并添加精度约束,保障模型高精度运行。
- 性能比较:提供示例对比TensorRT和ONNX Runtime的推理性能。
安装使用步骤
- 环境准备:确保安装Python以及TensorRT、Polygraphy等相关库。
- 运行脚本:直接运行项目中的Python脚本,脚本含详细注释与示例,说明如何用Polygraphy完成特定任务。
- 理解和调整:阅读脚本注释与代码,理解工作原理,按需修改调整。
- 结果分析:运行脚本后,分析输出结果,如推理速度、精度和性能比较结果。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】