【源码】基于TensorRT框架的语音识别推理工具

项目简介

本项目是基于TensorRT框架的深度学习模型推理工具，聚焦于语音识别任务。采用Python和C++编写，借助TensorRT的优化能力，大幅提升深度学习模型在GPU上的推理速度。项目支持多种自定义插件，可处理复杂计算任务，提供高效的模型推理功能。

TensorRT网络构建：提供辅助类与方法，用于在PyTorch中定义和操作TensorRT网络，支持如conformer+MoE等复杂模型结构并针对性优化。
模型推理：实现加载TensorRT模型并执行推理，涵盖输入数据预处理、模型执行和输出结果后处理。
插件支持：支持注意力掩码Softmax插件、批量归一化插件等自定义插件，处理特定计算任务，提升模型灵活性与性能。
性能优化：利用TensorRT的轮廓优化、FP16/INT8量化等功能提高推理速度，在T4显卡上，输入206帧真实语音数据，TensorRT float time = 20.44ms，加速比达7.x。
日志和调试：提供日志记录功能，支持单步调试和性能分析，确保模型稳定性和高效性。

点击下载 【提取码: 4003】【解压密码: www.makuang.net】