文章详情页

PyTorch模型转TensorRT是怎么实现的?

浏览：3日期：2022-06-16 14:07:02

转换步骤概览准备好模型定义文件（.py文件）准备好训练完成的权重文件（.pth或.pth.tar）安装onnx和onnxruntime 将训练好的模型转换为.onnx格式安装tensorRT环境参数

ubuntu-18.04PyTorch-1.8.1onnx-1.9.0onnxruntime-1.7.2cuda-11.1cudnn-8.2.0TensorRT-7.2.3.4PyTorch转ONNX

Step1：安装ONNX和ONNXRUNTIME

网上找到的安装方式是通过pip

pip install onnxpip install onnxruntime

如果使用的是Anaconda环境，conda安装也是可以的。

conda install -c conda-forge onnxconda install -c conda-forge onnxruntime

Step2：安装netron

netron是用于可视化网络结构的，便于debug。

pip install netron

Step3 PyTorch转ONNx

安装完成后，可以根据下面code进行转换。

#--*-- coding:utf-8 --*--import onnx # 注意这里导入onnx时必须在torch导入之前，否则会出现segmentation faultimport torchimport torchvision from model import Netmodel= Net(args).cuda()#初始化模型checkpoint = torch.load(checkpoint_path)net.load_state_dict(checkpoint[’state_dict’])#载入训练好的权重文件print ('Model and weights LOADED successfully')export_onnx_file = ’./net.onnx’x = torch.onnx.export(net,torch.randn(1,1,224,224,device=’cuda’), #根据输入要求初始化一个dummy inputexport_onnx_file,verbose=False, #是否以字符串形式显示计算图input_names = ['inputs']+['params_%d'%i for i in range(120)],#输入节点的名称，这里也可以给一个list，list中名称分别对应每一层可学习的参数，便于后续查询output_names = ['outputs'],# 输出节点的名称opset_version = 10,#onnx 支持采用的operator set, 应该和pytorch版本相关do_constant_folding = True,dynamic_axes = {'inputs':{0:'batch_size'}, 2:'h', 3:'w'}, 'outputs':{0: 'batch_size'},})net = onnx.load(’./erfnet.onnx’) #加载onnx 计算图onnx.checker.check_model(net) # 检查文件模型是否正确onnx.helper.printable_graph(net.graph) #输出onnx的计算图

dynamic_axes用于指定输入、输出中的可变维度。输入输出的batch_size在这里都设为了可变，输入的第2和第3维也设置为了可变。

Step 4：验证ONNX模型

下面可视化onnx模型，同时测试模型是否正确运行

import netronimport onnxruntimeimport numpy as npfrom PIL import Imageimport cv2netron.start(’./net.onnx’)test_image = np.asarray(Image.open(test_image_path).convert(’L’),dtype=’float32’) /255.test_image = cv2.resize(np.array(test_image),(224,224),interpolation = cv2.INTER_CUBIC)test_image = test_image[np.newaxis,np.newaxis,:,:]session = onnxruntime.InferenceSession(’./net.onnx’)outputs = session.run(None, {'inputs': test_image})print(len(outputs))print(outputs[0].shape)#根据需要处理一下outputs[0],并可视化一下结果，看看结果是否正常ONNX转TensorRT

Step1：从NVIDIA下载TensorRT下载安装包 https://developer.nvidia.com/tensorrt

根据自己的cuda版本选择，我选择的是TensorRT 7.2.3，下载到本地。

cd download_pathdpkg -i nv-tensorrt-repo-ubuntu1804-cuda11.1-trt7.2.3.4-ga-20210226_1-1_amd64.debsudo apt-get updatesudo apt-get install tensorrt

查了一下NVIDIA的官方安装教程https://docs.nvidia.com/deeplearning/tensorrt/quick-start-guide/index.html#install，由于可能需要调用TensorRT Python API，我们还需要先安装PyCUDA。这边先插入一下PyCUDA的安装。

pip install ’pycuda<2021.1’

遇到任何问题，请参考官方说明 https://wiki.tiker.net/PyCuda/Installation/Linux/#step-1-download-and-unpack-pycuda如果使用的是Python 3.X，再执行一下以下安装。

sudo apt-get install python3-libnvinfer-dev