TensorRT backend for ONNX

Parses ONNX models for execution with TensorRT.

Supported TensorRT Versions

Development on the Master branch is for the latest version of TensorRT 6.0 with full-dimensions and dynamic shape support.

For version 6.0 without full-dimensions support, clone and build from the 6.0 branch

For version 5.1, clone and build from the 5.1 branch

For versions < 5.1, clone and build from the 5.0 branch

Full Dimensions + Dynamic Shapes

Building INetwork objects in full dimensions mode with dynamic shape support requires calling the following API:

C++

const auto explicitBatch = 1U << static_cast<uint32_t>(nvinfer1::NetworkDefinitionCreationFlag::kEXPLICIT_BATCH);
builder->createNetworkV2(explicitBatch)

Python

import tensorrt
explicit_batch = 1 << (int)(tensorrt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH)
builder.create_network(explicit_batch)

For examples of usage of these APIs see:

Supported Operators

Current supported ONNX operators are found in the operator support matrix.

Installation

Dependencies

Building

For building on master, we recommend following the instructions on the master branch of TensorRT as there are new dependencies that were introduced to support these new features.

To build on older branches refer to their respective READMEs.

Executable usage

ONNX models can be converted to serialized TensorRT engines using the onnx2trt executable:

onnx2trt my_model.onnx -o my_engine.trt

ONNX models can also be converted to human-readable text:

onnx2trt my_model.onnx -t my_model.onnx.txt

See more usage information by running:

onnx2trt -h

Python modules

Python bindings for the ONNX-TensorRT parser are packaged in the shipped .whl files. Install them with

pip install <tensorrt_install_dir>/python/tensorrt-6.0.1.5-cp27-none-linux_x86_64.whl

TensorRT 6.0 supports ONNX release 1.5.0. Install it with:

pip install onnx==1.5.0

ONNX Python backend usage

The TensorRT backend for ONNX can be used in Python as follows:

import onnx
import onnx_tensorrt.backend as backend
import numpy as np

model = onnx.load("/path/to/model.onnx")
engine = backend.prepare(model, device='CUDA:1')
input_data = np.random.random(size=(32, 3, 224, 224)).astype(np.float32)
output_data = engine.run(input_data)[0]
print(output_data)
print(output_data.shape)

C++ library usage

The model parser library, libnvonnxparser.so, has its C++ API declared in this header:

NvOnnxParser.h

Important typedefs required for parsing ONNX models are declared in this header:

NvOnnxParserTypedefs.h

Docker image

Tar-Based TensorRT

Build the onnx_tensorrt Docker image using tar-based TensorRT by running:

git clone --recurse-submodules https://github.com/onnx/onnx-tensorrt.git
cd onnx-tensorrt
cp /path/to/TensorRT-6.0.*.tar.gz .
docker build -f docker/onnx-tensorrt-tar.Dockerfile --tag=onnx-tensorrt:6.0.6 .

Deb-Based TensorRT

Build the onnx_tensorrt Docker image using deb-based TensorRT by running:

git clone --recurse-submodules https://github.com/onnx/onnx-tensorrt.git
cd onnx-tensorrt
cp /path/to/nv-tensorrt-repo-ubuntu1x04-cudax.x-trt6.x.x.x-ga-yyyymmdd_1-1_amd64.deb .
docker build -f docker/onnx-tensorrt-deb.Dockerfile --tag=onnx-tensorrt:6.0.6 .

Tests

After installation (or inside the Docker container), ONNX backend tests can be run as follows:

Real model tests only:

python onnx_backend_test.py OnnxBackendRealModelTest

All tests:

python onnx_backend_test.py

You can use -v flag to make output more verbose.

Pre-trained models

Pre-trained models in ONNX format can be found at the ONNX Model Zoo

Name		Name	Last commit message	Last commit date
Latest commit History 179 Commits
docker		docker
onnx_tensorrt		onnx_tensorrt
third_party		third_party
.gitignore		.gitignore
.gitmodules		.gitmodules
CMakeLists.txt		CMakeLists.txt
ImporterContext.hpp		ImporterContext.hpp
LICENSE		LICENSE
ModelImporter.cpp		ModelImporter.cpp
ModelImporter.hpp		ModelImporter.hpp
NvOnnxParser.cpp		NvOnnxParser.cpp
NvOnnxParser.h		NvOnnxParser.h
NvOnnxParserTypedefs.h		NvOnnxParserTypedefs.h
OnnxAttrs.cpp		OnnxAttrs.cpp
OnnxAttrs.hpp		OnnxAttrs.hpp
README.md		README.md
ShapedWeights.cpp		ShapedWeights.cpp
ShapedWeights.hpp		ShapedWeights.hpp
Status.hpp		Status.hpp
TensorOrWeights.hpp		TensorOrWeights.hpp
builtin_op_importers.cpp		builtin_op_importers.cpp
builtin_op_importers.hpp		builtin_op_importers.hpp
common.hpp		common.hpp
contributing.md		contributing.md
getSupportedAPITest.cpp		getSupportedAPITest.cpp
libnvonnxparser.version		libnvonnxparser.version
main.cpp		main.cpp
nv_onnx_parser_bindings.i		nv_onnx_parser_bindings.i
onnx2trt.hpp		onnx2trt.hpp
onnx2trt_common.hpp		onnx2trt_common.hpp
onnx2trt_runtime.hpp		onnx2trt_runtime.hpp
onnx2trt_utils.cpp		onnx2trt_utils.cpp
onnx2trt_utils.hpp		onnx2trt_utils.hpp
onnx_backend_test.py		onnx_backend_test.py
onnx_trt_backend.cpp		onnx_trt_backend.cpp
onnx_utils.hpp		onnx_utils.hpp
operators.md		operators.md
serialize.hpp		serialize.hpp
setup.py		setup.py
toposort.hpp		toposort.hpp
trt_utils.hpp		trt_utils.hpp
utils.hpp		utils.hpp

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TensorRT backend for ONNX

Supported TensorRT Versions

Full Dimensions + Dynamic Shapes

Supported Operators

Installation

Dependencies

Building

Executable usage

Python modules

ONNX Python backend usage

C++ library usage

Docker image

Tar-Based TensorRT

Deb-Based TensorRT

Tests

Pre-trained models

About

Releases

Packages

Languages

License

kevinch-nv/onnx-tensorrt

Folders and files

Latest commit

History

Repository files navigation

TensorRT backend for ONNX

Supported TensorRT Versions

Full Dimensions + Dynamic Shapes

Supported Operators

Installation

Dependencies

Building

Executable usage

Python modules

ONNX Python backend usage

C++ library usage

Docker image

Tar-Based TensorRT

Deb-Based TensorRT

Tests

Pre-trained models

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages