Add TensorRT-Model-Optimizer INT4 AWQ support in onnxruntime tools (#… · microsoft/onnxruntime@23d48ea · GitHub

Commit

Add TensorRT-Model-Optimizer INT4 AWQ support in onnxruntime tools (#…

Browse files

…22390)

[TensorRT-Model-Optimizer](https://github.com/NVIDIA/TensorRT-Model-Optimizer)
have a implementation for INT4 AWQ. Adding the support in onnxruntime
tools to quantized the models with TensorRT-Model-Optimizer

Loading branch information

anujj authored Oct 11, 2024

1 parent cdebf37 commit 23d48ea