首先,需要确认quantize_qat(量化感知训练量化)是否确实是onnxruntime.quantization模块的一部分。由于onnxruntime的库可能会更新并移除或重命名某些功能,因此建议直接查阅ONNX Runtime的官方文档或GitHub仓库的更新日志以确认这一点。 如果文档中明确提到了quantize_qat,并且说明它位于onnxruntime.quantization下,那么我们...
tensorflow QAT model like: 【model 1】 [data] [weights] | | [FakeQuantWithMinMaxVars] [FakeQuantWithMinMaxVars] \ / [ conv2d ] I hope it to be onnx QAT model like this after convert: 【model 2】 [data] [weights] | | [QuantizeLinear] [Quantiz...