TVM并将MxNet的ResNet18跑起来获取分类结果,最后我们还体验了一下使用AutoTVM来提升ResNet50在Jetson Nano上的推理效率,AutoTune了一个Task(一共需要AutoTune 20个Task)之后可以将ResNet50的推理速度做到150ms跑完一张图片(224x224x3),从上面的BenchMark可以看到TensorRT在FP32的时候大概能做到50-60ms推理一张图片(...
test_ms_resnet18_cifar10_train_infer_gpu_8p_0001 test_ms_resnet18_imagenet_pynative_train_check_loss_gpu_8p_0001 test_ms_resnet18_imagenet_train_check_pfs_gpu_1p_0002 test_ms_resnet50_benchmark_imagenet_pynative_train_check_perf_gpu_8p_0001 test_ms_resnet50_cifar10_pynative_train_ch...