cutlass(CUDA Templates for Linear Algebra Subroutines)Nvidia官方开源代码,主要使用Tensor Core硬件单元...
elapsed_time);CHECK(cudaEventDestroy(start));CHECK(cudaEventDestroy(stop));}printf("sum = %f.\...
mtensor是一个tensor计算库, 支持cuda的延迟计算, 项目地址为https://github.com/matazure/mtensor. 背景 延迟计算具有避免额外内存读写的优点, 该技术广泛应用于数值计算, 图像处理等领域. 目前绝大部分支持延迟计算的库都没支持cuda, 而对于gpu这种计算能里远强于内存带宽的设备来说, 延迟计算尤为重要, cuda 9...
stop;CHECK(cudaEventCreate(&start));CHECK(cudaEventCreate(&stop));CHECK(cudaEventRecord(start));...
tinycudann
我提两个比较简单的吧,一个是非官方改写的双目立体匹配ELAS算法,利用CUDA进行计算加速:goldbattle/...