CUDA 5.0之后支持global函数内调用global函数,也就是核函数内调用核函数,即核函数的嵌套调用,也可以实现递归调用(暂未测试)。需要保证GPU计算能力3.5及以上。 然后进行如下设置:1.在项目属性中, 设定 CUDA C/C++==>common 的Generate Relocatable Device Code为True(-rdc=true). 2. 附加依赖项添加cudadevrt.lib ...
cudaError_t cudaStatus; cudaStatus = cudaMalloc((void**)&dev_ret, sizeof(int) * 5); cudaStatus = cudaMemcpy(dev_ret, ret, sizeof(int) * 5, cudaMemcpyHostToDevice); AplusB << < 1, 5 >> >(dev_ret, 10, 100); cudaStatus = cudaMemcpy(a, dev_ret, sizeof(int) * 5, cudaM...