编译时用nvcc。只想通过简单修改就并行的话,我知道有一个OpenMP的C library。对for循环加progma,可以...
你需要的是一个source-to-source的translator,比如:The hiCUDA Project Homepage 这样的项目。
尽量避免让gpu做逻辑判断,也就是少用if。像你这个,可以把逻辑判断的0和1乘在赋值语句后面,这样就...