在WSL2 in win11系统中完成CUDA的toolkit安装,程序编译、调试和profiling; 对Asst2题给Performance Target Renderer的逆向工程(典中典之做题家揣摩出题老师); C++学徒选手入门CUDA的踩坑心得体会。 CUDA练习生时长两天半的工作成果 作业内容+环境配置 作业内容传送门 Spring 2023 Asst2 作业PDF传送门(CMU官网)www...
不能被VECTOR_WIDTH整除的边界部分的处理可能比较麻烦 Spring 2023的mask初始化函数提供了初始化前i个的选项,处理边界情况方便了很多 __cmu418_maskmaskAll;for(inti=0;i<N;i+=VECTOR_WIDTH){if(i+VECTOR_WIDTH>=N){maskAll=_cmu418_init_ones(N-i);}else{maskAll=_cmu418_init_ones();}//...} Pr...