Part 1: SAXPY 用CUDA 实现一个在 GPU 上运行的 SAXPY 程序. 输入两个数组 X, Y 以及一个常数 scale, 输出一个数组 Z, 并且 Z[i] = scale * X[i] + Y[i]. 直接访问和存储 global memory 就行. __global__voidsaxpy_kernel(intN,floatalpha,float* x,float* y,float* result){intindex = b...
Asst2 Starter Code Github传送门github.com/cmu15418s23/asst2 环境配置 GPU: NVIDIA GeForce RTX 4060 Laptop (8GB, PCIe 4.0 * 8) 操作系统:WSL2 in win11 CUDA Version: 11.7 + 12.1 为什么装了两版CUDA?CMU测试机安装的是CUDA11.7,但对应的Nsight Compute 2022.2不支持WSL(需求2022.4以上) WSL里两...
CMU15418(1)- 背景知识 本系列是Prof Kayvon Fatahalian2017年夏季学期在清华开的一门课程,对应的CMU课程是15-418,可以在bilibili找到原始视频。 这门课我是2020年学习的,现在把一部分当时的学习笔记上传博客保存。 不同层次上的并行计算 指令级并行(ILP, e.g. superscalar):由CPU硬件设计实现,在一个时钟周期内...
此时的指令还是顺序执行(in order execution)的,但图中可以看到有很多wait的阶段,导致这种现象的原因之一是指令间存在数据依赖,例如instr2需要instr1的结果,因此在instr1执行完成前,instr2还是要等待;还有的情况就是代码中有if分支语句,此时也不能提前执行后面的语句。 在奔腾II后,为了缓解该现象,Intel在CPU中引入了...
用来衡量P个cores的加速性能,公式为speedup = 1个core的执行时间/P个cores的执行时间。 为了探究有那些因素会影响并行的效率,老师开展了5个有意思的实验: 1个人计算16个卡片上的数字,花费56秒 2个人计算16个卡片上的数字,每个人8个卡片,花费34秒 4个人计算16个卡片上的数字,每个人的卡片数不一样,有的人大于...
对这个感兴趣可以看课程CMU18447 2 accessing memory 接下来介绍内存访问相关的内容。 虽然CPU的性能提升遇到了瓶颈,但相对于内存存取速度的提升而言,还是进步比较大的。 关于内存存取有两个术语: 内存延迟:指内存系统响应处理器一个内存请求(如load,store)的时间,如100 cycles,100nsec(1nsec=1e-9 sec) ...
C++33 assignment4assignment4Public Assignment 4 for the CMU 15418 Course C++212 assignment3assignment3Public C++213 asst3-s18asst3-s18Public GraphRat simulation Python26 0 contributions in the last year No contributions on March 3rd.No contributions on March 10th.No contributions on March 17th.No...
cmu15418s24/asst1 main BranchesTags Code Folders and files Latest commit History7 Commits common prog1_mandelbrot_threads prog2_vecintrin prog3_mandelbrot_ispc prog4_sqrt prog5_saxpy LICENSE Makefile README.md asst1_handout.pdf submit.py Repository files navigation README ...
cmu15418查看原帖2 评论 相关推荐 02-10 11:35 蚌埠坦克学院 测试开发 测试理论总结6-面试测试常问用例 Test知识总结 点赞 评论 收藏 分享 02-14 19:34 已编辑 哈尔滨工业大学(威海) Java 【面经】货拉拉 深圳 Java日常实习 时间线24.11.12 一面24.11.13 二面24.11.15 口头oc ...
2)控制相关 ,一条指令要确定下一条指令的位置,例如在执行分支、跳转 、调用或返回指令时。 这些相关可能会导致流水线产生计算错误,称为冒险(hazard)。同相关一样 ,冒险也可以分为两类:数据冒险(data hazard)和控制冒险 (control hazard) .我们首先介绍数据冒险 ,然后再介绍控制冒险。