执行程序得到: (DIP)(base)xm@MI:~/parallel/asst1/prog5_saxpy$ taskset -c 0,1,2,3,4,5,6,7 ./saxpy --target=avx2[saxpy serial]:[12.553]ms[23.742]GB/s[3.187]GFLOPS[saxpy ispc]:[12.087]ms[24.657]GB/s[
cs149-asst1 Assign 1 Program 1: Parallel Fractal Generation Using Threads (20 points) 任务要求 修改mandelbrotThread函数使其可以多线程并行描绘Mandelbrot 报告 多线程对比 for view 1 sequential耗时 661.509 ms 观察到现象:加速比和线程数没有线性关系,并且当线程数为奇数时,执行时间反而上升了...
二、程序2向量化指令 第二个程序是使用向量化的指令完成加速,作业提供了模拟的指令,在这里我还是使用的AVX2指令的内建函数来熟悉其用法和编程模式。 数组求和 floatarraySumVector(float*values,intN){/// CS149 STUDENTS TODO: Implement your vectorized version of arraySumSerial here//intblockWidth=8;//int b...
作业描述及代码参见:CS149-asst1 程序 1 生成 view 1 时加速比与线程数的关系如下: 线程数 加速比 2 2.04 3 1.69 4 2.54 5 2.57 6 3.26 7 3.55 8 4.11 生成 view 2 时加速比与线程数的关系如下: 线程数 加速比 2 1.75 3
Stanford CS149 -- Assignment 1. Contribute to BienBoy/CS149-asst1 development by creating an account on GitHub.
Stanford CS149 -- Assignment 1. Contribute to ToniXWD/CS149-asst1 development by creating an account on GitHub.
作业:https://github.com/stanford-cs149/asst1 我的实现:https://github.com/ToniXWD/CS149-asst1 这个作业主要是对既有的程序进行分析和优化,写的代码倒不是特别多 0 环境配置 我使用Wsl Ubuntu22.04作为开发环境,wsl的使用可以参考:WSL入门到入土 ...
我们在Asst1的prog3也有接触到,在程序中,使用launch指令来划分子任务tasks,这些tasks就会载入一个shared work queue中,在ISPC Runtime中,程序会创建一个线程池,来抢夺tasks。 由于在Dynamic Assignment中,programmer无需关心Assignment的事情,所以子任务的划分尤为重要,具体的点有: ...
Stanford CS149 -- Assignment 1. Contribute to BienBoy/CS149-asst1 development by creating an account on GitHub.
Stanford CS149 -- Assignment 1. Contribute to ToniXWD/CS149-asst1 development by creating an account on GitHub.