实验名称:矩阵乘法的OpenMP实现与性能分析 姓名: 学号: 班级: 实验日期:2011年10月21日、11月4日 一. 1) 用OpenMP实现最基本的数值算法“矩阵乘法” 2) 掌握for编译制导语句 3) 对并行程序进行简单的性能 二. 1) 硬件环境:32核CPU、32G存计算机; 2) 软件环境:Linux、Win2003、GCC、MPICH、VS2008; 4) ...
结果表明,CPU -OpenMP 并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU -CUDA 并行的计算加速比随矩阵阶数的增加显著增加,最大计算加速比可达570倍以上。相对于CPU 单线程计算结果,CPU -OpenMP 并行计算未产生误差,而GPU -CUDA 并行计算会产生误差。结果表明,GPU -CUDA 并行适合高阶数矩阵乘法的加速...
加速比与矩阵阶数无关,且低于所采用的线程数目.GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,最大计算加速比可达570倍以上.相对于CPU单线程计算结果,CPU-OpenMP并行计算未产生误差,而GPU-CUDA并行计算会产生误差.结果表明,GPUCUDA并行适合高阶数矩阵乘法的加速计算,而CPU-OpenMP并行适合低阶数矩阵乘法的加速计算...
openmp矩阵乘法并行实验节点数性能 深圳大学实验报告课程名称:并行计算实验名称:矩阵乘法的OpenMP实现及性能分析姓名:学号:班级:实验日期:2011年10月21日、11月4日一.实验目的1)用OpenMP实现最基本的数值算法“矩阵乘法”2)掌握for编译制导语句3)对并行程序进行简单的性能二.实验环境1)硬件环境:32核CPU、32G内存计算机...
比与矩阵阶数无关,且低于所采用的线程数目.GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,最大计算加速比可达570倍以上.相对于CPU单线程计算结果,CPU-OpenMP并行计算未产生误差,而GPU-CUDA并行计算会产生误差.结果表明,GPU-CUDA并行适合高阶数矩阵乘法的加速计算,而CPU-OpenMP并行适合低阶数矩阵乘法的加速计算....
结果表明,CPU-OpenMP并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,最大计算加速比可达570倍以上。相对于CPU单线程计算结果,CPU-OpenMP并行计算未产生误差,而GPU-CUDA并行计算会产生误差。结果表明,GPU-CUDA并行适合高阶数矩阵乘法的加速计算,而CPU-OpenMP...