完整GA104拥有6个GPC,每个GPC下有4个TPC(总数24组TPC)。到达TPC层面,结构基本固定,每个TPC包含2个SM,每个SM包含128个CUDA Core,1个第二代RT Core,以及4个第三代Tensor Core。GA104-300-A1同样包含了6个GPC,所不同的是,其中一个GPC屏蔽了一组TPC,也就是总共有23组TPC。因此SM总数量为46个,共58...
到达TPC层面,结构基本固定,每个TPC包含2个SM,每个SM包含128个CUDA Core,1个第二代RT Core,以及4个第三代Tensor Core。 GA104-300-A1同样包含了6个GPC,所不同的是,其中一个GPC屏蔽了一组TPC,也就是总共有23组TPC。因此SM总数量为46个,共5888个CUDA Core,184个TMU(纹理单元),184个第三代Tensor Core,46个...
上图为核心结构图,完整的GA102有6组GPC,但每个GPC对比GA102的GPC是缩减过的,GA102每组GPC里包含12组SM单元,而GA104每组GPC只有8个SM单元,总共算下来完整GA104有6144个CUDA核心。左右两侧总共8个内存控制器,组成8x32bit=256bit显存位宽。但事实是RTX 3070上的GA104-300明显是经过老黄的刀法试炼的,实际只有...
完整的GA104拥有6组GPC,但每组的TPC数量从6组减少到4组,一共24组TPC,每组TPC包含2组SM,所以总共拥有48个SM单元,每组SM有128个CUDA,一共有6144个CUDA,8组32位的显存控制器组成256bit的显存位宽。但RTX 3070所用的GA104-300核心屏蔽了两组SM单元,只启用了46组SM,5888个CUDA,GPU核心基础频率1500MHz,...
因此我们也能够轻易从GPC、TPC、SM数量反推出RTX 3070的GA104-300-A1的实际配置,以及未来黄氏刀法的各种可能性。 我们先从完整的GA104说起。 GA104同样使用三星8nm NVIDIA定制工艺制造,封装了174亿个晶体管,芯片面积达到了392mm²,也就相当于每平方毫米包含了4440万个晶体管密度,非常壮观。
GA102核心中包含7个图形处理集群(GPC),每个GPC容纳12个SM,所以总共有84个SM。同时每个SM包含128个CUDA核心,4个Tensor核心和1个RT核心。一个完整GA102芯片相当于10752个CUDA核心、336个Tensor核心和84个RT核心。英伟达通过对SM数量控制,将GA102核心用于各种型号的产品上。数月前,英伟达已经恢复生产RTX 3080 12G...
英伟达 RTX 30 系列全球发布会之后,官网公布了 RTX 3090/3080/3070 三款公版显卡的价格。GeForce RTX 3070 启用了 46 个 SM 单元,共 5888 个 CUDA 核心,搭载了下一代 RT 核心、张量核心。显存方面,GeForce RTX 3070 拥有 8 GB 的 GDDR6 内存,速度为 16 Gbps,256bit 位宽,带宽为 512 Gbps。
若与同代大哥RTX 3070对比的话,两者均采用了GA104中型规模核心,不过RTX 3070保留了46组SM单元,而RTX 3060 Ti阉割到了38组SM单元,CUDA数目少了21%,有着比较大的规格差距。 显存方面,RTX 3060 Ti与大哥RTX 3070,与上代产品RTX 2060 SUPER和官方钦定的对手RTX 2080 SUPER都是8GB GDDR6显存,显存频率只有RTX 2080...
不过,GeForce RTX 3070上的GA104-300核心并不是完整的GA104核心,而是屏蔽了一组TPC,也就是只启用了GA104上的46组SM单元。而如今发布的GeForce RTX 3070 Ti上,GA104-300核心屏蔽的这组TPC得以解除桎梏,完全体的GA104得以现身,其核心代号也变更为GA104-400。前面说过,GA104核心不管是核心面积、晶体管数量...
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。GeForce RTX 3070 Ti共有6144个CUDA,其实它有3072个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了6144的CUDA数量。而这样粗暴的提升CUDA...