这不太可能与CUDA有关,更有可能与tensorflow安装的坏版本有关。先了解一些基础知识:
模型的骨干就是由多个CSP结构组合而成,但是第一个CSP结构和其他的CSP结构不相同。以输入图像的shape为 [416,416,3] 为例。有如下两点不同:第一个CSP结构是先经过一个标准卷积块下采样,然后经过3*3卷积提取特征,不改变通道数64;在主干卷积分支的残差块,先1*1卷积下降通道数32,再3*3卷积上升通道数64。 输入...
为什么wgan ,tensorflow 和pytorch ,tensorflow写的 wgan 为什么很占内存,运算速度快 ,而torch写的wgan不占显卡内存 ,但是运行慢 同一个模型 pytorch 占用显卡内存 16g * 的20%左右,2万次大概要24小时 pytorch 占用显卡内存 32g * 的80%左右 20万次 大概要2小时半...
这不太可能与CUDA有关,更有可能与tensorflow安装的坏版本有关。先了解一些基础知识: