在GPU上训练神经网络时,需要在网络模型定义好后放入GPU中net.to(device),这个方法将递归遍历所有模块,并将其参数和缓冲区都转换为CUDA张量。然后要将每一步的输入和数据都放入GPU中,比如在训练网络时,每一次获取数据后,都要inputs, labels = data[0].to(device), data[1].to(device)。 本文模型运行结果(只...
使用nvidia-smi 指令查看 gpu 利用率 接着,我在命令行使用nvidia-smi指令发现在程序未运行时,GPU-Util 为 0%,但在训练模型时,GPU-Util 为 26%,并且显存占用了 6800MB。所以就是 gpu 在训练模型呀,我以为又是这垃圾 win11 的 bug,导致任务管理器显示异常。 提升GPU-Util 利用率以及模型训练速度 不过,我还是...
模型小 数据输入慢