深度学习的模型的训练..我组了个3060的机器,用来跑模型。2 batch-size下,GPU利用率满了,但显存还没满,我就改成了4 batch-size,结果运行时间直接从12个小时,变成了26个小时。我之前的理解是batch size和运行时间没有什么太大的关系,但这结果完全不对,是我之前的理解