为什么Bert Large模型在Nvidia V100 16G显卡上的batch size通常较小? 105 1 0 在BERT模型中,层-头编号是如何定义的? 35 1 0 我现在在pytorch上训练了一个bert模型,请问用什么方法可以尽快在函数计算上部署并引出接口捏? 52 0 0 机器学习PAI一般部署类bert的funetune模型的方法有文档参考吗? 72 0 0 ...