这是chatglm3-6b训练时候的参数情况,参数调到很低(只有487,424)。 出现的内存溢出情况如下 而对于chatglm3-6b-base模型,能够正常运行,训练情况如下,数据量和参数都提升了,也正常运行。