glm3-6b是在glm3-6b-base的基础上增加对话数据微调而来的吗? 为什么glm3-6b-base在开源数据集的评测效果比glm3-6b还要好很多?是否还有glm3-6b存在的意义了? 那么在一般场景中该如何选择模型了?