你转换的应该是llama2-13B的预训练模型,这个模型的特点是只会续写,直到输出最大序列长度才会停止,对话效果是不好的; 如果你想要好的对话效果,建议你下载llama2-13B-chat版本,这个模型是在预训练模型基础上进行了指令微调和人类偏好的的对齐,各方面能力显著好于预训练模型,下载地址可参考:https://huggingface.co/dar...