模型在线部署 QA环节 v1版本:MedicalGPT-zh MedicalGPT-zh:中文医疗对话语言模型 - 智源社区 LoRA-SFT监督微调-训练不稳定和量化效果不好 项目简介及快速开始 数据集构建:情景对话与知识问答 模型训练: 模型训练问题: 模型输出样例: 参考文献: 附:论文简要解读 0 摘要Abstract 1 Introduction 2 Large Language Mode...
shibing624/llama-3-8b-instruct-262k-chinese Llama-3-8B-Instruct-262k 在2万条中英文偏好数据集shibing624/DPO-En-Zh-20k-Preference上使用ORPO方法微调得到的超长文本多轮对话模型,适用于RAG、多轮对话 演示shibing624/vicuna-baichuan-13b-chat模型效果: 具体case见Inference Examples ▶️ Demo 我们提供了...
shibing624/llama-3-8b-instruct-262k-chineseLlama-3-8B-Instruct-262k在2万条中英文偏好数据集shibing624/DPO-En-Zh-20k-Preference上使用ORPO方法微调得到的超长文本多轮对话模型,适用于RAG、多轮对话 演示shibing624/vicuna-baichuan-13b-chat模型效果:具体case见Inference Examples ...