如题目所示,我们开源了Llama3-8B-Chinese-Chat模型(基于Llama3-8B-Instruct[1]微调,模型下载请详见下面的huggingface链接),这是第一个使用ORPO[2]微调的中文Llama3模型。 根据我们的测试,相较于Meta开源的Llama3-8B-Instruct,我们的Llama3-8B-Chinese-Chat模型有以下优点: 不会出现Llama3-8B-Instruct中经常出现的...
站长之家(ChinaZ.com)4月23日 消息:Llama3-8B-Chinese-Chat 是一个基于 Meta-Llama-3-8B-Instruct 模型,通过 ORPO(无参照整体优选优化)方法进行微调的中文聊天模型。该模型在处理中文问题时,相较于原始模型,减少了使用英文回答和混合中英文回答的情况,同时减少了表情符号的使用,使得回答更加正式和专业。 ORPO ...
Open Resources 公共资源 公共数据集 公共教程 公共模型 hyperai-tutorials / 模型 / Llama3-8B-Chinese-Chat / 版本 v1最新版本当前版本 5 个月前 处理完毕 14.97 GB 暂无版本描述
在Llama 3的众多型号中,有一个清华系团队开发的Llama3-8B-Chinese-Chat还挺火,目前Llama 3 Models的Trending中排名第三。它是基于Llama3-8B通过ORPO微调的中文聊天模型,该模型显著减少了Llama3-8B“中文问题英文回答”和混合中英文回答的问题。 与Llama-3-8B-Insturct相比,模型在回答中文提示时一直都能做出更好...
训练数据:https://modelscope.cn/datasets/baicai003/Llama3-Chinese-dataset/summary V1版 0penCSG满速下载:https://opencsg.com/models/shareAl/llama3-Chinese-chat-8b WiseModel满速下载:https://wisemodel.cn/models/shareAl/llama3-Chinese-chat-8b ...
WiseModel满速下载:https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8b 选择其中一个下载到本地。 选择一个电脑盘符,我的是 F:\AI 鼠标右键,选择git bash here (没有git 下伙伴可以自己百度搜索一下安装) 在这个git 命令行窗口中输入如下命令 ...
GGUF版本下载 (ollama、lmstudio可用):https://huggingface.co/shareAI/llama3.1-8b-instruct-dpo-zh/blob/main/llama3.1_8b_chinese_chat_q4_k_m-shareAI.gguf GGUF版本国内下载 (hf-mirror 国内加速站点):https://hf-mirror.com/shareAI/llama3.1-8b-instruct-dpo-zh ...
模型下载 可使用text-generation-webui框架部署网页demo. 可使用以下框架,实现模型本地部署 vllm sglang text-generation-inference Ollama https://ollama.com/ollam/unichat-llama3-chinese-8b, by xx025 模型微调 可使用以下框架, 对模型进行SFT, LoRA, DPO, PPO等方式的微调 ...
Llama3-8B-Chinese-Chat Llama3-8B-Chinese-Chat 是第一个基于 Meta-Llama-3-8B-Instruct 模型通过 ORPO 专门针对中文进行微调的中文聊天模型。项目作者是清华大学自动化系 LEAP 实验室三年级博士生王慎执,导师为宋世济教授和黄高教授。 项目链接:https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat?
近日,一款名为Llama3-8B-Chinese-Chat的中文聊天模型正式发布,该模型基于Meta-Llama-3-8B-Instruct模型进行微调,采用先进的ORPO(无参照整体优选优化)方法,针对中英混答问题进行了优化,显著提升了中文对话的准确性和专业性。 Llama3-8B-Chinese-Chat模型的发布,标志着中文自然语言处理领域的一大进步。在以往...