1. 使用lora微调gemma-2b-it模型,数据集为Alpaca_cleaned_data 2. 在truthfulQA数据集上评估模型效果 数据集介绍 Alpaca 是由 OpenAI 的 text-davinci-003 引擎生成的包含52000条指令和演示的数据集。这些指令数据可用于为语言模型进行指令调整,使语言模型更好地遵循指令。cleaned数据集修复了原数据集一些不合理的...
微调开源OpenHermes 2.5模型 | 使用Intel的数据集通过DPO对OpenHermes 2.5模型进行了微调,在多个标准测试中的表现都有所提升,包括AGIEval、TruthfulQA和GPT4All Suite。 模型地址:链接 代码地址:链接 #LLM(大型语言模型)#LLM#人工智能 发布于 2023-11-30 09:14・IP 属地上海 ...