南洋理工开源中文大语言模型 Panda,基于 Llama-7B, -13B, -33B, -65B 进行中文领域上的持续预训练,使用接近 15M 条数据,并针对推理能力在中文 benchmark 上进行了评测,测试中表现优异,远超同等类型的中文语言模型。当前项目开源模型的型号:Panda-7B、Panda-Instruct-7B,并发布模型采用的公开中英文语料数据集,该...
MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的系列端侧语言大模型,已经第一时间发布到了始智AI 链接开源社区,主体语言模型 MiniCPM-2B 仅有 24亿(2.4B)的非词嵌入参数量。经过 SFT 后,MiniCPM 在公开综合性评测集上,MiniCPM 与 Mistral-7B相近(中文、数学、代码能力更优),整体性能超越 Llama2-13...