场景1 ,辅助超参数搜索:我们有多种预训练数据混合方案,不确定哪种更好,于是我们在 C-Eval 上相互比较一下,来确定最优预训练数据混合方案。 场景2 ,比较模型的训练阶段:我有一个预训练的 checkpoint ,也有一个 instruction-tuned checkpoint,然后我想要衡量我的 instruction-tuning 的效果如何,这样可以把两个 check...
2023年6月15日,被称为「中国ChatGPT梦之队」的百川智能公司,推出了70 亿参数量的中英文预训练大模型——baichuan-7B。baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上,以显著优势全面超过了ChatGLM-6B等其他大模型,并且在MMLU英文权威评测榜单上,大幅领先LLaMA-7B。 目前baichuan-7B大模型已在Hugging F...
【小米大模型首次曝光】 小米大模型MiLM-6B现身C-Eval、CMMLU大模型评测榜单。截至当前,MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,在CMMLU中文向大模型排名第1。 (来自华尔街见闻APP) 发布于 2023-08-11 15:09・IP 属地上海 赞同 1 ...
10月16日,C-Eval大模型评测榜单更新,榜单显示,vivo自研大模型在C-Eval全球中文榜单中排名第一。此前,vivo自研大模型已取得了C-Eval百亿内大模型榜单第一,CMMLU全球中文榜单第一以及其百亿内大模型榜单第一的好成绩。vivo相关负责人透露,vivo自研AI大模型将会在即将发布的OriginOS 4系统中被首次应用,其中包括十亿...
【小米大模型首次曝光评测成绩优秀】 小米大模型MiLM-6 B现身C-Eval、CMMLU大模型评测榜单,截止当前C-Eval总榜单排名第10、同参数量级排名第1;CMMLU中文向大模型排名第1。此次是#小米大模型首次曝光。#小爱同学 或迎 - 科技速递(代小呆pro)于20230811发布在抖音,已经收
10月16日,C-Eval大模型评测榜单更新,榜单显示,vivo自研大模型在C-Eval全球中文榜单中排名第一。此前,vivo自研大模型已取得了C-Eval百亿内大模型榜单第一,CMMLU全球中文榜单第一以及其百亿内大模型榜单第一的好成绩。vivo相关负责人透露,vivo自研AI大模型将会在即将发布的OriginOS 4系统中被首次应用,其中包括十亿...
李开复的AI公司零一万物估值超10亿美元 | 零一万物发布了首款开源大模型Yi系列,包括Yi-34B和Yi-6B。 Yi-34B在Hugging Face英文测试榜单中位列第一,在C-Eval中文能力排行榜中超越所有开源模型。200K上下文窗口,能处理40万汉字超长文本输入。能一次处理两本《三体》小说、理解超过 1000 页的 PDF 文档。
Yi-34B的中文能力表现也异常突出,在C-Eval中文权威榜单排行榜上超越了目前所有的开源模型。对比大模型标杆GPT-4icon,在CMMLU、E-Eval、Gaokao 三个主要的中文指标上,Yi-34B 也具有绝对优势。Yi-6B的中文能力表现也非常突出,不仅在同等参数规模的模型中主要指标都是位居榜首,甚至超越了一些更大参数规模的模型。