近日,C-Eval大模型评测榜单更新,据榜单显示,vivo成功研发的自研大模型在全球中文榜单中位列第一,这一里程碑式的成就是对vivo在人工智能领域投入和创新的肯定。在OriginOS 4系统中,vivo的自研AI大模型将首次被应用,其中包括了三个不同参数量级的五款自研大模型,全面覆盖核心应用场景。一、C-Eval榜单与vivo的...
数据显示, 在C-Eval榜单上,XuanYuan-70B的总成绩达到71.9分;在CMMLU榜单中,以71.05分的高分位居榜首,在两大权威榜单上的所有开源模型中排名第一,也是国内首个同时在两大权威榜单排名第一的金融大模型。C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,几乎囊括了所有国内外...
同时作业帮公布了银河大模型在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示,作业帮银河大模型表现卓越,以平均分73.7分位居C-Eval榜首;同时在CMMLU榜单Five-shot和Zero-shot测评中分别以平均分74.03分及73.85分位列第一,成为首个同时在上述两大权威榜单平均分排名第一的教育大模型。银河大模型作...
10月16日,C-Eval大模型评测榜单更新,榜单显示,vivo自研大模型在C-Eval全球中文榜单中排名第一。此前,vivo自研大模型已取得了C-Eval百亿内大模型榜单第一,CMMLU全球中文榜单第一以及其百亿内大模型榜单第一的好成绩。vivo相关负责人透露,vivo自研AI大模型将会在即将发布的OriginOS 4系统中被首次应用,其中包括十亿...
36氪获悉,C-Eval全球大模型综合性考试评测榜公布,全球排名前四的分别为清华智谱的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat, APUS的AiLMe-100Bv1。C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。
在金融数字化转型加速的大背景下,AI人工智能机器人逐渐成为行业关注的焦点。近日,招联消费金融股份有限公司(以下简称“招联”)发布消费金融行业首个130亿参数开源大模型“招联智鹿”。公开数据显示,该模型一经发布便在国内权威榜单C-Eval...
C-Eval排名前三!APUS大模型3.0伶荔正式开源 i黑马讯 近日,APUS与深圳大学大数据系统计算技术国家工程实验室(以下简称“大数据国家工程实验室”)联合研发的伶荔Linly-70B中文大模型,在GitHub上正式开源,这是APUS大模型3.0的首个开源大模型。 此次,APUS和大数据国家工程实验室强强联合,集成各自优势,更有大数据国家工程...
C-Eval排名出炉,谁最牛? 最近,C-Eval全球大模型综合性考试评测榜的最新数据终于公布了!经过一番激烈的竞争,全球排名前四的大模型分别是清华大学和智谱AI联合推出的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat,以及APUS的AiLMe-100B v1。 C-Eval是由清华大学、上海交通大学和爱丁堡大学共同构建的,面向中文语言模型...
作业帮发布银河大模型,C-Eval、CMMLU双榜排名第一 9月2日,作业帮发布自研银河大模型。据介绍,该模型融合AI算法和教育数据,是一款覆盖多学科、多学段、多场景的教育大模型。数据显示,银河大模型在C-Eval、CMMLU两大权威大语言模型评测榜均居榜首,成为首个同时在上述两大权威榜单平均分排名第一的教育大模型。...