vivo作为中国知名手机品牌,也积极投入人工智能研究,推出自研大模型。近期,vivo自研大模型在C-Eval和CMMLU两大中文榜单上取得了领先地位,展示了中国品牌在人工智能领域的强大实力。 C-Eval和CMMLU分别是两个国际知名的中文自然语言处理评估基准。C-Eval主要评估中文语言理解能力,而CMMLU则侧重于中文多模态语言理解能力。
作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU 是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,包含67个主题,专门用于评估语言模型在中文语境下的知识和推理能力。在CMMLU榜单评测...
11月16日,根据最新成绩,千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单。在国内大模型赛道火热的当下,夸克自研大模型凭借过硬的研发能力及数据、行业、平台等优势成为新晋“学霸”。作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆...
11月16日,根据最新成绩,千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单。 作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,...
新晋“学霸”夸克大模型拿下C-Eval和CMMLU双榜第一 11月16日,根据最新成绩,千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单,多项性能优于GPT-4。在国内大模型赛道火热的当下,夸克自研大模型凭借过硬的研发能力及数据、行业、平台等优势成为新晋“学霸”。作为国内最权威的两个大语言模型测试榜单,C...
登顶C-Eval、CMMLU双榜单第一【附人工智能产业分析】 图源:摄图网 10月16日,vivo将发布自研AI大模型矩阵,其中包括十亿、百亿、千亿三个不同参数量级的5款自研大模型,全面覆盖核心应用场景。 据vivo相关负责人透露,vivo自研AI大模型将会在即将发布的OriginOS 4系统中被首次应用,为消费者带来更加智能、便捷、安全的...
10月16日,vivo将发布自研AI大模型矩阵,其中包括十亿、百亿、千亿三个不同参数量级的5款自研大模型,全面覆盖核心应用场景。最新数据显示,vivo自研AI大模型同时位列C-Eval、CMMLU双榜的全球中文榜单榜首,综合能力十分强劲,特别是在人文、社科等领域的表现远超同级别大模
CMMLU数据集则是一个综合性的中文评估基准,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,在评估语言模型在中文语境下的知识和推理能力方面极具权威性。不难看出,vivo自研AI大模型同时登顶C-Eval、CMMLU两大榜单,展现出其在中文语言模型领域的绝对领先实力,同时体现出业界对vivo的AI创新能力和发展潜力的肯定。...
最新数据显示,vivo自研AI大模型同时位列C-Eval、CMMLU双榜的全球中文榜单榜首,综合能力十分强劲,特别是在人文、社科等领域的表现远超同级别大模型。据vivo相关负责人透露,vivo自研AI大模型将会在即将发布的OriginOS 4系统中被首次应用,为消费者带来更加智能、便捷、安全的手机使用体验。此次,vivo自研AI大模型同时...
11月16日,根据最新成绩,千亿级参数的夸克大模型登顶C-Eval和CMMLU两大权威评测榜单。 作为国内最权威的两个大语言模型测试榜单,C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科,是目前权威的中文AI大模型评测榜单之一。CMMLU是由MBZUAI、上海交通大学、微软亚洲研究院共同推出,...