场景1 ,辅助超参数搜索:我们有多种预训练数据混合方案,不确定哪种更好,于是我们在 C-Eval 上相互比较一下,来确定最优预训练数据混合方案。 场景2 ,比较模型的训练阶段:我有一个预训练的 checkpoint ,也有一个 instruction-tuned checkpoint,然后我想要衡量我的 instruction-tuning 的效果如何,这样可以把两个 check...
Yi-34B和Yi-6B的表现: C-Eval中文能力排行榜:Yi-34B在C-Eval中文能力排行榜上超越了所有开源模型,这意味着在中文语言理解和生成方面,Yi-34B的性能优于其他所有开源的大模型。 中文综合能力:在CMMLU、E-Eval、Gaokao等中文评测指标上,Yi-34B明显领先于GPT-4,展现了其在中文语境下的强大理解和应用能力。 中文问...