在个别语言的得分方面,除了Aya-23-8B模型在法语和俄语上的得分,以及Aya-23-35B模型在日语上的得分之外,Aya 23系列模型在每种语言上都超越了同类中最强的模型,表明Aya 23系列模型在解决数学问题的能力上普遍优于同类模型,尽管在某些特定语言上可能仍需进一步的优化。生成式任务研究人员还测试了Aya 23系列模型在2...
为了解决上述问题,最近,加拿大的独角兽AI公司Cohere开源了两种尺寸(8B和35B)的多语言模型Aya23,其中Aya-23-35B在所有评估任务和涵盖的语言中取得了最好成绩。 论文链接: cohere.com/research/pap Aya-23-8B: huggingface.co/CohereFo Aya-23-35B: huggingface.co/CohereFo 覆盖的23种语言分别为阿拉伯语、中文(简体...
具体来说,Aya-23-8B模型在7种语言上的平均得分高达36.6分,而同类中排名第二的Gemma-1.1-7b模型得分为34.0分。 特别引人注目的是,Aya-23-8B模型的性能是Aya-101-13B模型(得分8.1分)的4.5倍,这再次强调了高质量预训练模型的重要性。 对于规模更大的模型,Aya-23-35B模型以53.7分的成绩超过了Mixtral-8x7B-Ins...
在个别语言的得分方面,除了Aya-23-8B模型在法语和俄语上的得分,以及Aya-23-35B模型在日语上的得分之外,Aya 23系列模型在每种语言上都超越了同类中最强的模型,表明Aya 23系列模型在解决数学问题的能力上普遍优于同类模型,尽管在某些特定语言上可能仍需进一步的优化。 生成式任务 研究人员还测试了Aya 23系列模型在23...
Aya-23 多语言任务评估 研究团队对 Aya-23 模型进行了全面评估,涵盖了 23 种语言,包括:1.判别式任务:在 XWinograd、XCOPA 和 XStoryCloze 等完全未见过的任务中,Aya-23-35B 模型取得了最佳表现,其平均准确率为 70.8%,超越了其他模型。2.通用语言理解:在多语言 MMLU 测试中,Aya-23-8B 模型在 14...
https://huggingface.co/CohereForAI/aya-23-8B 1. 引言 Aya 23 是一个专门为23种语言进行指令微调的语言模型系列。该模型基于 Cohere Command 模型和 Aya 多语言指令集,旨在改进多语言预训练模型在多种语言上的表现。 Aya 23 通过深度优化和广泛的多语言数据集,展示了其在处理多语言任务上的卓越能力。
具体而言,在英语MMLU测试中,Aya-23-8B模型在所有较小模型中以平均准确率达到48.2%领先。Aya-23-35B模型在与更大规模模型的对比中,平均得分超越了Mixtral-8x7B-Inst模型。在数学问题解决能力测试(MGSM)中,Aya 23系列的模型成为所有同类基线模型中的佼佼者,其数学推理能力显著优于其他模型。此外,在翻译任务...
为了全面评估Aya-23的性能,Cohere团队采用了多种评估方法。在未见过的识别任务中,如XWinograd、XCOPA和XStoryCloze等,Aya-23-35B模型取得了最佳表现,平均准确率为70.8%,超越了其他模型。在多语言MMLU测试中,Aya-23-8B模型在14种语言中取得了最佳表现,平均准确率为48.2%,在大部分语言上超过了其他模型。此外,在多...
近日,加拿大AI独角兽公司Cohere继Command-R+之后,再次发布了一款具有里程碑意义的大模型——Aya-23。这款模型不仅支持包括中文在内的23种语言,而且在性能上超越了Gemma、Mistral等同类模型,成为多语言自然语言处理技术的新标杆。 Aya-23的卓越性能 Aya-23模型家族包含80亿参数(8B)和350亿参数(35B)两个版本,全面...
Cohere最新开源Aya-23:支持23种语言,8B/35B可选 【新智元导读】Aya23 在模型性能和语言种类覆盖度上达到了平衡,其中最大的 35B 参数量模型在所有评估任务和涵盖的语言中取得了最好成绩。 虽然LLM 在过去几年中蓬勃发展,但该领域的大部分工作都是以英语为中心的,也就是说,虽然模型的能力很强,但也仅限于英语、...