LLEMMA是一个专门用于数学的大型语言模型,它在Code Llama的基础上继续在Proof-Pile-2上进行预训练,Proof-Pile-2是一个包含科学论文、含有数学内容的网页数据和数学代码的包含了550亿token的混合数据集。 其中的代码部分AlgebraicStack包含了17种语言源代码的11B数据集,涵盖数值、符号和形式数学,并已开源。 LLEMMA的每...
11月6日,李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型 Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含34B和6B两个版本。据 Hugging Face英文开源社区平台和C-Eval中文评测的最...
【亿邦原创】11月6日,李开复博士带队创办的AI 2.0公司零一万物,正式开源发布首款预训练大模型Yi-34B。据悉,零一万物今年 3 月底官宣成立,六七月开始运营,李开复博士为创始人兼 CEO。“Yi” 系列大模型的命名来自“一”的拼音,据介绍,“Y”上下颠倒,巧妙形同汉字的 “人”,结合AI里的i,代表Human+ AI。
其中MAmmoTH-7B模型在MATH(竞赛级数据集)上的准确率达到了35%,超过了最好的开源7B模型(WizardMath)25%,MAmmoTH-34B模型在MATH上的准确率达到了46%,甚至超过了GPT-4的CoT结果。 数学推理领域新王:MAmmoTH 在数学推理任务上,开源和闭源的大型语言模型(LLM)之间存在巨大的性能差距,目前基准数据集上的sota仍然是GPT-...
11月6日,由李开复带队创办的AI 2.0公司零一万物,正式开源发布首款预训练大模型 Yi-34B。 据悉,零一万物此次开源发布的Yi系列模型,包含34B和6B两个版本。对比参数量和性能,Yi-34B相当于只用了不及LLaMA2-70B一半、Falcon-180B五分之一的参数量;对比大模型标杆GPT-4,在CMMLU、E-Eval、Gaokao 三个主要的中文指标...
北京商报讯(记者 杨月涵)11月6日,李开复博士带队创办的AI 2.0公司零一万物,正式开源发布首款预训练大模型 Yi-34B。据悉,零一万物此次开源发布的Yi系列模型,包含34B和6B两个版本。在Hugging Face英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B在各项性能上表现强劲,以70.72的分数位列全球第一。作为...
【AiBase提要:】🚀 模型开源与微调发布: 零一万物发布Yi-34B-Chat微调模型,同时提供4bit/8bit量化版,在评测中表现优异,已开源并可免费商用。⚙️ 量化版适用性:4bit量化版模型可在消费级显卡上使用,如RTX3090,提供更高的计算效率。🏆 评测成绩突出: Yi-34B-Chat在英文知识水平、中文综合考试以及数学...
李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字 零一万物发布全球最强的开源大模型Yi-34B,具备超强的语言理解和处理能力,支持处理40万汉字,在中文指标上表现卓越,标志着中国在大模型领域的重大突破。项目地址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard AiBase提要:1. 零一万物推出...
大语言模型已经成为AI核心基础能力,全球发展方兴未艾,头部企业并驱争先。近日,全球AI专家李开复博士带队创办AI 2.0公司零一万物,正式开源发布 Yi Open-source。 零一万物此次开源发布的Yi系列预训练大模型包含34B和6B两个版本。Yi-6B 适合个人及研究用途,高质量 Yi-34B 已具大模型涌现能力,适合发挥于多元场景,满足开源...
据悉,开源大模型 Yi-34B 来自李开复旗下 AI 大模型创业公司“零一万物”,该模型发布于 2023 年 11 月 6 日。今年 7 月,李开复博士正式官宣并上线了其筹组的“AI 2.0”新公司:零一万物。此前李开复曾表示,AI 大语言模型是中国不能错过的历史机遇,零一万物就是在今年 3 月下旬,由他亲自带队孵化的新...