https://github.com/baichuan-inc/Baichuan2 一、简述 几个版本: 语料规模:2.6T tokens 评测效果,Table 1: Baichuan2比Baichuan1大为进步: 在MMLU Hendrycks 等人的通用基准上、CMMLU Li 、 C-Eval Huang 等,百川2-7B比百川1-7B的性能提高了近30%。 在数学、代码上,大大提升了性能,百川2号的成绩较百川1...
9月6日,百川智能发布第二代开源模型Baichuan 2,正式开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat与其4bit量化版本。模型均免费可商用,已在AI模型社区魔搭ModelScope首发上架,魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。今年6月、7月,百川先后开源了上一代的7B和13B...
与国内外主流模型相比,下图左侧图片中Baichuan 4是图中橙色线条,国内大模型的平均水平是蓝色线条,百川智能已经全方位处于领先。与国外模型相比,Baichuan 4在知识百科、长文本、生成创作等文科类中文任务上优于国外大模型。在多模态能力方面,Baichuan 4评测结果接近GPT-4V。在MMMU、MMBench-EN、CMMMU、MMBench-CN...
9月6日,百川智能发布第二代开源模型Baichuan 2,正式开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat与其4bit量化版本。模型均免费可商用,已在AI模型社区魔搭ModelScope首发上架,魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。
5月22日,百川智能发布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小应”。Baichuan 4相较Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。此外,Baichun 4还具备行业领先的多...
下载链接:https://github.com/baichuan-inc/Baichuan2 在所有主流中英文通用榜单上,Baichuan 2全面领先Llama 2,而Baichuan2-13B更是秒杀所有同尺寸开源模型。毫不夸张地说,Baichuan2-13B是目前同尺寸性能最好的中文开源模型。而在过去一个月里,Baichuan系列的下载量在Hugging Face等开源社区已经超过了347万次,是...
其中,Baichuan2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。 数据 Baichuan 2系列大模型之所以能实现如此傲人的成绩,其中一个原因便是,训练语料规模大、覆盖全,且质量优。
今天,百川智能正式发布全球上下文窗口长度最长的大模型——Baichuan2-192K。与以往不同的是,此次模型的上下文窗口长度高达192K,相当于约35万个汉字。再具体点,Baichuan2-192K能够处理的汉字是GPT-4(32K上下文,实测约2.5万字)的14倍,Claude 2(100K上下文,实测约8万字)的4.4倍,可以一次性读完一本《三体...
9 月 6 日下午的发布会上,百川智能宣布正式开源微调后的 Baichuan-2 大模型。中国科学院院士、清华大学人工智能研究院名誉院长张钹在发布会上。这是百川自 8 月发布 Baichuan-53B 大模型后的又一次新发布。本次开源的模型包括 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本,并且均为...