百川技术团队选定了某一模型结构后,做了小、中、大三种参数的模型,然后观察不同参数之间的表现是否存在线性关系,如果符合 scaling law,后续就可以用该结构继续做各种数据实验、训练框架调优等。现在看,这条路百川走通了。 为了提升整体研发的成功率,百川团队把不同阶段的研发问题转化成为了评估问题,具体来讲就是把整...
百川智能的创始人陈炜鹏则表示,他们在ToB领域取得了不俗的成绩,通过开源工作,为大模型领域贡献了有力的影响力。未来,他们计划通过开源合作,进一步探索ToC领域,构建超级助手类产品,实现ToB和ToC两条腿前进。快手异构计算负责人刘凌志则强调了快手在大模型应用上的努力,特别是在搜索推荐广告和音视频创作领域。他们...
百川智能团队已有百人的规模,核心高管及很多员工均来自搜狗,包括前搜狗COO茹立云、前搜狗CMO洪涛、前搜狗搜索总经理陈炜鹏均已加盟。 王小川透露,百川智能首次融资时,估值已经超过5亿美元,下一轮融资,估值就会超过10亿美元。 2023年7月,百川智能发布参数量130亿通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Cha...
从百川智能定位的To B落地的视角来看,出于“未来80%的企业都需要使用开源模型”的认知,开源、闭源在百川的技术路线里,都需要实现。开源模型,百川能让用户使用模型时更轻便、更灵活;但是从13B提升到53B,模型参数的增加,提高了企业推理部署时的难度。于是53B走闭源路线。如此一来,百川提供的接口更直接、更简单,...