11月16日,在Kimi正式上线一周年之际,月之暗面发布了最新数学模型k0-math,在多项基准能力测试中,k0-math的数学能力已经可以与全球领先的OpenAI o1-mini和o1-preview模型相媲美,甚至在中考、高考、考研以及入门竞赛题MATH等4个数学基准测试中超越了它们。尤其值得一提的是,在业界最常使用的数学能力基准测试MATH...
这次倒是学机灵了,而且很简单的比数值大小, Kimi 数学版都用上了 “ 为了进一步确认 ”“ 为了确保万无一失 ”“ 经过多种方法的验证 ” 这些话术, kuku 输出了二三十行。只不过当世超想再次追问的时候,出来的就不是 k0-math 模型了。当然,这只是个小插曲,既然官方都已经把 k0-math 的实力挑明,那咱...
11月16日,Kimi 正式发布新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 的数学能力可对标全球领先的OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等 4 个数学基准测试中,k0-math 初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大...
发布k0-math也反映出月之暗面现在的着重点——提升模型的深入思考能力、基于强化学习的Scaling Law。杨植麟表示最近Kimi探索版还运用强化学习技术创新搜索体验,提升了意图增强、信源分析和链式思考三大推理能力。k0-math模型和更强的Kimi探索版,未来几周就将分批陆续上线Kimi网页版和Kimi智能助手APP。除新产品外,杨植麟...
Kimi的k0-math和K1都特别强调了在教育场景中的数学能力和“识题”能力。从用户层面看,这些能力在教育应用场景中有实用价值,毕竟学生群体是Kimi重要的基本盘用户。所以,一方面在市场投放上保持激进,另一方面则将产品研发资源集中投入到核心功能上。没有全面对标OpenAI,但先把对标o1这件事做了,有点“好钢用在刀刃...
继 Kimi 探索版 10 月开放之后,这家公司在 11 月 16 日交上又一份答卷:Kimi 的最新一代推理模型 k0-math,在数学能力已实现对标 OpenAI o1-mini 和 o1-preview。这是 Kimi 推出的首款推理能力强化模型,k0-math 同样采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升了解决...
11 月 16 日,在 Kimi 全面上线一周年之际,月之暗面推出了基于推理强化的数学模型 k0-math,以及 Kimio 探索版的一系列新功能,新推出的 k0-math 数学模型测试成绩超越 o1。 官方称,2024 年 10 月,Kimi 智能助手全平台活跃用户超过 3600 万,k0-m...
11月16日,Kimi率先交出国内首份答卷。据介绍,相较于以尽快提供答案为关键目标的常规模型,新推出的k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。发布会上,月之暗面公布了k0-math的目前测评得分:在业界最常使用的数学能力基准测试MAT...
现场,月之暗面旗下Kimi发布新一代数学推理模型 k0-math,是Kimi 推出的首款推理能力强化模型,也是杨植麟技术路线思考的直观体现。在他看来,行业接下来的重点是强化学习,技术范式会发生变化。k0-math 模型采用强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,提升解决数学难题的能力。在业界最常使用的数学...
11月26日下午,Kimi上线了k0-math 模型驱动的 Kimi 数学版,官宣文非常简单,一共3张图,1张主题,1张入口,1张能力测评,Kimi用数据说话,直接对标了Chatgpt正当红的o1-mini模型,主打一个“人狠话不多”。或许是为了面向更多的用户,官方还提供了玩法思路:“听说 Kimi 数学版不只会数学,就像《生活大爆炸》...