11月16日,Kimi 正式发布新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 的数学能力可对标全球领先的OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等 4 个数学基准测试中,k0-math 初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大...
AI技术正进入推理能力优化的新阶段,Kimi 再次站上浪潮之巅。继Kimi探索版 10 月上线后,11 月 16 日,Kimi发布了新一代数学推理模型k0-math,并正式推出具备三大推理能力的全新Kimi探索版。k0-math是Kimi推出的首款强化推理模型,具备媲美OpenAI o1-mini的数学能力。通过引入强化学习与思维链技术,k0-math模拟人脑...
根据上图,在多项基准能力测试中,k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等 4 个数学基准测试中,k0-math 初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME ...
在Kimi 网页版中,选择侧边栏的“眼镜”图标,即可使用基于 k0-math 模型的 Kimi 数学版,官方称后续会推出手机版。 官方表示,数学公式推荐使用 LaTeX 格式,可以截图或拍照给 Kimi 常规版,让 Kimi 把图片转为 LaTeX 格式,然后复制题目给 Kimi 数学版即可。
虽说k0-math是主攻数学能力的模型,但单纯的代数和几何,不足以全面展现它的逻辑推理深度。和其他科目不同,数学题有确定的标准答案。但正确答案并不总是逻辑推理的结果,有时可能只是“题海战术”的胜利。大模型就像是一个过目不忘的小镇做题家,做完了市面上的所有辅导资料,碰到原题,自然能对答如流。但新试题稍微...
一年前,Kimi凭借“长文本”功能在中国AI应用市场崭露头角。一年后,Kimi再次带来惊喜,发布了基于强化学习的数学模型k0-math,其数学能力比肩甚至超越了OpenAI的o1系列模型。这次技术飞跃不仅是Kimi自身发展的重要里程碑,也预示着AI技术范式的重大转变——从静态数据预测转向动态的强化学习。K0-math的技术突破与意义 k0...
月之暗面Kimi智能助手宣布推出新一代数学推理模型k0-math。k0-math模型在多项数学基准能力测试中表现突出,其成绩在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中超过了OpenAI o1系列的o1-mini和o1-preview模型。特别是在MATH测试中,k0-math模型得分93.8,仅次于o1完全版的94.8分。尽管在竞赛级别...
今天,在京东科技大厦,月之暗面创始人杨植麟宣布 Kimi 数学模型 k0-math 正式发布,其数学能力对标 OpenAI o1 系列,还公布了截止 2024 年 10 月 Kimi 月活超过 3600 万。 杨植麟称未来会更关注基于强化学习的方法去 scale,不仅仅是简单地预测下一个 token 是什么,因为这是基于静态数据集,使得大模型不能完成更难...
IT之家 11 月 16 日消息,综合第一财经,新浪科技消息,月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型:o1-mini 和 o1-preview。月之暗面创始人杨植麟认为,最适合让 AI 去锻炼思考能力的场景就是数学场景。IT之...