那我想请问,为什么直到最近openai才蒸馏出o3mini,而且从calibration error上看ds-r1可谓是一骑绝尘啊?链接 用魔法打败魔法!伯克利博士用30美金复制DeepSeek 编辑于 2025-02-02 05:32・IP 属地贵州 赞同 分享收藏 写下你的评论... 还没有评论,发表第一个评论吧登录...
这种窗外灰蒙蒙一片大气间的混沌,也“触景生情”式的让我不由自主的对当下强化学习(RL)驱动下推理模型的一些潜在挑战、混乱(ps:相比于昨天DS发布的R1推理理论利润率所引起的两家清华系企业大佬间的争论,也许也不那么混乱哈哈)以及未来的技术路线与发展趋势产生了一些不安,因此今天决定忙里偷闲,还是尝试从第一性原理...
抖音号:iced.coffeeIP属地:上海23岁 最新作品发布时间:2024-12-20 12:06 私信关注 关注私信 作品4 喜欢3200 搜索Ta 的作品 视频 日期筛选 82 #檀健次代言好欢螺螺蛳粉 抽了好多大奖😂😂 #檀健次代言好欢螺螺蛳粉 抽了好多大奖😂😂 102 我们成都见 #檀健次 #再多见一次南京站#檀健次多见一次巡...
搞点免费的Token,后面给大家更新数据集,哈哈哈。中文满血R1蒸馏数据:开源中文DeepSeek-R1(满血)蒸...火山引擎 DeepSeek-R1 满血版,使用我的注册码注册,就得 15 元代金券、相当于 375 万 tokens,而我也能得到 750 万 tokens!link: 链接 发布于 2025-02-21 14:29・IP 属地日本 ...