deepseek+llm+arxiv

2025-04-11 21:15:46

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

LLM推理暴涨,数学逻辑开挂!DeepSeek团队新大招Ai2大牛狂点赞

论文地址：https://arxiv.org/abs/2502.07316 项目主页：https://codei-o.github.io/ Lambert表示，非常高兴能看到DeepSeek团队成员撰写的更多论文，而不仅仅是有趣的技术报告。（顺便还调侃了一句自己真的想他们了）这篇论文的主题，是通过一种CodeI/O的方法，利用代码输入/输出，来提炼LLM的推理模式。值得注意...
用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构

近日，DeepSeek（深度求索）发布了一份基于硬件发展的实际情况及其多年实践经验的研究成果，其中提出了一些用于构建用于深度学习和 LLM 的 AI-HPC 系统的成本高效型策略。论文标题：Fire-Flyer AI-HPC: A Cost-Effective Software-Hardware Co-Design for Deep Learning论文地址：https://arxiv.org/pdf/2408.14158 ...
LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂...

他们提出的CodeI/O全新方法,通过代码提取了LLM推理模式,在逻辑、数学等推理任务上得到显著改进。如今,DeepSeek团队成员的一举一动,都颇受圈内关注。近日,来自DeepSeek、上海交通大学、香港科技大学的研究人员推出的全新力作CODEI/O,就获得了Ai2大牛Nathan Lambert的力荐! 论文地址:https://arxiv.org/abs/2502.0...
攻克DeepSeek LLM:一次AI论文阅读之旅-腾讯云开发者社区-腾讯云

这只是我个人的学习心得,基于对论文原文和社区讨论的理解和总结,难免会有疏漏和偏差。 DeepSeek LLM 的论文原文:https://arxiv.org/pdf/2401.02954 官方代码仓库:https://github.com/deepseek-ai 和大家一起探讨,共同进步。二、DeepSeek LLM 论文概述 ...
国外AI专家深度剖析:盛赞DeepSeek R1里程碑式成就!

不同的基于搜索的方法依赖于基于流程奖励的模型来选择最佳答案。来自 LLM Test-Time Compute 论文的注释图 https://arxiv.org/abs/2408.03314 DeepSeek R1 技术报告指出，其模型不使用推理时间缩放。然而，这项技术通常是在 LLM 之上的应用层实现的，因此 DeepSeek 有可能在他们的应用中应用它。我怀疑 OpenAI 的...
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025

俄亥俄州立大学的 Huan Sun 教授做了主题为“Understanding Reasoning in LLMs and Agents:From Grokking of lmplicit Reasoning to Test-Time Scaling with Verifiers”的演讲,探讨了从隐式推理的领悟到测试时通过验证器进行的扩展。首先来谈谈什么是隐式推理。论文链接:https://arxiv.org/abs/2405.15071 当模型...
LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂...

论文地址:https://arxiv.org/abs/2502.07316 项目主页:https://codei-o.github.io/ Lambert表示,非常高兴能看到DeepSeek团队成员撰写的更多论文,而不仅仅是有趣的技术报告。(顺便还调侃了一句自己真的想他们了) 这篇论文的主题,是通过一种CodeI/O的方法,利用代码输入/输出,来提炼LLM的推理模式。
LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞...

论文地址:https://arxiv.org/abs/2502.07316 项目主页:https://codei-o.github.io/ Lambert表示,非常高兴能看到DeepSeek团队成员撰写的更多论文,而不仅仅是有趣的技术报告。(顺便还调侃了一句自己真的想他们了) 这篇论文的主题,是通过一种CodeI/O的方法,利用代码输入/输出,来提炼LLM的推理模式。
DeepSeek LLM论文解读 - 知乎

题目:DeepSeek LLM: Scaling Open-Source Language Models with Longtermism 发布时间:2024 年 1 月论文地址:https://arxiv.org/pdf/2401.02954 一、前言 1、文章背景此文章为DeepSeek最重要的三篇论文中的第一篇,另外两个论文分别为《DeepSeek-R1:通过强化学习提升大型语言模型的推理能力》和《DeepSeek-V3:...
DeepSeek LLM 以长期主义理念扩展开源语言模型 - 知乎

2401.02954v1arxiv.org/pdf/2401.02954v1 摘要开源大语言模型(LLMs)的快速发展确实令人瞩目。然而,以往文献中描述的扩展规律得出了不同的结论,这为LLMs的扩展蒙上了一层阴影。我们深入研究了扩展规律,并提出了我们的独特发现,这些发现促进了在两种广泛使用的开源配置(7B和67B)中扩展大规模模型。在扩展规律...

快搜汉语词典

deepseek+llm+arxiv

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

LLM推理暴涨,数学逻辑开挂!DeepSeek团队新大招Ai2大牛狂点赞

用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂...

攻克DeepSeek LLM:一次AI论文阅读之旅-腾讯云开发者社区-腾讯云

国外AI专家深度剖析:盛赞DeepSeek R1里程碑式成就!

万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂...

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞...

DeepSeek LLM论文解读 - 知乎

DeepSeek LLM 以长期主义理念扩展开源语言模型 - 知乎

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索