胡延平:大语言模型的单位智能的训练和推理成本一直在持续降低,DeepSeek的贡献是这个趋势的一部分,促使思考和重估算力基础设施投资。英伟达股价受到影响,已经有所下调,但是正在到来的多模态、时空智能、面向物理现实世界的模型更吃算力。实质上,包括DeepSeek在内的AI大模型的用户数量正在大幅增长,AI应用进入快速导入期...
他认为,Deepseek几乎每一个有所突破的方向都不是首创,但DeepSeek在这几个重要方向都有进一步创新。 他提到,尽管DeepSeek的模型降低了算力需求,但胡延平强调,算力与硬件不仅没有被削弱,反倒在增强,总体趋势是算力需求依然呈现大幅增长。 对于DeepSeek及其他低成本、高效能、开源模型带来的影响,胡延平指出,以基座模型为...
由盘古智库主办的“DeepSeek之爆对中国创新路径的启发研讨会”于2月12日在北京举行。盘古智库学术委员,DCCI-未来智库与FutureLabs-未来实验室首席专家胡延平出席并演讲。胡延平指出,DeepSeek在出现不到两个月的时间,产生了很明显的对业态带动的作用。一个是很多个人开始部署自己的端侧模型。二是企业开始自己在场景里...
DeepSeek不仅处于古典LLM范畴,呈现的其实再一次以及又一次是“我们一直最擅长的”性价比。4.从训练到推理,量大管够、丰俭由人但限量消费,是其产品逻辑,也是DeepSeek-V3呈现较高费效比的关键(局部不稳定因此也是必然)。14.8T高质量token打底,基本水准差不了,671B的MoE把参数拉到顶,实际使用过程中每token...
FutureLabs未来实验室首席专家胡延平表示,DeepSeek已经成为了一种效应,包含了四个方面,即算力成本效应、用户引爆效应、信心提振效应和开源生态效应:“接下来会出现一个新的现象,很多略有实力的相关企业都会基于基座大模型来做各种各样的后训练、蒸馏微调、结合知识库等等,然后去面向千行百业,形成一个AI 2.0时代大模型产...
一方面是 FBI 抄家中国计算机安全和 AI 科学家,另一方面是 x 的美国 AI 工程师 @TheAhmadOsman 4/1 发帖感谢 deepseek ,感谢中国。是中国的论坛提供的方案,让他把 3090 的显存升级到了 192 GB 显存!!!而且这哥们一口气改了 14 张,组了一个 2688GB 显存的加速算力集群!!!在家里。。。 ....
对于DeepSeek及其他低成本、高效能、开源模型带来的影响,胡延平指出,以基座模型为基础,后训练、微调以及与检索增强生成(RAG)、智能体(Agent)等结合的个性化垂类模型及其应用场景,很快将成为一个数量庞大的后市场。 对于AI的未来发展方向,胡延平认为,通用人工智能(AGI)、超级人工智能(ASI)不是终极目标,也不是根本目的...
但站在第二或第三个周期的角度去看,这些都可能是下一个重要的里程碑。因为避免广告嫌疑,我就不一一提名字了。总之,AI 中国的崛起是全方位的,DeepSeek 只是其中一个点。 我觉得我们不能把 DeepSeek 看成是“一切”,它只是一部分。因此,我们要更加理性、全面地去看待这件事。还有一点,站在算力的角度,如果从...
近日,中国AI初创公司深度求索(DeepSeek)训练出性能可与海外头部企业模型相媲美的模型,吸引全球目光。该模型降低了算力需求,但FutureLabs未来实验室首席专家胡延平在接受每经记者采访时指出,算力与硬件仍在增强。他同时提到,低成本、高效能的技术创新,促使思考和重估算力基础设施投资,AI应用进入快速导入期。未来,AI将走向...
由盘古智库主办的“DeepSeek之爆对中国创新路径的启发研讨会”于2月12日在北京举行。盘古智库学术委员,DCCI-未来智库与FutureLabs-未来实验室首席专家胡延平出席并演讲。 胡延平指出,DeepSeek在出现不到两个月的时间,产生了很明显的对业态带动的作用。一个是很多个人开始部署自己的端侧模型。二是企业开始自己在场景里...