5月中旬,OpenAI推出新旗舰模型GPT-4o,凭借自然流畅的实时音视频交互震惊世界。仅仅一个多月之后,在我国一年一度的最大人工智能盛会WAIC 2024上,商汤科技正式推出日日新5.5,以及可进行流式多模态交互的5o版本,不仅多项测评超GPT-4o,还实现实时跨文本、音频、图像与视频推理。▲商汤日日新5.5多项核心指标测评...
一、多项测评超GPT-4o,日日新5.5亮相WAIC,连甩三大炸弹 国内首个对标GPT-4o,日日新5.5实现了核心指标的全面升级。 在MMB v1.1、MMStar、Math Vista、AI2D、OCRBench等多项全球权威测评中,日日新5.5的得分均超过GPT-4o。 升级版的日日新5.5展现出“五边形战士”的实力,语言和知识、推理数理、编程、考试五大能力,...
Vimi是商汤此次发布的一大C端主力产品,国内首个真C端可用、可控的人物视频生成大模型。而更有颠覆性的是国内首个所见即所得的模型——商汤“日日新5o”,实时多模态流式交互对标GPT-4o,开启了全新的AI交互模式。此外,商汤也加入了大模型价格战,近期推出了“大模型0元Go”计划,凡是“日日新”的新注册用户,...
7月5日,在商汤举办的“大爱无疆·向新力”论坛上,商汤科技董事长徐立在现场发布了大模型“日日新5o”,交互体验对标OpenAI最新发布的 GPT-4o。实时交互能力背后的支撑来自于商汤最新的基座模型。在会上商汤同时宣布大模型迭代到“日日新5.5”,其综合性能较上一代“日日新5.0”平均提升30%,在数学推理、英文能...
5月中旬,OpenAI推出新旗舰模型GPT-4o,凭借自然流畅的实时音视频交互震惊世界。 仅仅一个多月之后,在我国一年一度的最大人工智能盛会WAIC 2024上,商汤科技正式推出日日新5.5,以及可进行流式多模态交互的5o版本,不仅多项测评超GPT-4o,还实现实时跨文本、音频、图像与视频推理。
这些功能的实现,都是基于商汤训练的原生多模态大模型的能力。它能实时快速地处理多模态数据,从而让用户和AI的交互变得无比丝滑。商汤也第一次用中文界定了GPT-4o这样的交互方式——流式原生多模态交互模型。WAIC镇馆之宝——Vimi视频生成模型 而除了这个流式多模态大模型的展示之外,商汤还带来了他们视频生成的...
7月5日举行的2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)分论坛上,国内AGI公司商汤科技发布日日新大模型5.5系列。 其中,最引发关注的,是国内首个所见即所得、实时流式多模态交互模型“日日新5o”,交互体验对标GPT-4o,实现全新AI交互模式。另外,全新日日新5.5的模型参数规模达6000亿,综合性能较“日...
对标OpenAI GPT-4o的中国版本来了! 7月5日举行的2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)分论坛上,国内AGI公司商汤科技发布日日新大模型5.5系列。 其中,最引发关注的,是国内首个所见即所得、实时流式多模态交互模型“日日新5o”,交互体验对标GPT-4o,实现全新AI交互模式。另外,全新日日新5.5的...
近日,商汤科技全面升级“日日新5.5”大模型体系,发布国内首个所见即所得模型“日日新5o”。 据悉,“日日新5o”成功实现了实时的流式多模态交互,交互体验对标GPT-4o,实现全新AI交互模式。 作为大模型应用落地的“先行者”,商汤科技不断布局垂直领域应用,将大模型和千行百业有机结合,并借此整合高阶思维链数据,打造...
5月中旬,OpenAI推出新旗舰模型GPT-4o,凭借自然流畅的实时音视频交互震惊世界。 仅仅一个多月之后,在我国一年一度的最大人工智能盛会WAIC 2024上,商汤科技正式推出日日新5.5,以及可进行流式多模态交互的5o版本,不仅多项测评超GPT-4o,还实现实时跨文本、音频、图像与视频推理。