一天后,商汤发布了日日新5.5大模型体系。具体来看,日日新5.5大模型体系包括6000亿参数基础模型日日新5.5,性能提升30%;流式多模态交互模型日日新5o,是国内首个所见即所得模型,可进行实时多模态交互和问答;日日新5.5Lite也在端侧模型进行了升级。商汤日日新大模型与行业结合,推出面向不同行业场景的大模型应用。
OpenCompass 多模态评测包含八个核心数据集,从多种视角客观量化多模态大模型的能力。此次评测中,商汤日日新在几乎所有维度上都达到或超过GPT-4o水平,其中四个维度上(MMStar、MathVista、OCRBench、MMVet)排名全球第一。OpenCompass大模型开放评测体系是上海人工智能实验室推出的,拥有完整开源可复现的评测框架,定期...
1月10日,商汤正式推出“日日新”融合大模型,实现原生融合模态,深度推理能力与多模态信息处理能力均大幅提升。根据国内大模型测评机构SuperCLUE最新发布的《中文大模型基准测评2024年度报告》:商汤“日日新”融合大模型以总分68.3的成绩,与DeepSeek V3一起并列国内榜首。
商汤AI大装置SenseCore是国内训练大模型最为先进的基础设施,在2023年实现了对万亿参数大模型的生产支持,还在互联规模、加速效率和稳定性上保持业界领先水平,更实现了推理服务极致优化。商汤“日日新”大模型能力升级:商汤“日日新”大模型能力每隔三个月就会显著提升。2024年2月推出的“日日新4.0”性能的显著提升,在...
自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构,推理时上下文窗口可以有效到200K左右。本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,...
4月23日,在2024商汤技术交流日上,商汤科技董事长兼CEO徐立发布行业首个云、端、边全栈大模型产品矩阵,满足不同规模场景应用需求;升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。“商汤在尺度定律的指导下,持续探索大模型能力的KRE(知识-推理-执行)三层架构,突破大模型能力边界。”徐立...
日日新·商量大语言模型(SenseChat V4)是商汤科技发布的最新版本的大语言模型,具备更强的通用能力,包括知识理解、阅读理解、综合推理、数理、代码和长文本理解等领域。发展历史 2024年1月,商汤科技发布的日日新·商量大语言模型-通用版本(SenseChat V4)。主要功能 日日新·商量大语言模型是一种先进的人工智能语言...
7月7日,在2023世界人工智能大会(WAIC)上,商汤科技作为大会战略合作伙伴举办了“大爱无疆·日日新”人工智能论坛,现场重磅推出 “商汤日日新SenseNova”大模型体系的多方位全面升级,以及在该体系下的一系列大模型产品更新和落地成果。此外,商汤也着重介绍并展示了其大模型技术自正式发布以来与产业各方的应用实践,...
商汤科技(SenseTime)日日新SenseNova大模型,涵盖语言大模型和多模态全栈技术能力。商汤基于1.5万亿token和6000亿中文高质量数据,依托拥有30000+张GPU的商汤AI大装置SenseCore,训练20/100/120/180B 不同场景下大模型,推出国内首个综合能力超越GPT-3.5的大语言模型以及文生图大模型,服务上千家客户并实现模型相关...