做一个总结的话,在GLM-4-Plus的帮助下,我们的工作效率至少提升了300%,考虑到智谱已经在智谱清言上线了视频创作智能体清影,30秒即可将任意文字生成视频,让我们对GLM-4-Plus的能力有了更多的期待:也许在不久后,只需上传一份财报,就能自动生成视频快讯。03 人机交互的新范式,正被千万开发者定义 尽管我们的...
我们上传了PDF文件,并输入“总结报告中的核心信息”的指令后,GLM-4-Plus迅速给出了我们想要的信息: 其中有两个让我们眼前一亮的细节处理:原报告中单位是“千美元”,GLM-4-Plus在输出的总结内容中,自动将单位换算成了“百万美元”;“晶圆代工”的收入和增长并未体现在图表中,仅在“管理层讨论与分析”的篇末提...
一是语言理解能力,通过大规模语料库训练和优化算法,GLM-4-Plus在处理复杂语义上的表现较其他模型更加出色。借用测评博主toyama nao的结论:在难度较高的水果热量计算上(需要合理搭配水果,使总热量刚好在一个区间),大部分模型并没有真的懂题目,但GLM-4-Plus完全理解了题意,并采用逐步凑数的方法给出了正确答案...
我们在参数中指定模型使用 GLM-4-Plus,只和模型打个招呼,发送个“你好”。注意要使用你自己的 API 秘钥。 # curl --location 'https://open.bigmodel.cn/api/paas/v4/chat/completions' \ --header 'Authorization: xxxxxx' \ --header 'Content-Type: application/json' \ --data '{ "model": "GLM-...
鉴于GLM-4-Plus在上线前已经内测了一段时间,期间有不少技术博主曾进行评测,我们关注到了三个层面的能力提升。 一是语言理解能力,通过大规模语料库训练和优化算法,GLM-4-Plus在处理复杂语义上的表现较其他模型更加出色。 借用测评博主toyama nao的结论:在难度较高的水果热量计算上(需要合理搭配水果,使总热量刚好在一...
一是语言理解能力,通过大规模语料库训练和优化算法,GLM-4-Plus在处理复杂语义上的表现较其他模型更加出色。 借用测评博主toyama nao的结论:在难度较高的水果热量计算上(需要合理搭配水果,使总热量刚好在一个区间),大部分模型并没有真的懂题目,但GLM-4-Plus完全理解了题意,并采用逐步凑数的方法给出了正确答案,而且...
鉴于GLM-4-Plus在上线前已经内测了一段时间,期间有不少技术博主曾进行评测,我们关注到了三个层面的能力提升。 一是语言理解能力,通过大规模语料库训练和优化算法,GLM-4-Plus在处理复杂语义上的表现较其他模型更加出色。 借用测评博主toyama nao的结论:在难度较高的水果热量计算上(需要合理搭配水果,使总热量刚好在一...
我们上传了PDF文件,并输入“总结报告中的核心信息”的指令后,GLM-4-Plus迅速给出了我们想要的信息: 其中有两个让我们眼前一亮的细节处理:原报告中单位是“千美元”,GLM-4-Plus在输出的总结内容中,自动将单位换算成了“百万美元”;“晶圆代工”的收入和增长并未体现在图表中,仅在“管理层讨论与分析”的篇末提...
每隔一段时间,大模型行业都会传出新的消息。 先是在9月中旬,OpenAI在没有预告的情况下发布了o1模型的预览版;不到半个月后,国内的智谱发布了若干更新模型,其中就包括新的基座大模型GLM-4-Plus,也是智谱当前最强大的模型。 国外围绕o1模型的讨论和场景探索还在继续,也
按照清华大学基础模型研究中心发布的SuperBench九月综合榜单,GLM-4-Plus的综合能力排名前三,打破了过去被国外大模型垄断前三甲的局面,并在多个关键能力上保持了国际领先水平。 鉴于GLM-4-Plus在上线前已经内测了一段时间,期间有不少技术博主曾进行评测,我们关注到了三个层面的能力提升。