近日,清华 KEG 实验室与智谱 AI 联合推出了视觉 GUI Agent——CogAgent,CogAgent 是一个通用的视觉理解大模型,具备视觉问答、视觉定位(Grounding)、GUI Agent 等多种能力,可接受 1120×1120 的高分辨率图像输入。在 9 个经典的图像理解榜单上(含 VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE 等)取得了通用能力...
作者| 凌敏 近日,清华 KEG 实验室与智谱 AI 联合推出了视觉 GUI Agent——CogAgent,CogAgent 是一个通用的视觉理解大模型,具备视觉问答、视觉定位(Grounding)、GUI Agent 等多种能力,可接受 1120×1120 的高分辨率图像输入。在 9 个经典的图像理解榜单上(含 VQAv2,STVQA, DocVQA,TextVQA,MM-VET,POPE 等)取...
新概念,智谱AI 智谱AI源于清华大学技术成果,创始团队此前一直在清华大学计算机系KEG实验室工作,长期密切关注、探讨下新一代人工智能技术会往哪个方向发展,我们基于“把过去十几年实验室的研究成果转化为落地...
据智谱AI首席执行官张鹏介绍,智谱AI源于清华大学技术成果,于2019年6月成立,创始团队此前一直在清华大学计算机系KEG实验室工作,实验室汇集了行业领军人才,一直密切关注、探讨下新一代人工智能技术会往哪个方向发展。“近十年时间,我们一直从事人工智能技术相关的研究和产业落地工作。”张鹏介绍,团队经常接触到人工智能...
成立于2019年的智谱AI是清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司。 智谱AI是少数全内资/国产自研的大模型企业,并且有明确的国产芯片适配计划,更适合中国企业。 智谱AI的创始团队背景深厚,由清华KEG(知识工程实验室)孵化而来,团队成员具有丰富的学术和研发经验。
IT之家12 月 27 日消息,清华 KEG 实验室近日和智谱 AI 合作,联合推出了新一代图像理解大模型 CogAgent。 该模型基于此前推出的 CogVLM,通过视觉 GUI Agent,使用视觉模态(而非文本)对 GUI 界面进行更全面直接的感知,从而作出规划和决策。 CogAgent 可以接受 1120×1120 的高分辨率图像输入,具备视觉问答、视觉定...
ChatGLM-6B是中文用户使用非常舒服的一个开源中文LLM。2023年5月17日,智谱AI和清华大学KEG实验室开源了...
智谱清言并不直接属于清华大学,但它是由清华大学计算机系知识工程研究室团队研发的。具体来说,智谱清言是源自清华大学KEG实验室技术成果,由北京智谱华章科技有限公司(智谱AI)基于GLM模型开发的AI提效助手。智谱AI成立于2019年,是一家专注于AI大模型研发的创业公司,其技术积累深厚,在自然语言处理、深度学习等领域取得了...
作为一名语言模型,CHATGLM-6B是在2022年由清华大学 KEG 实验室和智谱AI训练的大型语言模型,可以通过分析大量的文本来生成文本,帮助人们完成任务。我可以通过回答各种问题来展示自己的能力,包括语言处理能力、知识库和推理能力。 CHATGLM-6B可以帮助人们完成各种任务,如语言翻译、机器翻译、问答、文本生成等。我可以使用我...
智谱AI、智源研究院、月之暗面、循环智能,这些身处大模型热潮中心的公司,都与清华大学计算机系教授唐杰关系匪浅。唐杰教授光环加身,他既是清华大学计算机系知识工程实验室(KEG)带头人,同时是智源研究院学术副院长、悟道项目负责人。▲唐杰(图源:清华大学)事实上,最开始唐杰并不相信机器智能会超越人,他的主要...