无问芯穹成立于2023年5月,由清华大学电子工程系教授、系主任汪玉教授发起,汪玉的第一任博士毕业生夏立雪担任联合创始人兼CEO。其技术团队源起于清华大学电子工程系NICS-EFC实验室,在模型压缩、推理加速及硬件能耗优化等领域拥有深入的学术研究和深厚的工程实践经验,擅长模型轻量化、软硬件协同优化。该公司以“释放...
随着预训练语言模型的发展,模型的参数规模也不断增大,以提高模型的性能和泛化能力。 目前预训练语言模型主要有三种类型:自回归模型、自编码模型和编码器-解码器模型。 自回归模型从左到右学习语言模型,适合于长文本生成和少样本学习,但不能捕捉上下文词之间的双向依赖关系。 自编码模型通过去噪目标学习双向上下文编码器...
《2024年大模型综合能力评测报告-清华大学》整体来说,GPT-4系列模型和Claude-3等国外模型在多个能力上依然处于领先地位,国内头部大模型GLM-4和文心一言4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小。国外大模型中,GPT-4系列模型表现稳定,Claude-3也展现了较强的综合实力,在语义理解和作为智能体两...
智谱AI的历程始于2006年的清华实验室,当时清华知识工程实验室的一个团队发布了名为AMiner的科研情报挖掘产品。该技术由清华计算机系的知名教授唐杰带领,一经推出便积累了一批客户。 唐杰 张鹏 2019年,智谱AI正式成立,由CEO张鹏等人带领这支团队走出实验室,带领智谱AI发布了GLM系列大模型、ChatGLM、CodeGeeX代码大模型等...
2021年,由清华大学教授唐杰领衔,100余位人工智能科学家团队联合攻关的“悟道”系列大模型连创“中国首个+世界最大”纪录后,不仅迅速收获来自全球的关注,更激发了清华系创业的热潮,一批批校友从实验室迈向市场,积极探索大模型的商业化路径。 在追逐...
最高的国产大模型之一 从“实验”走向“市场” “智谱”面向公众上线 生成式视频功能“清影” 具备视频通话功能的软件“清言” 将前沿的科学技术转化成为 人人可用的AI助手 “智谱”公司的CEO 正是清华大学计算机系 1998级本科、2002级硕士校友 张鹏 让我们一起走近 ...
清华大学是全村最有希望的“仔” AI的竞争,本质是顶级人才的竞争,中国大模型创新还要看清华。 斯坦福大学李飞飞团队发布的《《2024年人工智能指数报告》(下称《报告》)在讨论全球AI模型的产生时,清华大学成为被提及为非西方机构中发布基础模型数量最多的学术机构之一,共发布了七个基础模型。
基于此,清华大学生物医学工程学院苑克鑫教授团队打造了一款脑启发 AI 模型(CTCNet,cortico-thalamo-cortical neural network)。图 | 苑克鑫(来源:苑克鑫)该模型的语音分离性能大幅领先于现有方法,不仅为计算机感知信息处理提供了新的脑启发范例,而且在智能助手、自动驾驶等领域有潜力发挥重要作用。苑克鑫表示...
该工作由字节跳动 ByteBrain 团队 × 清华大学合作完成。第一作者为清华大学三年级博士生谢哲,主要研究方向为时序多模态 LLM、异常检测和根因定位。第二作者和第三作者分别为李则言和何晓,均来自字节跳动。通讯作者分别为字节跳动研究科学家张铁赢和清华大学计算机系副教授裴丹。近年来,多模态大语言模型(MLLM)发展...
3. 创新性地以一种无需训练的方式将代理注意力应用于 Stable Diffusion 模型,显著提升生成速度并提高图片质量,为扩散模型的加速和优化提供了有效的新研究思路。