机器之心:聂再清教授好,非常高兴您做客机器之心的《智者访谈》。我们知道您在自然语言处理和语音识别等方面有着深入的研究和实践,目前在清华大学智能产业研究院(AIR),主要从事生物医药相关的研究工作,并且在 AlR 孵化的公司水木分子担任首席科学家,很高兴能与您就 AI 赋能药物研发进行探讨。您之前讲过在药物研...
本期机器之心《智者访谈》邀请到清华大学聂再清教授,探讨他在将先进的自然语言处理技术应用于生物医药数据分析的创新实践。聂教授及其团队正致力于构建生物医药领域的基座大模型,通过对不同尺度和不同模态的数据进行建模及整合,建立起生物语言与自然语言之间的桥梁。 团队的目标不仅仅是实现自然语言与生物语言之间的翻译,...
聂再清,现任清华大学国强教授、智能产业研究院首席研究员。2004年获得美国亚利桑那州立大学博士学位,师从美国人工智能学会前主席Subbarao Kambhampati教授,本科和硕士毕业于清华大学计算机科学与技术系。2017年加入阿里巴巴,任阿里巴巴人工智能实验室北京负责人和阿里巴巴天猫精灵首席科学家。此前就职于微软亚洲研究院,任首...
聂再清:对,理论上是可以的,但从实践角度讲,基于现在这个大模型的能力,这样做可能不是最优的,现在最优的方法可能是给它一个小分子或者一个骨架,专家用自然语言说「如果更换这个骨架,或者提升某一个性能,需要做什么,给我一些建议」。甚至最好也不是从头生成一个分子,因为从头生成分子涉及到很多复杂的过程和反应,我...
本期机器之心《智者访谈》邀请到清华大学聂再清教授,探讨他在将先进的自然语言处理技术应用于生物医药数据分析的创新实践。聂教授及其团队正致力于构建生物医药领域的基座大模型,通过对不同尺度和不同模态的数据进行建模及整合,建立起生物语言与自然语言之间的桥梁。
聂再清:因为干实验一个最大的问题是,其结果是基于某一个数据集的,而那个数据集跟现实生活中的真实场景并不一定完全一致,所以基于这个数据集训练出的模型,用在真实场景时,有可能效果就差别很大,很难说一个精度 80%、90% 的模型在湿实验的结果里能具体代表什么。当然,我们可以去建一个非常通用的数据集,用以去提...
2020年年底,摘下阿里达摩院“大牛”的头衔后,聂再清加盟清华大学智能产业研究院(AIR),目前还担任着由AIR孵化的科技企业水木分子首席科学家的职位。近日,他带领的团队刚刚开源一款参数达百亿的可商用、多模态生物医药大模型BioMedGPT-10B,现已在多个生物医药问答基准数据集上实现SOTA,在专业领域的问答能力比肩人类...
事实上,在ChatGPT出现之前,也就是一年多以前,聂再清和团队就已经在筹备这一项目,目前清华AIR生命科学相关团队规模已经达到50人左右。对于BioMedGPT的未来,聂再清教授很有信心:预计两年内,这个模型应该会在小范围内具备一定影响力,至于像ChatGPT那样成为行业通用大模型,做到那样的影响力可能至少还需要3~5年。但...
这就是AI大牛、阿里天猫精灵首席科学聂再清,最新官宣的新动向——重返学界,加盟清华。更准确来说,是张亚勤组建的清华智能产业研究院(AIR)。聂再清也表达了对阿里的不舍和其“战友们”的感激之情:在过去三年多,有幸碰到一群非常优秀同事(从他们身上我学习了很多),一起把人工智能最前沿技术真正落到千家万户,...
聂再清教授在清华大学所带领的团队正在积极探索,以自然语言处理技术为基础,着眼于将生物语言与自然语言之间架起一座桥梁。他们的目标是创建一个智能助手,能够整合各类生物医药数据,提升药物研发的效率。就像一句古话所说:“授人以鱼不如授人以渔”,科学家们希望通过这样的助手,不仅能替代部分繁琐的实验,更能为...