孙茂松指出,尽管大语言模型的定位是在工作中辅助人类,但它仍将在工作中取代一部分人——尤其是低端工作者——并对文本和图像行业造成较大影响。他表示,艺术家培养是金字塔式的结构,艺术家在行业顶端,而行业的下游由艺术设计等职业构成就业市场。但在大语言模型出现后,行业下游将会受到冲击。“为了培养顶端艺术家...
孙茂松表示,这一问题伴随着技术出现,需要辩证看待。 此外,孙茂松认为,以ChatGPT为代表的大语言模型创造了一种全新的创新模式,让人类不再需要自己去想,而是从模型生成的大量候选中去挑选,这样可以突破人类自身的局限和惯性,发现更多的可能性和创意,这种模式不仅适用于文学领域,也适用于自然科学领域,如新材料、基因科学等...
孙茂松表示,这一问题伴随着技术出现,需要辩证看待。 此外,孙茂松认为,以ChatGPT为代表的大语言模型创造了一种全新的创新模式,让人类不再需要自己去想,而是从模型生成的大量候选中去挑选,这样可以突破人类自身的局限和惯性,发现更多的可能性和创意,这种模式不仅适用于文学领域,也适用于自然科学领域,如新材料、基因科学等...
这与人才资源相关,孙茂松认为,中国并不缺少领域内的优秀人才,但缺少极少数顶尖的人才,“人工智能很明显的特点就是,最先进的东西是极少数特别有创意、水平特别高的人搞出来的,这块我们有明显的差距,所以我们一般只能跟跑,没有办法做到领跑,这是国内人工智能和国外最大的差距,这个差距不仅仅在人工智能领域,在几乎所有...
01清华大学人工智能研究院常务副院长孙茂松表示,中国大语言模型仍在“跟跑”状态,缺少顶尖人才。 02孙茂松指出,通用人工智能开始登上历史舞台,将不断拓展大模型各类垂直应用,如ChatGPT可能带来产业生态重新洗牌。 03然而,大语言模型也伴随着新挑战,如取代一部分工作,尤其是低端工作者,并对文本和图像行业造成较大影响。
近年来,清华大学计算机系孙茂松团队深入探索语言大模型参数高效微调方法的机理与特性,与校内其他相关团队合作完成的研究成果“面向大规模预训练语言模型的参数高效微调”(Parameter-efficient Fine-tuning of Large-scale Pre-trained Language Models)3 月 2 日在《自然・机器智能》(Nature Machine Intelligence)上发表。
活动中,发布了100多项语言康复与脑健康研究的科研成果和技术需求,多个校企成果转化、校企人才培养项目签约落地;“语言健康未来产业研究院”揭牌,清华大学—江苏师范大学“华章汉韵”大语言模型启动。清华大学教授孙茂松表示,该模型将专注于医疗健康垂直领域,推动语言康复与脑健康未来产业发展。江苏师范大学是江苏省和...
活动中,发布了100多项语言康复与脑健康研究的科研成果和技术需求,多个校企成果转化、校企人才培养项目签约落地;“语言健康未来产业研究院”揭牌,清华大学—江苏师范大学“华章汉韵”大语言模型启动。清华大学教授孙茂松表示,该模型将专注于医疗健康垂直领域,推动语言康复与脑健康未来产业发展。
孙茂松(左)、刘知远(右) 巧合的是,2018 年百度的 NLP 团队也为 BERT 所震撼,并几乎同时完成了一个预训练语言模型,率先发表在 arXiv 上,且同样起名「ERNIE」。两个团队都是按美国动漫片《芝麻街》的角色命名,因为此前的预训练模型如 ELMO、BERT 都是《芝麻街》里的角色。谷歌用了 BERT,他们的目标都是对标谷歌...
活动中,发布了100多项语言康复与脑健康研究的科研成果和技术需求,多个校企成果转化、校企人才培养项目签约落地;“语言健康未来产业研究院”揭牌,清华大学—江苏师范大学“华章汉韵”大语言模型启动。清华大学教授孙茂松表示,该模型将专注于医疗健康垂直领域,推动语言康复与脑健康未来产业发展。