注:在下文中,“源模型”是指从头训练的LLM(即论文中victim model),如Llama、Qwen等;“被测模型”(即论文中的suspect model),分为两类——基于源模型开发/训练的“衍生模型”和其他“无关模型”。REEF的目标是,给定一个被测模型,检测其是否是来自“源模型”的“衍生模型”,即所谓的“套壳”模型。...
但由于“套壳”本身并没有清晰、准确的定义,导致行业对套壳的理解也是一千个读者有一千个哈姆雷特。当我们在谈论套壳的时候,到底在谈论什么?抛开具体场景谈套壳都是在贴标签。为了厘清大模型套壳的逻辑,「甲子光年」访谈了一些AI从业者、投资人,结合 OpenAI、Meta 以及国内大模型相关技术论文,从一个大模型的...
10日晚间,Manus创始人季逸超在社交平台透露,Manus产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。而这也意味Manus产品并未自己研发大模型,而是站在了阿里千问大模型的“肩膀上”。值得注意的是,Manus最近在社交媒体火爆出圈,但是也一直遭到套壳的质疑。5日深夜,中国AI产品Manus一夜刷屏,这是全球首款真...
专家:中国不少大模型都是“套壳”快科技4月3日消息,据媒体报道,在近期的中国数字经济发展和治理学术年会(2024)上,清华大学苏世民书院院长、人工智能国际治理研究院院长薛澜教授在演讲中表示,中国不少大模型都是“套壳”。薛澜称,目前中国AI发展态势基本平稳,国内有超过130个大模型,尽管单从量上讲进步很大,...
Manus联合创始人透露底层大模型 AI“套壳”已成硅谷风口 据每经,周末,Manus在海外平台X上引发了广泛关注,多位科技界人士如推特联合创始人杰克·多尔西、Hugging Face产品负责人等大加称赞。Manus联合创始人季逸超透露,产品基于阿里千问大模型及Claude等模型微调而成。尽管如此,海外鲜少讨论“套壳”争议。硅谷已将...
非AI 从业者,视套壳如洪水猛兽;真正的 AI 从业者,对套壳讳莫如深。但由于“套壳”本身并没有清晰、准确的定义,导致行业对套壳的理解也是一千个读者有一千个哈姆雷特。 当我们在谈论套壳的时候,到底在谈论什么? 抛开具体场景谈套壳都是在贴标签。为了厘清大模型套壳的逻辑,「甲子光年」访谈了一些AI从业者、...
从大模型的训练过程来看,没有人会对架构选择——“套壳” Transformer 有异议。但围绕架构之后的预训练,成为了一个套壳与否的隐秘角落。 “原创派”与“模仿派” 预训练是大模型最核心的环节,也是“套壳”与“自研”争议较多的环节。 前面提到,模型架构只是大模型的菜谱——目前有 BERT、T5 与 GPT 三大菜谱,...
点点数据显示,一款集GPT-4、Claude、Bard、Gemini等顶尖模型于一身的智能应用Monica AI(以下简称Monica)于2023年7月上线。虽然只是个套壳产品,但无需通过访问Chat-GPT或OpenAI账户,而是直接用Google账户登录便可以使用。一年时间,全球下载量超130万,并在欧洲、拉美地区有着不俗表现,进入智利、墨西哥、法国等多...
一是针对特定应用的模型“套壳”,二是训练数据的通用性问题。这两个方面对大型模型的未来发展有着深远...