但由于“套壳”本身并没有清晰、准确的定义,导致行业对套壳的理解也是一千个读者有一千个哈姆雷特。当我们在谈论套壳的时候,到底在谈论什么?抛开具体场景谈套壳都是在贴标签。为了厘清大模型套壳的逻辑,「甲子光年」访谈了一些AI从业者、投资人,结合 OpenAI、Meta 以及国内大模型相关技术论文,从一个大模型的...
注:在下文中,“源模型”是指从头训练的LLM(即论文中victim model),如Llama、Qwen等;“被测模型”(即论文中的suspect model),分为两类——基于源模型开发/训练的“衍生模型”和其他“无关模型”。REEF的目标是,给定一个被测模型,检测其是否是来自“源模型”的“衍生模型”,即所谓的“套壳”模型。...
在国产大模型“套壳”已经成普遍现象,并且将来极有可能成为常态的情况下,所有投资人都不得不面对一个问题,那就是:如果硬是要在这些“套壳”的大模型公司里,物色可投资的企业,那应该怎么选?在考虑这个问题时,有一个非常重要的因素,即:这些套壳的大模型公司,究竟是完全依赖于“套壳”,没有任何自主研发...
但由于“套壳”本身并没有清晰、准确的定义,导致行业对套壳的理解也是一千个读者有一千个哈姆雷特。 当我们在谈论套壳的时候,到底在谈论什么? 抛开具体场景谈套壳都是在贴标签。为了厘清大模型套壳的逻辑,「甲子光年」访谈了一些AI从业者、投资人,结合 OpenAI、Meta 以及国内大模型相关技术论文,从一个大模型的“...
快科技4月3日消息,据媒体报道,在近期的中国数字经济发展和治理学术年会(2024)上,清华大学苏世民书院院长、人工智能国际治理研究院院长薛澜教授在演讲中表示,中国不少大模型都是“套壳”。薛澜称,目前中国AI发展态势基本平稳,国内有超过130个大模型,尽管单从量上讲进步很大,但实际上中国大模型还存在不少问题...
最近,阿里巴巴前副总裁兼首席AI科学家、知名AI框架师贾扬清发朋友圈,爆锤国内某大厂,称其大模型是套壳Meta的LLaMA,即著名的羊驼。概括一下就是说:你要改名就改吧,但别玩掩耳盗铃的花样,免得其...
面对 AI 换衣大模型领域出现的套壳现象以及隐私侵犯、色情敲诈等乱象,行业内的反应迅速而强烈。许多专注于 AI 技术研发的企业纷纷发表声明,谴责这种不正当的行为。他们强调,套壳行为不仅违反了行业的道德规范,也破坏了公平竞争的市场环境。一家知名的 AI 企业在声明中表示:“我们一直致力于通过自主研发和创新,为...
近日,国内AI创业公司面壁智能的大模型被美国斯坦福大学AI团队套壳抄袭的事件在网络引起热议。事情的最新的进度是,斯坦福Llama3-V团队的两位作者Siddharth Sharma和Aksh Garg在社交平台上就抄袭行为向面壁智能团队正式道歉,并表示会将Llama3-V模型悉数撤下。相似内容的道歉信,已于几小时前被作者发出一次,但被迅速删除...
一是针对特定应用的模型“套壳”,二是训练数据的通用性问题。这两个方面对大型模型的未来发展有着深远...