不过,并不像传说的那样——“弱智吧8项测试第一,远超知乎豆瓣小红书”“竟成最佳中文AI训练数据”。实际上,在Yi-34B大模型上表现上佳的,不单纯是“弱智吧”。具体来说,弱智吧只贡献了个标题。论文提到,研究团队收集了“弱智吧”上点赞数最多的500个帖子,并使用这些帖子的标题作为指令,使用GPT-4生成相应...
胡萝北说,没想到有一天弱智吧的段子会成为训练大模型的语料,“AI看似与普通人无关,但机器人其实是对人类的模仿,从某种程度而言我们每天都在为未来的AI投喂数据。”“弱智吧”里有数学博士、AI从业者、脱口秀演员...弱智吧的段子为什么对AI有如此奇效?胡萝北形容弱智吧是段子里的“基础科学”,因为段子里有很...
没错,论文中的Ruozhiba就是指百度贴吧弱智吧,一个充满荒谬、离奇、不合常理发言的中文社区,画风通常是这样的: 最离谱的是,弱智吧AI代码能力也超过了使用专业技术问答社区思否数据训练的AI,这下吧友自己都闹不明白了。 其他平台围观网友也纷纷蚌埠住。 这项研究来自中科院深圳先进技术研究院、中科院自动化研究所,滑...
在AI训练数据的选取中,人们通常倾向于使用那些具有高质量、高信息密度的数据集。然而,近期的一项研究却打破了这一常规认知,指出“弱智吧”竟然成为了最佳的中文AI训练数据。研究表明,使用“弱智吧”的数据训练的大模型在多项测试中取得了优异的成绩,包括问答、头脑风暴、分类、生成、总结、提取等8项测试,其表现...
也有诗人在弱智吧里冒充弱智写诗,用最简短的句子,给网友带来最强的杀伤力。 弱智吧的内容常用“逻辑反推”“谐音双关”“跨服聊天”等手法生成各种离谱的段子或幽默又带有思考的句子。普通人想看懂弱智吧里的问题也要思考一下,找到问题里的梗,更别说AI了。
这类荒谬却似乎又有一丝合理性的发言,往往来自于百度贴吧“弱智吧”。 近日,弱智吧数据在AI领域又多做了一份贡献。 由中科院深圳先进技术研究院、中科院自动化研究所,滑铁卢大学等高校、研究机构联合发布了一份高质量中文指令微调数据集。值得注意的是,在研究过程中,学者们发现,来自“弱智吧”的数据在其中有亮眼表现...
【贴吧官方X弱智吧】..最近,有很多AI大模型利用弱智吧文案进行AI的训练。为验证训练成果,我们挑选了三家国外AI(GPT,Claude,new Bing),三家国内AI(文心一言,通义千问,kimi),以及三位优秀弱智吧吧
【无法出院!#弱智吧称目前AI就是3岁小孩#】9月6日,上海,今年的外滩大会突破常规,创新者舞台邀请了流行于网络的“弱智吧”。弱智吧作为中科院认证的“中文AI训练数据库”,吧内文字往往有强逻辑性性,让一板一眼的...
有趣的是,弱智吧在所有子集中平均排名第二。我们推测这是因为它可以增强模型的逻辑推理能力,从而有利于大多数指令跟踪任务。 当然了,这次实验最大的意义还是在于COIG-CQIA数据集为自然语言处理(NLP)社区带来的启发,给中文大模型的开发提供了帮助。 弱智吧 AI届唯一真神 ...
弱智吧以其独特的创作手法闻名,如“逻辑反推”、“谐音双关”和“跨服聊天”等,不断产出令人捧腹的段子与富含哲理的句子。即便是普通人,要理解其中的幽默与深意也需一番琢磨,更不用说AI了。正因如此,弱智吧成为了人类在AI时代坚守的最后一片乐园。有人好奇,弱智吧的模型在编程方面表现如此出色,而吧内似乎并...