值得一提的是,获得杰出数据集和基准论文奖的《MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge》,由美籍华裔院士、斯坦福大学教授李飞飞的两位弟子范麟熙(Linxi Fan,一作)和朱玉可(Yuke Zhu,联合advisor)等人完成。NVIDIA AI研究科学家范麟熙 这篇文章通过引进一种建立在《我的世...
最后,RL也看到了在芯片设计等领域的成功应用,有相当多关于该主题的论文。1、 Using natural language and program abstractions to instill human inductive biases in machines 💡元学习代理可以通过与语言描述和程序归纳的表示进行联合训练来学习人类归纳偏见。2、 MineDojo: Building Open-Ended Embodied Agents with...
自提升离线强化学习 论文链接:https://www.microsoft.com/en-us/research/publication/bootstrapped-transf...
1、训练计算最优的大语言模型 一句话总结:提出一个700亿规模的新语言模型“Chinchilla”,效果比千亿级别GPT-3、Gopher更强。Jim表示,通过这个模型,研究人员证明了想要实现“计算最优”,模型大小和训练数据规模必须同等缩放。这意味着,目前大多数大语言模型的训练数据是不够的。再考虑到新的缩放定律,即使将模型...
在这篇 NeurIPS2022 论文中,来自上海交通大学、上海人工智能实验室、南加州大学的研究者提出新一代通信高效的协作感知方法,可将带宽占用降低为十万分之一。盲人摸象的寓言启示着我们,个体对世界的感知具有不可避免的局限性,有效的协作是打开视野和格局的重要途径。因此,协作感知应运而生:多个集 “感 - 传 - ...
本论文主要贡献:本论文提出了一种基于反标签学习的半监督少样本图像分类学习方法。 方法具体如下:步骤1,构造元任务,使用预训练的神经网络作为特征提取器用来提取图像数据,提取元任务中支持集、查询集以及无标签数据集对应的特征,并在支持集上训练一个分类器,用于后续图像分类任务;步骤2,反标签学习模块以较高的...
1 杰出论文奖:Is Out-of-Distribution Detection Learnable?作者:Zhen Fang、Yixuan Li、Jie Lu、 Jiahua Dong、Bo Han、Feng Liu 关键词: AI 可靠性 监督学习的目的是在训练和测试数据来自同一分布的假设下训练一个分类器。为了缓解上述假设,研究人员研究了一个更现实的环境:分布外(OOD)检测,重点是这种...
就在今天,NeurIPS 2022杰出论文奖公布了!与它一同公布的还有数据集和测试基准(Datasets & Benchmarks)最佳论文奖以及时间测试奖。NeurIPS 2022将于下周一在新奥尔良会议中心举行,为期两周,第一周线下进行,第二周线上进行。杰出论文奖 对比去年,今年杰出论文的数量翻了一番,从去年的6篇变为今年的13篇。在...
2672篇主要论文,63场研讨会,7场受邀演讲,包括语言模型、脑启发研究、扩散模型、图神经网络……NeurIPS包含了世界级的AI研究见解,本文将对NeurIPS 2022做一个全面的总结。 第36届Neural Information Processing Systems Conference(NeurIPS)已经收官一个月了,我们这里整理了他的2672篇论文,163篇Datasets & Benchmark跟踪论...
2022年SSL中最亮眼的应该是DeepMind的Chinchilla:一项关于语言模型的预训练预算应该花多少在模型参数上,以及在更大的训练语料库上花多少钱的研究(发现大多数大型LM都太大或训练不足),最后得到了一个模型Chinchilla,包含了70B参数的LM,并且通过更长训练时间而优于其较它的对手。 最后,我们也不能错过用于信息检索的全...