本文由厦门大学、清华大学、微软研究者共同完成,论文共同一作为Zhenghao Lin和Zhibin Gou(苟志斌)。论文核心提出了一种新的名为RHO-1的语言模型预训练方法,它挑战了传统的预训练方法,即对所有训练tokens应用下一个token预测损失。其主要观点是,并非所有语料库中的tokens对于语言模型训练都同等重要。通过分析不同to...
首先就看到,按照不同领域不同主题,将此次4500篇接收论文情况可视化了。你可以进行一些宽泛的关键词搜索,比如Transformer architectures inspired by neuroscience(受神经科学启发的Transformer架构)有哪些?Papers at the intersection of neuroscience and math(数学与神经科学交叉的论文有哪些?)结果就几秒钟之内,就会...
论文链接:https://arxiv.org/abs/2409.18479 NeurIPS论文链接:https://neurips.cc/virtual/2024/poster/94391 代码链接:https://github.com/ACAT-SCUT/CycleNet 点击文末阅读原文跳转本文arXiv链接 摘要 时间序列数据中存在的周期模式是进行长周期时序预测的关键。本文开创性地探讨了如何显式建模这种周期模式,以提升...
NeurIPS 2024最全论文清单已经出炉,共有15671篇有效投稿,接收率25.8%。约有 5-7% 的录用论文被选为口头报告,会议更侧重开创性工作(这些被选中的论文中有很多都反映了对道德人工智能和跨领域适应性的重视)。, 视频播放量 297、弹幕量 0、点赞数 1、投硬币枚数 0、收藏人
NeurIPS 每年都会吸引大量高水平论文投稿,2024 年共接收了15,671 篇论文,录取率为**25.8%**。本文汇总了paper list中与多模态相关的16篇论文,供读者探讨学习~ 1. Toward Robust Incomplete Multimodal Sentiment Analysis via Representation Factorization and Alignment ...
论文链接:https://openreview.net/forum?id=0NMzBwqaAJ 摘要:以前的语言模型预训练方法对所有训练令牌统一应用下一个令牌预测损失。我们挑战这一常规,提出“语料库中的所有令牌对语言模型训练的重要性并不相等”。我们最初的分析检查了语言模型的令牌级训练动态,揭示了不同令牌的不同损失模式。利用这些洞见,我们引入...
论文地址:https://neurips.cc/virtual/2024/poster/94631 论文概览 逻辑综合(Logic Synthesis, LS)是芯片设计流程中承上启下的关键环节,对芯片设计的效率和质量都具有重要影响。具体来说,逻辑综合旨在生成精准满足给定功能要求(如由电路输入输出对构成的功能真值表)的最优逻辑电路图,是 NP 难问题。为了求解该问题,...
让我们分别来看看NeurIPS 2024最佳论文都有哪些新成果? 视觉自回归建模优化 北大、字节跳动获得最佳论文: Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction 《视觉自回归建模:通过下一尺度预测实现可扩展图像生成》 ...
近期,人工智能领域的顶级会议——2024年神经信息处理系统会议(NeurIPS)拉开帷幕。会上收录的亚马逊论文,展示了其在人工智能研究领域的广泛性。 近年来,大语言模型(LLM)和其他基础模型在该领域占据主导地位,亚马逊的论文反映了这一趋势,涵盖检索增强生成、使用大语言模型进行代码生成、常识推理和多模态模型等主题...
第一篇论文: 题目:Frequency Adaptive Normalization For Non-stationary Time Series Forecasting 链接:https://neurips.cc/virtual/2024/poster/95063 arXiv:https://arxiv.org/abs/2409.20371 Github链接:http://github.com/icannotnamemyself/FAN. 一段话总结:核心在于如何解决时间序列预测中处理非平稳数据,即趋势...