本文作者:杨镐,中国人民大学高瓴人工智能学院博士生。 因果效应估计的目标是评估不同治疗措施对群体或个体产生的因果影响。本文整理了发表在ICML 2024会议上的12篇相关学术论文,供大家交流与参考。[1] StableMa…
本文作者张亚彬,中国人民大学高瓴人工智能学院博士生。 引言本文总结了2024年第四十一届国际机器学习会议ICML关于推荐系统主题相关的8篇研究论文,涵盖了大规模推荐的scaling law探索、大规模推荐的嵌入崩溃问题…
基于大语言模型(LLMs)的智能体是大语言模型的研究热点之一。它们在模拟人类语言处理能力、执行复杂任务以及与环境互动方面展现出巨大潜力。本文汇总了ICML'24中录用的17篇与大语言模型智能体相关的论文,供读者参考。 Should we be going MAD? A Look at Multi-Ag...
研究发现,它可以自发模拟一些概念,方便理解。这项研究意味着,大模型未来有希望更深入理解语言和世界,论文已被顶会ICML 24接收。这篇论文的作者是MIT计算机与人工智能实验室(CSAIL)华裔博士生Charles Jin和他的导师Martin Rinard教授。研究当中,作者让大模型只学习代码文本,结果发现模型逐渐掌握了其背后的含义。Ri...
最近读论文发现时间序列研究中,模型的轻量化是目前一个比较热门的方向。 这篇论文提出了SparseTSF,一种极其轻量的长时间序列预测(LTSF)模型,旨在解决在有限计算资源下建模复杂时间依赖关系的挑战。SparseTSF的核心是跨周期稀疏预测技术,该技术通过将时间序列数据的周期性和趋势解耦,简化了预测任务。具体来说,该技术通过...
论文介绍了一个旨在利用SNNs进行时间序列预测任务的框架。通过一系列实验,证明了所提出的基于SNN的方法在时间序列预测方面的有效性,在多个不同的基准数据集上与传统的时间序列预测方法相比,展现出了可比的性能,同时在能源消耗上实现了显著降低。此外,分析实验揭示了SNN捕获时间序列数据中时间依赖性的能力,这一发现突显了...
2. ICML2024高分论文!大模型计算效率暴涨至200%,来自中国AI公司 “后ChatGPT”读书会 2022年11月30日,一个现象级应用程序诞生于互联网,这就是OpenAI开发的ChatGPT。从问答到写程序,从提取摘要到论文写作,ChatGPT展现出了多样化的通用智能...
针对当前问题,清华大学AIR与商汤研究院等提出一种decision-centric的多模态表征预训练方法DecisionNCE,清华大学智能产业研究院(AIR)四年级博士生李健雄为论文一作。与DecisionNCE相关论文获评ICML 2024 MFM-EAI workshop杰出论文奖。 DecisionNCE可实现在数据稀缺场景下的高泛化、轻量级具身智能体学习。利用易获取的领域外...
[ICML'24 Oral] The official code of "DiJiang: Efficient Large Language Models through Compact Kernelization", a novel DCT-based linear attention mechanism. - YuchuanTian/DiJiang
Official Implementation of EAGLE-1 (ICML'24), EAGLE-2 (EMNLP'24), and EAGLE-3. arxiv.org/pdf/2503.01840 Topics large-language-models llm-inference speculative-decoding Resources Readme License Apache-2.0 license Activity Custom properties Stars 1.1k stars Watchers 23 watching Forks ...