多模态指令数据benchmark:LLaVA-Bench ; GPT-assisted Visual Instruction Data Generation 给定图像Xv及其标题Xc,使用GPT-4生成该图片的一系列问题集Xq; 通过该方式生成图文对的指令数据: Human:XqXv<STOP>Assistant:Xc<STOP> 通过上述方式可以方便便捷的创建指令数据,但是多样性和指令的推理深度不够;针对该问题,我...
(貌似diffusion是ELBO不是他首创,也可能本身就是,只是变种不是,没研究) 评价:好像不太行啊,也可能cv都关注实验,能把work们总结起来就很好。66889 对我:可能这个distaug可以用在设计fancy的representation上,但没有适配的问题。 Fine-Tuning Language Models with Just Forward Passes 就是zeroth-order,调整了一下算法...
NeurIPS的录用门槛极其严苛,获得这个奖的难度有多高呢? 据数据统计显示,以2023年为例,大会收到12,343篇投稿,最终接受率为26.1%。而能够入选口头报告(Oral)的论文更是凤毛麟角,通常不到1%。 在这样的背景下,VAR论文不仅入选Oral,还以近乎满分的评审分数(7,8,8,8)摘得最佳论文桂冠,其学术分量可见一斑。田柯...
NeurIPS的录用门槛极其严苛,获得这个奖的难度有多高呢? 据数据统计显示,以2023年为例,大会收到12 343篇投稿,最终接受率为26.1%。而能够入选口头报告(Oral)的论文更是凤毛麟角,通常不到1%。 在这样的背景下,VAR论文不仅入选了Oral,还以近乎满分的评审分数(7,8,8,8)摘得最佳论文桂冠,其学术分量可见一斑。田...
第三篇是H2O论文被NeurIPS 2023接收! H2O表明,我们可以在KV缓存中删除80%的token,但下一个token预测的困惑度保持不变!这将大大降低你的推理成本。 论文地址:https://arxiv.org/pdf/2306.14048.pdf Oral:数学定理证明器LeanDojo 更重磅的是,加州理工、英伟达、MIT等机构的学者,构建了一个基于开源LLM的定理证明器...
ICCV 2023 Oral | 突破性图像融合与分割研究:全时多模态基准与多交互特征学习 听我说,Transformer它就是个支持向量机 HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法 南科大提出ORCTrack | 解决DeepSORT等跟踪方法的遮挡问题,即插即用真的很香 ...
NeurIPS 2023 | October 2023 Publication Bridging Discrete and Backpropagation: Straight-Through and Beyond Liyuan Liu, Chengyu Dong, Xiaodong Liu, Bin Yu, Jianfeng Gao NeurIPS 2023 (Oral) | December 2023 Publication Github Causal Effect Regularization: Automated Detection and Removal of Spurio...
15:40–16:40Talk session Oral 2A Efficient Learning Poster Session: December 12 Related Publications Bridging Discrete and Backpropagation: Straight-Through and Beyond Liyuan Liu, Chengyu Dong,Xiaodong Liu, Bin Yu,Jianfeng Gao Friday, December 15, 2023 ...
据数据统计显示,以2023年为例,大会收到12343篇投稿,最终接受率为26.1%。而能够入选口头报告(Oral)的论文更是凤毛麟角,通常不到1%。 在这样的背景下,VAR论文不仅入选了Oral,还以近乎满分的评审分数(7,8,8,8)摘得最佳论文桂冠,其学术分量可见一斑。田柯宇北大同一实验室的同学对腾讯科技表示,此论文为第一篇来...
Description This repository is the official implementation of theNeurIPS 2023 - Machine Learning for Audio Workshop (Oral)Zero-shot audio captioning with audio-language model guidance and audio context keywordsbyLeonard Salewski, Stefan Fauth,A. Sophia Koepke, andZeynep Akatafrom theUniversity of Tübin...