近日,来自JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。 ...
我花了3个月的时间整理了包括CVPR 2023/2024、ECCV 2023、ICML 2023、ICLR 2024/2023、NeurIPS 2023、ACL 2024、EMNLP 2023、AAAI 2024/2023、WWW 2023/2024等顶会在内的超过20000篇人工智能优质论文,今天一次性分享给大家。 为了方便...
林俊旸,阿里巴巴高级算法专家,目前为通义千问开源负责人。他的研究领域包括自然语言处理和多模态表示学习,研究兴趣集中于大规模多模态预训练,在NeurIPS、ICML、ACL等多个顶级会议发表多篇论文,Google Scholar引用量4000+。近期工作为研发通义千问大模型(Qwen),包括大规模预训练和对齐,并推动大模型与多模态及外部系统的...
Qwen2-Audio可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。该模型在多个权威测评中都显著超越先前的最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL 2024。(36氪)...
AI天才少女罗福莉近日公开表态,拒绝被公众神化或娱乐化。罗福莉,这位从小城市高中考入北京大学,后在AI领域崭露头角的年轻女性,以其卓越的才华和谦逊的态度引发了广泛关注。她曾在国际顶级会议ACL上发表多篇论文,并在阿里达摩院主导开发了多语言 - 浙江电商于20241231
ACL 2024杰出论文:GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM测试集 2024-09-12 20:09 发布于:山西省 ©作者 |金川杨、舒天民 单位|Johns Hopkins University 心智能力(Theory of Mind,ToM),即理解人们思维的能力,是开发具有类人社会智能的 AI 模型的重要基础。 近日,来自 JHU, NYU, MIT, Harvard 等机构...
近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。 论文标题: MMToM-QA: Multimodal Theory of Mind Question Answering ...
近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。 论文标题: MMToM-QA: Multimodal Theory of Mind Question Answering ...