3. RL-based agent [RL-based、world model] Learning to Model the World with Language [RL-based、world model] MAMBA: an Effective World Model Approach for Meta-Reinforcement Learning [RL-based、language knowledge、continual learning] Learning with Language Inference and Tips for Continual Reinforcement...
2. AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors 这篇论文主要研究了如何通过大型语言模型(LLM)增强的自主智能体(agents)实现多智能体协作,并探索在这种协作中出现的新兴行为。作者提出了一个名为 AgentVerse 的多智能体框架,该框架可以模仿人类群体动态,协作地调整其组成,以实现...
因为LLM目前还有幻觉、虚假、过时等问题。Agent以LLM为大脑驱动,能克服LLM的局限性,主动完成更复杂的任务。 Agent研究如火如荼,创新点更是层出不穷。这里为小伙伴们整理了157篇大模型Agent论文。包含ICLR2024、EMNLP2023、NeurIPS2023等多个顶会,涉及Agent的构建、应用、评估等多个方面。 这份论文合集目前比较全面,适...
进行准确且稳健的蛋白质序列设计;清华接手,YOLOv10问世:性能大幅提升,登上GitHub热榜;推特:Tantacrul谈Meta新通知:故意避免明确说明其真实目的,并且故意将"反对"的选项放在不显眼的位置;逆图灵测试:AI NPC尝试弄清楚它们中谁是人类,因为人类太蠢正确率3/4;论文:SWEAgent:智能体-计算机界面实现自动化软件工程;...
GPT-4加Agent轻松追平Devin!普林斯顿造,开源首日斩获1.6k星 链接:https://news.miracleplus.com/share_link/22497 用GPT-4打造的AI程序员,结果轻松追平Devin!普林斯顿打造的开源SWE-agent,直接开箱即用——修复GitHub存储库中真实bug。在25%的SWE-bench测试集上,它实现了与Devin相似的准确度—— 解决了...
【论文日报】LLM合集:微软开源Arena竞技场,全面评测AI-Agent在Windows系统中的表现 AI-PaperDaily 专注搜广推、大模型和人工智能最新技术 目录 收起 1.Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale 2.DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? 3.Can ...
由《Attention ls All You Need》论文的作者之一的Lion Jones和前Stability Al的研究主管David Ha创立的大模型初创公司Sakana Al公布了其最新的研究成果,受"进化和自然选择"的启发,该公司开发了一种名为进化模型合并(Evolutionary Model Merge)的新方法,利用进化技术来自动发现如何最佳地结合不同的开源模型。在此基础...
论文 PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models 链接:https://news.miracleplus.com/share_link/17682 我们介绍了POKELLMON,这是第一个在战术战斗游戏中达到与人类相当表现的LLM体现代理,如在宝可梦战斗中所展示的。POKELLMON的设计融合了三个关键策略...
论文 基于Concordia的在物理、社交或数宇空间中具有行动的生成式Agent模型 链接:https://news.miracleplus.com/share_link/12624 Agent模型是一种在社交和自然科学领域广泛应用的研究方法。现在,借助大型语言模型 (LLMS),生成式Agent模型(GABMS) 将迎来巨大的发展。Concordia是一个库,可以轻松构...