2. AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors 这篇论文主要研究了如何通过大型语言模型(LLM)增强的自主智能体(agents)实现多智能体协作,并探索在这种协作中出现的新兴行为。作者提出了一个名为 AgentVerse 的多智能体框架,该框架可以模仿人类群体动态,协
ICLR‘24 文章已公开,本文调研了其中86篇Agent相关的投稿,学习一下前沿技术。文章列表已同步更新到 github paper collection,该collection会持续更新,欢迎star、follow。1. TL;DR主要调研了两类Agent文章:RL-…
因为LLM目前还有幻觉、虚假、过时等问题。Agent以LLM为大脑驱动,能克服LLM的局限性,主动完成更复杂的任务。 Agent研究如火如荼,创新点更是层出不穷。这里为小伙伴们整理了157篇大模型Agent论文。包含ICLR2024、EMNLP2023、NeurIPS2023等多个顶会,涉及Agent的构建、应用、评估等多个方面。 这份论文合集目前比较全面,适...
进行准确且稳健的蛋白质序列设计;清华接手,YOLOv10问世:性能大幅提升,登上GitHub热榜;推特:Tantacrul谈Meta新通知:故意避免明确说明其真实目的,并且故意将"反对"的选项放在不显眼的位置;逆图灵测试:AI NPC尝试弄清楚它们中谁是人类,因为人类太蠢正确率3/4;论文:SWEAgent:智能体-计算机界面实现自动化软件工程;...
GPT-4加Agent轻松追平Devin!普林斯顿造,开源首日斩获1.6k星 链接:https://news.miracleplus.com/share_link/22497 用GPT-4打造的AI程序员,结果轻松追平Devin!普林斯顿打造的开源SWE-agent,直接开箱即用——修复GitHub存储库中真实bug。在25%的SWE-bench测试集上,它实现了与Devin相似的准确度—— 解决了...
Agent以LLM为大脑驱动,能克服LLM的局限性,主动完成更复杂的任务。 Agent研究如火如荼,创新点更是层出不穷。这里为小伙伴们整理了157篇大模型Agent论文。包含ICLR2024、EMNLP2023、NeurIPS2023等多个顶会,涉及Agent的构建、应用、评估等多个方面。 这份论文合集目前比较全面,适合所有想学Agent的同学们下载研读,也许...
【论文日报】LLM合集:微软开源Arena竞技场,全面评测AI-Agent在Windows系统中的表现 AI-PaperDaily 专注搜广推、大模型和人工智能最新技术 目录 收起 1.Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale 2.DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? 3.Can ...
数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好 AlphaFold 预测细菌生存所需的 1402 种蛋白互作,最完整的细菌必需相互作用图谱 知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特 反转?OpenAI:纽约时报「黑客攻击」了ChatGPT,要求驳回版权诉讼 ...
由《Attention ls All You Need》论文的作者之一的Lion Jones和前Stability Al的研究主管David Ha创立的大模型初创公司Sakana Al公布了其最新的研究成果,受"进化和自然选择"的启发,该公司开发了一种名为进化模型合并(Evolutionary Model Merge)的新方法,利用进化技术来自动发现如何最佳地结合不同的开源模型。在此基础...
论文 PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models 链接:https://news.miracleplus.com/share_link/17682 我们介绍了POKELLMON,这是第一个在战术战斗游戏中达到与人类相当表现的LLM体现代理,如在宝可梦战斗中所展示的。POKELLMON的设计融合了三个关键策略...