复旦和字节合作的一篇文章(2025年1月),核心思路很常见,是通过RL采样LLM的轨迹,把好的轨迹和修正后的坏轨迹作为训练数据再SFT LLM,反复迭代。创新的点是怎么对「坏轨迹」做修正,这篇文章用LLM自己去做「过程…
MetaGPT 是一个新颖的多智能体框架,结合元编程思想,嵌入 SOPs 来增强大规模语言模型(LLMs)在多智能体协作上的能力。通过角色专业化,工作流管理和灵活的消息机制,使其成为通用性和可移植性高的多智能体框架。 结合迭代式的反馈机制,...
2024年5月,微软AutoGen的技术论文《AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation》荣膺ICLR 2024大会LLM 智能体专题研讨会最佳论文殊荣。正好笔者最近对于Multi-Agent的技术和产品比较感兴趣,就一边读一边翻一边分享给大家,有兴趣的可以留言交流~ 简介 大型语言模型(LLMs)正逐渐成为开发强大...
然后,我们提出可以通过一种我们称之为 "搜索增强事实性评估器"(Search-Augmented Factuality Evaluator,SAFE)的方法,将 LLM 代理用作长式事实性的自动评估器。SAFE 利用 LLM 将长式回复分解为一组单独的事实,并通过一个多步骤推理过程来评估每个事实的准确性,该过程包括向谷歌搜索发送搜索查询,并确定搜索结果是否支持...
总而言之,该论文工作结合LLM智能体与经济模拟,为计算经济学的研究范式开辟了一条新的可能道路,未来有望以DSGE等主流模型为目标,向更精准、更真实的模拟迈进。 进一步地,关于大语言模型智能体ABM模拟及其在社会、经济、物理、网络等领域应用的相关工作,...
2.1 论文背景 随着人工智能的进步,语言agent在解决复杂问题方面变得越来越重要。这些围绕大模型(LLM)构建的agent通过任务分解、反思、协作分工和利用外部工具等各种策略来增强其任务规划能力。尽管当前的提示技术在为某些闭源语言模型提供良好的规划能力方面是有效的,但这些方法通常受限于模型固有的理解能力和其受训知识...
MetaGPT 是一个新颖的多智能体框架,结合元编程思想,嵌入 SOPs 来增强大规模语言模型(LLMs)在多智能体协作上的能力。通过角色专业化,工作流管理和灵活的消息机制,使其成为通用性和可移植性高的多智能体框架。 结合迭代式的反馈机制,MetaGPT 在多个基准测试上取得了最先进的性能。结合人类社会实践的 SOPs,启发了未...
论文地址 项目地址 论文《Large Language Model for Science: A Study on P vs. NP》提出了一个名为"Socratic Reasoning"的问题解决框架,用于利用大语言模型(LLM)探索复杂的科学问题。这个框架的核心思想如下: 定义: Socratic Reasoning是一种基于对话的问题解决框架,灵感来自古希腊哲学家苏格拉底提出的"苏格拉底式提问...
这里论文首先概述LLM内核中每个模块的基本设计和实现。随后,论文介绍LLM系统调用,它包含了每个模块的基本功能。最后,论文探讨AIOS SDK,旨在为agent开发人员简化开发过程。2.2.2.1 agent调度器 agent调度器旨在以高效的方式管理agent请求。考虑图3中的各种agent(表示为A、B和C),每个agent都有几个执行步骤。在...
本文是 ReAct 论文的一个扩展工作,两文作者有重合。ReAct 方法通过令 LLM 交替生成推理轨迹和任务动作,同时在 NLP 推理任务和控制任务上达成了良好的效果。从智能决策角度看,ReAct 可以看作给 RL/IL agent 扩展了工作记忆,记忆本身存储在上下文中,agent 既可以从环境中获取信息,也可以从工作记忆中获取信息。但是这...