简介:这篇文章提出了一种名为BadAgent的新型后门攻击方法,该方法可以嵌入到基于LLMs的智能代理中。通过在训练数据中添加恶意触发和恶意操作,BadAgent攻击方法可以在智能代理上实现高成功率的后门攻击。实验结果表明,BadAgent攻击方法对数据防御方法具有很高的鲁棒性。 20. CharacterEval: A Chinese Benchmark for Role-...
1.Theory of Mind for Multi-Agent Collaboration via Large Language Models 虽然大型语言模型 (LLM) 在推理和规划方面都取得了令人瞩目的成就,但它们在多智能体协作方面的能力在很大程度上仍未得到探索。本研究在具有心智理论 (ToM) 推理任务的多智能体协作文本游戏中评估 LLM-agent,将他们的性能与多智能体强化学习...
为了评估开放领域中长篇幅回应的准确性,论文提出了一种名为LongFact的提示集,一个名为SAFE(Search-Augmented Factuality Evaluator)的评估方法,以及一个名为F1@K的度量标准来量化长篇幅回应的准确性。此外,论文还对来自四个模型家族(Gemini、GPT、Claude和PaLM-2)的十三种语言模型进行了广泛基准测试,发现更大的语言模...
在HotpotQA和ALFWorld数据集上基于各种主干模型的实验结果表明,KNOWAGENT可以达到与现有基线相当或更优的性能。进一步分析证实了KNOWAGENT在缓解规划幻觉方面的有效性。 2.3.1 设置 论文在HotpotQA和ALFWorld上评估KNOWAGENT。论文采用Llama-2-{7,13,70}b-chat作为主干模型,并将KNOWAGENT应用于Vicuna和Mistral。论文将K...
论文题目: MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework 论文链接: https://arxiv.org/abs/2308.00352 代码链接: https://github.com/geekan/MetaGPT 动机 随着LLM 能力的不断提升,基于 LLM 的智能体来解决各种任务在学术界和工业界的兴趣日益增长。值得注意的是,对于采用多个智能体协作...
可扩展、可指导、多世界agent(SIMA)项目通过训练agent在各种虚拟3D环境中遵循自由形式的指令来解决这个问题,包括策划的研究环境以及开放式的商业视频游戏。论文描述了论文的目标和理念,并展示了论文的agent在各种丰富的 3D 环境中将语言指令与行为联系起来的能力的一些初步结果。论文看到了在不同环境之间的显著表现和早期...
AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents 这篇论文主要研究了如何通过大型语言模型(LLM)增强的自主智能体(agents)实现多智能体协作,并探索在这种协作中出现的新兴行为。作者提出了一个名为 AgentVerse 的多智能体框架,该框架可以模仿人类群体动态,协作地调整其组成,...
论文题目: MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework 论文链接: https://arxiv.org/abs/2308.00352 代码链接: https://github.com/geekan/MetaGPT 动机 随着LLM 能力的不断提升,基于 LLM 的智能体来解...
这些问题包括agent请求在LLM上的次优调度和资源分配、在agent和LLM之间交互时维护上下文的困难,以及整合具有不同功能和专长的异构agent的复杂性。agent数量和复杂性的快速增加进一步加剧了这些问题,往往导致资源瓶颈和次优利用。论文提出了AIOS架构,展示了促进基于LLM的agent开发和部署的潜力,推动更加紧密、高效的AIOS-...
这些被称为「AI 科学家」的 Agent 已经开始探寻其在生物学和化学等各种领域内进行自主科学发现的潜力。此类 Agents 已经表现出了选择适合任务的工具,规划环境条件,以及实现实验自动化的能力。 因此,Agent 可摇身一变成为真实的科学家,能够有效地设计和开展实验。在某些领域如化学设计中,Agent 所展现的能力已经超过了...