本期主题
随着LLMs的迅速发展以及在各个领域中展现出的应用潜力,基于LLMs的Agent的研究受到学者们的广泛关注。然而,单Agent在复杂的任务场景中往往表现出上下文冗长以及推理过程解释性差等缺陷。同时,Multi-Agent的研究在近期备受关注。本期为大家推荐3篇Multi-Agent代表性论文,探索了Multi-Agent框架在未来人工智能应用中的潜力。
1. CAMEL: Communicative Agents for "Mind" Exploration of Large Language Model Society
论文链接:https://arxiv.org/pdf/2303.17760
源码链接:https://github.com/camel-ai/camel
本文是比较早的知名Multi-Agent框架,主要为2个Agent的交互而设计。
背景:随着基于聊天的语言模型快速发展,它们在解决复杂任务方面取得了显著成就。然而,这些模型往往依赖于人类输入来正确引导对话,导致时间消耗和具有一定的挑战性。
动机:为了减少人类在引导对话中的工作量,探索由多个Agent自主合作来完成任务。
方法:文章提出了一个可扩展的“角色扮演”Muliti-Agent框架,通过提供初始任务和设置,引导多个Agent自主合作完成任务。
特点:该框架允许通信Agent在只需要人类提供初步想法的情况下,通过角色扮演和对话来完成任务,为研究聊天代理的行为和能力提供了丰富的会话数据。同时,在pipeline中设置了Task Specifier角色,来具体化任务描述,因为没有专家Agent的辅助,在解决复杂任务时具有一定挑战性,需要更详细具体的任务描述。
2. AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors
论文链接:https://arxiv.org/pdf/2308.10848
源码链接:https://github.com/OpenBMB/AgentVerse/
背景:虽然基于LLMs的Agent在各种任务上取得了显著进展,然而,现实场景中往往存在很多复杂的任务,很难由单个Agent自主完成,通常需要多个Agent的合作。
动机:受人类群体动态的启发,一个合作的系统表现会超越各个部分之和,可以提高复杂任务中的表现效果。
方法:本文提出了一个名为AgentVerse的Muliti-Agent框架,通过有效协调多个专家智能体合作来完成复杂任务。
特点:任务处理过程包括专家智能体招募、合作决策、行动执行以及评估反馈四个主要阶段。同时,作者通过实验证实了AgentVerse框架有效提高了Agent的理解、推理、编码、工具使用以及在具身智能的表现和能力。
3. AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation
论文链接:https://arxiv.org/pdf/2308.08155
源码链接:https://github.com/microsoft/autogen
动机:先前工作展现了Multi-Agent 可以促进发散性思维、提高推理能力等等。如何促进Multi-Agent跨领域应用以及开发复杂的LLM应用程序成文本文的动机。
方法:本文提出的AutoGen框架允许用户使用多个Agent构建各种复杂度和LLM容量的不同应用程序。
特点:该框架支持构建定制化LLM应用程序以及灵活定义Agent行为为不同的任务场景提供了更加灵活的设计环境。同时,该Multi-Agent框架具有支持用户的中途输入以及可添加操作函数等特色功能。实验中证明了该框架在编码、数据、问答等应用程序中的有效性。
责任编辑:桑基韬、黄晓雯
素材整理:贾海涛
编辑:杨云帆