Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
Multi-Agent Collaboration via Evolving Orchestration
Summary
大语言模型(Large Language Models,LLMs)在多种下游任务中取得了显著成果,但其单体式(monolithic)的架构限制了在复杂问题求解场景下的可扩展性与效率。尽管近期研究开始探索基于 LLM 的多智能体协作机制,但多数方法依赖静态的组织结构,难以随着任务复杂度和智能体数量的增长进行自适应调整,从而导致协调开销上升和整体效率下降。
为此,我们提出了一种 “提线木偶(puppeteer)”式的 LLM 多智能体协作范式。在该框架中,一个集中式的调度与控制器(“puppeteer”)会根据不断演化的任务状态,动态地指挥各个智能体(“puppets”)的执行顺序与优先级。该控制器通过强化学习进行训练,从而能够自适应地编排与调度智能体,实现灵活且可演化的集体推理过程。
在封闭域与开放域任务上的实验结果表明,该方法在降低计算成本的同时取得了更优的性能。进一步分析显示,性能提升的关键原因在于:随着控制器的演化,系统中逐步涌现出更加紧凑且具有循环结构的推理模式。相关代码已在文中给出的链接中公开。
原文链接:https://arxiv.org/abs/2505.19591