VI · Multi-AgentExperimental·

动态拓扑路由Dynamic Topology Routing

也称为 Adaptive Agent Topology, Optimizable Agent Graph, Runtime Graph Rewiring

在运行时通过将任务与候选协作者匹配来形成和解散代理之间的连接,而不是事先将多代理系统固定在链、星形或网状结构上。

上下文

一个多代理系统拥有一组专业化的代理。经典设计将它们连接成固定的拓扑——一个顺序链、一个围绕协调者的星形,或一个完全连接的网状结构——这些在任何任务到达之前就已选择。然而,不同的任务需要不同的通信结构:有些需要紧凑的管道,有些需要广泛的分发,还有一些需要三方之间的小型辩论。适合一个任务的拓扑在另一个任务上会浪费消息或丢失所需的链接。

问题

固定的代理间拓扑是对系统将要处理的所有任务的妥协。即使链可以满足需求,网状结构也会付出二次方的消息和令牌成本;链会串行化本可以并行的工作;星形结构则在其中心节点上形成瓶颈。在设计时硬编码结构会强迫每个任务通过相同的形状,因此一些任务会过度通信,而另一些则缺乏所需的链接。

影响因素

  • 不同的任务需要不同的通信形状;一个固定的拓扑结构对它们都不适合。
  • 更密集的拓扑提高了协调质量,但消息和令牌的成本呈平方增长。
  • 在运行时重新连接增加了一个路由决策,而这个决策本身可能是错误的或缓慢的。
  • 代理池及其能力是已知的;哪些链接重要是特定于任务的。
  • 自适应图比静态图更难以推理和调试。

示例

一个研究平台保持着一组十几个专业代理——检索、代码、数学、批评、写作。对于简单的查找,它连接一个两代理链;对于有争议的声明,它建立一个三代理辩论小组;对于调查,它扩展到五个检索者和一个综合者。同一个池为所有三者服务,因为路由器读取每个任务并仅实例化该任务所需的边,而不是强迫所有内容通过一个固定的网格。

图表

解决方案

因此:

将代理池与其上的通信图分开。对于每个任务(或每个步骤),路由层根据当前子任务对候选代理进行评分——通过能力描述、嵌入相似性或学习的路由器——并仅实例化所需的边:当工作是顺序时使用链,当工作是并行时使用分发,当需要辩论时使用小型团体。随着任务的发展,边会被添加和删除。方法从每步的语义匹配(DyTopo)到将整个拓扑视为可优化的图,进行端到端训练(GPTSwarm)。静态链、星形和网状结构成为路由器可以选择的特例,而不是唯一的选项。

此模式禁止的内容。 代理不得假设固定的同伴集或固定的通信结构;他们与谁交谈由路由层根据任务决定,并可能在步骤之间变化。代理不得打开路由器未为当前子任务授予的链接。

与之并列或对立的模式——

  • 替代Orchestrator-Workers★★一个调度器在运行时动态地将任务分解为子任务,并将每个子任务委派给一个工作 LLM,然后综合结果。
  • 补充去中心化蜂群交接蜂群中的代理根据共享协议决定与对等体的交接,没有中央协调者;具体涉及代理发起的交接协议,而不是拓扑结构。
  • 补充合同网络协议★★经典的基于竞标的多智能体任务分配:管理者广播任务公告,承包商提交竞标,管理者将合同授予最佳竞标。

邻域

点击任何邻居以跟随语言。滚动以缩放,拖动以平移。