Agent 框架与多智能体协作
2026.02从单 Agent 到多 Agent 协作,涵盖 DyLAN 动态团队优化、TOOLMAKER 工具生成与 DataFlow-Agent 数据编排的架构设计。
核心问题
现有 LLM Agent 系统(如 AutoGPT、CAMEL)通常使用固定数量的智能体和静态通信结构。但现实世界中的复杂任务往往需要不同专业能力的动态组合,且任务需求可能随进展变化。此外,Agent 的工具自主创造能力和数据准备自动化也值得关注——与其让人类预设工具集和编写数据脚本,不如让 Agent 根据任务需求自主生成。
DyLAN:动态 LLM 智能体网络
动机:多智能体协作中,不相关或表现不佳的 Agent 不仅浪费计算资源,还可能通过注入噪声干扰最终结果。需要一种机制来动态调整团队组成。
形式化——T-FFN:将多智能体协作过程形式化为时间前馈网络(T-FFN):每一层代表一个时间步,节点代表参与的智能体,边代表通信。这种形式化使得团队协作过程可以被精确地表示和分析。
两阶段架构:
- 阶段 1:团队优化(Team Optimization)——无监督选择算法,基于"智能体重要性得分"从候选池中挑选贡献最大的 Agent。具体做法:在数据集小子集上让所有候选 Agent 各自解题,根据输出质量计算重要性得分,选取 Top-K 组成精英团队。这一过程不需要标注数据。
- 阶段 2:任务解决(Task Solving)——选定团队通过动态通信结构协作,内置"团队重组"机制:通过 LLM Ranker 评估每个 Agent 的中间贡献,剔除低效率成员,防止噪声累积。
核心思想是效率与有效性的平衡——移除不相关或表现不佳的 Agent,减少计算开销的同时提升最终质量。在某些 MMLU 子任务上,团队优化阶段可将准确率提升 25%。
TOOLMAKER:Agent 创建工具
动机:Agent 的工具集通常由人类开发者预先实现。但在生命科学、医学等需要大量高度专业化工具的领域,人工实现成本极高。TOOLMAKER 探索让 Agent 自主从论文代码中生成工具。
工作流程:
- 输入:一个 GitHub 仓库 URL + 简短的任务描述。
- 安装阶段:自动克隆仓库、安装依赖、分析代码结构。
- 代码生成阶段:基于任务描述和仓库代码,生成执行任务所需的 Python 函数。
- 闭环调试:运行生成的代码,如果失败则分析错误信息并自动修正,循环直到通过或达到最大重试次数。
评测设计:引入包含 15 个复杂计算任务的基准,覆盖多个科学领域,配备超过 100 个单元测试来评估正确性和鲁棒性。这种"工具自举"(Tool Bootstrapping)能力使 Agent 的工具集可以随任务复杂度动态扩展。
DataFlow-Agent:LLM 驱动的数据编排
动机:当前 LLM 数据准备依赖临时脚本,缺乏标准化抽象,难以复现。现有工具(NVIDIA NeMo Curator、Data-Juicer)侧重数据提取和过滤,对模型介入生成和语义精细化支持不足。
DataFlow 框架:PyTorch 风格的数据准备框架,核心抽象包括:
- 全局存储(Global Storage)——统一的表格化数据表示,解耦数据管理与算子逻辑。
- 近 200 个可复用算子——分为 Generate、Evaluate、Filter、Refine 四类。
- 90+ 个 Prompt 模板——将 Prompt 构建与算子逻辑解耦。
- Pipeline(流水线)——显式定义的 DAG 工作流,支持编译和断点续跑。
DataFlow-Agent(智能编排层):用户只需用自然语言描述数据需求,Agent 自动完成三步:
- 算子合成——从算子库中检索或生成所需算子。
- 流水线规划——将算子组装为 DAG 工作流。
- 迭代验证——自我测试和调试,确保输出质量。
在 6 个领域(文本、数学推理、代码、Text-to-SQL、Agentic RAG、知识抽取)验证了有效性。一个关键发现:仅用 1 万条合成数据就能超越用 100 万条开源数据训练的模型,验证了"高质量小数据 > 低质量大数据"的假设。
参考文献
- Liu et al., "A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration (DyLAN)", COLM, 2024.
- Wolflein et al., "LLM Agents Making Agent Tools (TOOLMAKER)", arXiv.
- Liang et al., "DataFlow: An LLM-Driven Framework for Unified Data Preparation and Workflow Automation", arXiv, 2025.