Agent 框架与多智能体协作

2026.02

从单 Agent 到多 Agent 协作，涵盖 DyLAN 动态团队优化、TOOLMAKER 工具生成与 DataFlow-Agent 数据编排的架构设计。

核心问题

现有 LLM Agent 系统（如 AutoGPT、CAMEL）通常使用固定数量的智能体和静态通信结构。但现实世界中的复杂任务往往需要不同专业能力的动态组合，且任务需求可能随进展变化。此外，Agent 的工具自主创造能力和数据准备自动化也值得关注——与其让人类预设工具集和编写数据脚本，不如让 Agent 根据任务需求自主生成。

DyLAN：动态 LLM 智能体网络

动机：多智能体协作中，不相关或表现不佳的 Agent 不仅浪费计算资源，还可能通过注入噪声干扰最终结果。需要一种机制来动态调整团队组成。

形式化——T-FFN：将多智能体协作过程形式化为时间前馈网络（T-FFN）：每一层代表一个时间步，节点代表参与的智能体，边代表通信。这种形式化使得团队协作过程可以被精确地表示和分析。

两阶段架构：

阶段 1：团队优化（Team Optimization）——无监督选择算法，基于"智能体重要性得分"从候选池中挑选贡献最大的 Agent。具体做法：在数据集小子集上让所有候选 Agent 各自解题，根据输出质量计算重要性得分，选取 Top-K 组成精英团队。这一过程不需要标注数据。
阶段 2：任务解决（Task Solving）——选定团队通过动态通信结构协作，内置"团队重组"机制：通过 LLM Ranker 评估每个 Agent 的中间贡献，剔除低效率成员，防止噪声累积。

核心思想是效率与有效性的平衡——移除不相关或表现不佳的 Agent，减少计算开销的同时提升最终质量。在某些 MMLU 子任务上，团队优化阶段可将准确率提升 25%。

TOOLMAKER：Agent 创建工具

动机：Agent 的工具集通常由人类开发者预先实现。但在生命科学、医学等需要大量高度专业化工具的领域，人工实现成本极高。TOOLMAKER 探索让 Agent 自主从论文代码中生成工具。

工作流程：

输入：一个 GitHub 仓库 URL + 简短的任务描述。
安装阶段：自动克隆仓库、安装依赖、分析代码结构。
代码生成阶段：基于任务描述和仓库代码，生成执行任务所需的 Python 函数。
闭环调试：运行生成的代码，如果失败则分析错误信息并自动修正，循环直到通过或达到最大重试次数。

评测设计：引入包含 15 个复杂计算任务的基准，覆盖多个科学领域，配备超过 100 个单元测试来评估正确性和鲁棒性。这种"工具自举"（Tool Bootstrapping）能力使 Agent 的工具集可以随任务复杂度动态扩展。

DataFlow-Agent：LLM 驱动的数据编排

动机：当前 LLM 数据准备依赖临时脚本，缺乏标准化抽象，难以复现。现有工具（NVIDIA NeMo Curator、Data-Juicer）侧重数据提取和过滤，对模型介入生成和语义精细化支持不足。

DataFlow 框架：PyTorch 风格的数据准备框架，核心抽象包括：

全局存储（Global Storage）——统一的表格化数据表示，解耦数据管理与算子逻辑。
近 200 个可复用算子——分为 Generate、Evaluate、Filter、Refine 四类。
90+ 个 Prompt 模板——将 Prompt 构建与算子逻辑解耦。
Pipeline（流水线）——显式定义的 DAG 工作流，支持编译和断点续跑。

DataFlow-Agent（智能编排层）：用户只需用自然语言描述数据需求，Agent 自动完成三步：

算子合成——从算子库中检索或生成所需算子。
流水线规划——将算子组装为 DAG 工作流。
迭代验证——自我测试和调试，确保输出质量。

在 6 个领域（文本、数学推理、代码、Text-to-SQL、Agentic RAG、知识抽取）验证了有效性。一个关键发现：仅用 1 万条合成数据就能超越用 100 万条开源数据训练的模型，验证了"高质量小数据 > 低质量大数据"的假设。

参考文献

Liu et al., "A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration (DyLAN)", COLM, 2024.
Wolflein et al., "LLM Agents Making Agent Tools (TOOLMAKER)", arXiv.
Liang et al., "DataFlow: An LLM-Driven Framework for Unified Data Preparation and Workflow Automation", arXiv, 2025.