多智能体系统 (opens in new tab)

Covers 2 stories including How we built our multi-agent research system

单智能体在单智能体中，ReAct 框架 1 作为当前智能体的一个核心设计模式，其通过 Reasoning（推理）和 Acting（行动）两个模块实现了大语言模型推理能力与外部环境交互能力的深度协同。ReAct 框架的整体执行过程如下图所示：在之前的博客中有介绍 ReAct 框架的主要特点，在上图中可以将流程划分为三个阶段：初始化该步骤会创建一个上下文，其中除了包含用户的输入以外还会包含系统提示词、可用的工具列表等其他信息。循环迭代循环迭代是 ReAct 框架的核心步骤，该步骤实现了在真实世界中人类解决问题的行为模式。推理：用于分析任务目标，根据历史反馈和当前状态确定下一步动作。行动：将模型推理的结果转化为可执行的工具指令（Tool Calling 或 Function Calling）。观测：将工具执行结果返回给 LLM 用于确定下一步动作。终止输出当模型判断已获得最终答案后，会停止循环迭代并将结果输出给用户。除此之外也会存在异常输出的情况，例如：循环迭代达到最大限制次数，工具调用超时或返回错误等等。我们以 Hotpot QA 数据集中的一个问题为例，对比...

Read the original article