构建能持续运行数小时的智能体:Anthropic 工程师揭秘对抗式生成-评估架构 (opens in new tab)
📌 One-Sentence Summary Anthropic 应用 AI 工程师在 AI Engineer 大会上深度拆解对抗式生成-评估器架构,揭示让智能体稳定运行 12 小时而不失去连贯性与质量的核心机制。 📝 Summary 在这场 34 分钟的 AI Engineer 大会技术演讲中,Anthropic 应用 AI 工程师 Ash Prabaker 与 Andrew Wilson 系统回顾并蓝图化了构建长时间运行自主智能体的方法论。 Andrew 首先归纳了导致智能体在长时运行中退化的三类结构性失效:上下文约束(有限的上下文窗口、上下文腐化、以及接近 token 上限时的「上下文焦虑」)、原生规划能力不足,以及输出奉承——模型会对自身不完整的工作盖章放行。 随后 Andrew 梳理了 Claude 模型权重与外部 Agent SDK 脚手架一年来的协同演化历程:自主运行时长从 Opus 3.7 的约 1 小时提升至 Opus 4.6 的 12 小时。期间引入的关键 SDK 原语包括渐进式披露 Skills、程序化工具调用、服务端压缩,以及 Agent Teams 协调...
Read the original article