构建能持续运行数小时的智能体：Anthropic 工程师揭秘对抗式生成-评估架构 (opens in new tab)

📌 One-Sentence Summary Anthropic 应用 AI 工程师在 AI Engineer 大会上深度拆解对抗式生成-评估器架构，揭示让智能体稳定运行 12 小时而不失去连贯性与质量的核心机制。 📝 Summary 在这场 34 分钟的 AI Engineer 大会技术演讲中，Anthropic 应用 AI 工程师 Ash Prabaker 与 Andrew Wilson 系统回顾并蓝图化了构建长时间运行自主智能体的方法论。 Andrew 首先归纳了导致智能体在长时运行中退化的三类结构性失效：上下文约束（有限的上下文窗口、上下文腐化、以及接近 token 上限时的「上下文焦虑」）、原生规划能力不足，以及输出奉承——模型会对自身不完整的工作盖章放行。随后 Andrew 梳理了 Claude 模型权重与外部 Agent SDK 脚手架一年来的协同演化历程：自主运行时长从 Opus 3.7 的约 1 小时提升至 Opus 4.6 的 12 小时。期间引入的关键 SDK 原语包括渐进式披露 Skills、程序化工具调用、服务端压缩，以及 Agent Teams 协调...

Read the original article