当“正确”不再确定时,如何验证智能体行为 (opens in new tab)
📌 One-Sentence Summary 本文提出了一种新颖的自主 AI 智能体验证框架,该框架通过对执行轨迹进行支配者分析,将关键结果与偶然噪声区分开来,从而超越了脆弱的逐步测试方法。 📝 Summary 本文探讨了测试像 GitHub Copilot Coding Agent 这样的自主 AI 智能体时所面临的关键挑战:由于智能体行为具有非确定性和多路径特性,传统的验证方法会失效。作者提出了一个“信任层”框架,该框架将智能体执行过程建模为图(前缀树接收器),而非线性脚本。通过应用编译器理论中的支配者分析,该算法能够自动识别出每次成功运行都必须经过的“关键状态”,同时过滤掉诸如加载屏幕之类的“可选变化”。该算法仅需学习 2-10 条成功轨迹,利用三级等价检测系统(视觉哈希、SSIM 和 LLM 语义分析)来合并轨迹,并通过拓扑子序列匹配来验证新的执行过程。在一项使用 VS Code 扩展测试套件的控制实验中,支配树方法实现了 100% 的准确率,而智能体自我评估的准确率为 82.2%;在识别“非缺陷”场景方面,支配树方法的 F1 分数为 52.2%,而智能体自我评估为 0%...
Read the original article