BestBlogs.dev

当“正确”不再确定时,如何验证智能体行为 (opens in new tab)

📌 One-Sentence Summary 本文提出了一种新颖的自主 AI 智能体验证框架,该框架通过对执行轨迹进行支配者分析,将关键结果与偶然噪声区分开来,从而超越了脆弱的逐步测试方法。 📝 Summary 本文探讨了测试像 GitHub Copilot Coding Agent 这样的自主 AI 智能体时所面临的关键挑战:由于智能体行为具有非确定性和多路径特性,传统的验证方法会失效。作者提出了一个“信任层”框架,该框架将智能体执行过程建模为图(前缀树接收器),而非线性脚本。通过应用编译器理论中的支配者分析,该算法能够自动识别出每次成功运行都必须经过的“关键状态”,同时过滤掉诸如加载屏幕之类的“可选变化”。该算法仅需学习 2-10 条成功轨迹,利用三级等价检测系统(视觉哈希、SSIM 和 LLM 语义分析)来合并轨迹,并通过拓扑子序列匹配来验证新的执行过程。在一项使用 VS Code 扩展测试套件的控制实验中,支配树方法实现了 100% 的准确率,而智能体自我评估的准确率为 82.2%;在识别“非缺陷”场景方面,支配树方法的 F1 分数为 52.2%,而智能体自我评估为 0%...

Read the original article
Sign in to keep reading the full article.

Keyboard Shortcuts

Navigation

Next / previous post
j/k
Open post
oorEnter
Preview post
v

Post Actions

Love post
a
Like post
l
Dislike post
d
Undo reaction
u
Save / unsave
s

Recommendations

Add interest / feed
Enter
Not interested
x

Go to

Home
gh
Interests
gi
Feeds
gf
Likes
gl
History
gy
Changelog
gc
Settings
gs
Discover
gb
Search
/

General

Show this help
?
Submit feedback
!
Close modal / unfocus
Esc

Press ? anytime to show this help