Harness Engineering 的本质是什么? (opens in new tab)
riba2534,爱编程,爱算法。退役Acmer 查看知乎原文 最近用 Claude Code 写代码,有个事一直困扰我——写 CLAUDE.md 花的时间比写代码还多。 不是写一次就完事。每次 Agent 犯了一个错,我就得回去改 CLAUDE.md,加一条规则、调一个约束、补一段上下文。改完再跑,大概率又冒出新问题,于是再改。这个循环反复了几十次之后,CLAUDE.md 变成了几百行的文档,里面有架构规范、命名约定、错误处理策略、甚至”禁止做什么”的负面清单。 我一度觉得这是在浪费时间。写代码才是正事吧? 直到 2 月份 OpenAI 发了一篇文章,标题是《Harness Engineering: Leveraging Codex in an Agent-First World》。读完之后我意识到——写 CLAUDE.md 可能不是浪费时间,那就是工作本身。 一百万行代码,零行手写 OpenAI 做了一个实验:3 个工程师,5 个月,用 Codex Agent 从空仓库开始构建了一个超过 100 万行代码的产品。 5 个月里他们合并了大约 1,500 个 PR,平均每人每天 ...
Read the original article