Harness Engineering 的本质是什么？ (opens in new tab)

riba2534，爱编程，爱算法。退役Acmer 查看知乎原文最近用 Claude Code 写代码，有个事一直困扰我——写 CLAUDE.md 花的时间比写代码还多。不是写一次就完事。每次 Agent 犯了一个错，我就得回去改 CLAUDE.md，加一条规则、调一个约束、补一段上下文。改完再跑，大概率又冒出新问题，于是再改。这个循环反复了几十次之后，CLAUDE.md 变成了几百行的文档，里面有架构规范、命名约定、错误处理策略、甚至”禁止做什么”的负面清单。我一度觉得这是在浪费时间。写代码才是正事吧？直到 2 月份 OpenAI 发了一篇文章，标题是《Harness Engineering: Leveraging Codex in an Agent-First World》。读完之后我意识到——写 CLAUDE.md 可能不是浪费时间，那就是工作本身。一百万行代码，零行手写 OpenAI 做了一个实验：3 个工程师，5 个月，用 Codex Agent 从空仓库开始构建了一个超过 100 万行代码的产品。 5 个月里他们合并了大约 1,500 个 PR，平均每人每天 ...

Read the original article