两次循环让SWE-bench从43涨到64 (opens in new tab)
循环加深计算只能加两层 :LoopCoder-v2用并行循环把「循环几次」变成可工程化的旋钮,两次循环让SWE-bench Verified从43.0涨到64.4,但三次及以上反而退化——test-time compute的scaling曲线在很浅处就饱和|AI论文简报
Read the original article循环加深计算只能加两层 :LoopCoder-v2用并行循环把「循环几次」变成可工程化的旋钮,两次循环让SWE-bench Verified从43.0涨到64.4,但三次及以上反而退化——test-time compute的scaling曲线在很浅处就饱和|AI论文简报
Read the original article