30B agent靠trajectory追平7倍参数模型：ACC把agent解题留下的tool use trajectory重构成长上下文QA对，Qwen3-30B训完MRCR从50.2拉到68.3，跟参数量约7倍的Qwen3-235B-A22B打平 video world model把长期记忆从attention负担里搬出来：WorldKV用retrieval加compression解耦「回头看一眼」的一致性需求，吞吐翻倍且无需fine-tune DiT高分辨率推理转向content-aware scaling：SEGA按spectral energy差异化处理RoPE不同频率成分，避开均匀缩放在结构与细节之间的二选一 8万条terminal录屏反向工程出1530个agent评测任务：TerminalWorld和Terminal-Bench这类专家curate集Pearson仅0.20，过去刷专家集得到的分数可能对不上真实开发者场景

Read the original article