Agent开始学会自己变强，也学会少用工具 (opens in new tab)

Covers 2 stories including The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence

国产MoE开始把「自我进化」写进路线图：MiniMax-M2系列230B参数只激活9.8B，端到端为agent场景设计，最新checkpoint已能自己debug训练、改自己的脚手架并行推理最大的浪费，是每条分支各想各的：CPT让多条思考分支实时共享中间发现，免训练，在数学竞赛题上把「准确率-延迟」曲线整体往前推 Agent用RL训着训着，工具就乱调了：AKBE让模型自己分清「该查工具还是靠脑子」，工具调用减18%、准确率反升，工具效率提25% 技能不该是一次性脚本：MUSE-Autoskill给agent的技能加上完整生命周期，能跨任务复用、带经验、还能跑单测自我修正

Read the original article