Introducing Composer 2.5 (opens in new tab)
📌 One-Sentence Summary Cursor 发布了 Composer 2.5,这是一次在智能和行为方面的重大改进,专为持续性编码任务而设计,通过定向 RL 反馈、25 倍合成数据和新的优化器进行训练。 📝 Summary Cursor 发布了 Composer 2.5,这是其 AI 编码智能体的重大升级。新版本在处理长时间运行的复杂任务、遵循复杂指令以及整体协作质量方面表现出显著改进。这些改进源于三项关键的训练创新:利用文本反馈进行定向强化学习以纠正局部错误;基于真实代码库将合成任务生成量提升 25 倍以推动模型智能;以及采用新的 Sharded Muon 优化器和双网格 HSDP 实现高效的大规模训练。Composer 2.5 与其前代版本一样,基于相同的开源 Kimi K2.5 检查点构建。博文还详细介绍了未来与 SpaceXAI 的合作,将从零开始训练一个规模更大的模型。定价为输入每百万 token 0.50 美元,输出每百万 token 2.50 美元,并提供速度更快的变体版本,但成本更高。 💡 Main Points Composer 2.5 使用带有文...
Read the original article