阿里千问发布首个原生语言世界模型 Qwen-AgentWorld,可在七大领域中模拟智能体交互环境 (opens in new tab)
IT之家 6 月 24 日消息,阿里巴巴千问大模型今天正式发布 Qwen-AgentWorld,官方称这是首个原生语言世界模型,能够在七大领域中模拟智能体交互环境,提供两种规模(35B-A3B 与 397B-A17B)。IT之家附官方介绍如下:原生世界建模:环境建模从继续预训练阶段起即为训练目标,贯穿 CPT → SFT → RL 全流程,而非对通用大语言模型的事后适配。七大领域,一个模型:单一模型同时覆盖文本类环境与 GUI 类环境,实现跨领域知识迁移。通过三阶段训练范式 —— 持续预训练(CPT)注入环境知识、监督微调(SFT)激活下一状态预测推理、强化学习(RL)打磨模拟真实性 —— 自底向上逐步构建世界建模能力。我们探索了世界模型赋能通用智能体的两种互补范式:作为解耦的环境模拟器,我们在 Tool Decathlon、MCPMark 和 WideSearch 上验证了可控模拟的有效性,其表现超越了无控模拟与真实环境训练;作为统一智能体基础模型,语言世界模型(LWM)的预热训练可迁移至涵盖七个基准(其中三个完全属于域外)的多轮智能体任务,初步验证了语言世界模型能够作为构建更...
Read the original article