Day-0 支持:摩尔线程完成智谱 GLM-5.2 极速适配 (opens in new tab)
IT之家 6 月 17 日消息,智谱今日宣布上线并开源 GLM-5.2。在全球百万用户参与盲测的前端开发评估系统 Code Arena 上,GLM-5.2 取得全球可用模型第一的表现。摩尔线程今日宣布在 AI 训推一体全功能 GPU 智算卡 MTT S5000 上,完成对智谱新一代开源旗舰模型 GLM-5.2 的 Day-0 极速适配。据介绍,摩尔线程技术团队基于 SGLang-MUSA 推理引擎及 TileLang-MUSA 算子编程语言,完成了模型结构适配、关键算子优化、框架拉起与部署验证,在 MTT S5000 上实现 GLM-5.2 的高效、高精度推理。摩尔线程还表示,MTT S5000 从硬件算力、软件栈到开源框架进行了全链路适配与深度优化:支撑超长上下文GLM-5.2 的 Solid 1M 上下文与长程任务能力,使长 Prompt 编码、上下文读入与 KV Cache 生成成为推理链路中的关键环节。长输入请求在进入生成阶段前,需要先完成大规模 Prefill 计算;这一阶段高度依赖并行矩阵计算、Attention 算子效率、显存容量与访存带宽。MTT S5000 凭借...
Read the original article