谷歌第八代TPU双舰齐发，终结AI推理延迟，让智能体真正实现随叫随到 (opens in new tab)

今天，谷歌在 Cloud Next '26 峰会上发布了其第八代 TPU 架构（TPU 8t 与 TPU 8i），TPU 8t 主攻训练，TPU 8i 主攻推理，将在 2026 年晚些时候上市。第八代 TPU 采用申请制，Google Cloud 用户如需使用，需要在官网提交登记需求。原生 PyTorch 对于 TPU 的支持等软件栈功能，目前也处于 Preview 阶段。眼下，谷歌是在小范围内开放给特定合作伙伴和早期客户进行测试，旨在管理早期算力资源的分配。TPU 8t 凭借 SparseCore 核心与 Virgo 网络拓扑，将大规模预训练效能推向极致，以 2.7 倍的单位成本算力改写了模型训练版图。TPU 8i 专为实时推理与复杂决策而生，其通过 CAE 加速引擎与新型 Boardfly 拓扑结构，在一定程度上击碎了长上下文推理的延迟瓶颈，让 AI 从单一的下一个词预测进化到场景模拟和深度逻辑推理，AI 回应将变得更及时、更连贯。在谷歌自研 Arm Axion 架构 CPU 的算力支持下，这套架构还实现了两倍的能效飞跃。第八代 TPU 将开放给所有谷歌云客户使用。TPU 8...

Read the original article