Gemma，DeepMind 的开放模型家族 — Omar Sanseviero，Google DeepMind (opens in new tab)

📌 One-Sentence Summary 本次演讲介绍了 Google DeepMind 新发布的 Gemma 4 系列开放模型，重点阐述了其多样的模型尺寸、为边缘部署设计的创新逐层嵌入架构、多模态与多语言能力，以及围绕它们构建的活跃生态系统。 📝 Summary 来自 Google DeepMind 的 Omar Sanseviero 介绍了在一周前发布的 Gemma 4 系列开放模型。该系列包含从 20 亿到 320 亿参数不等的模型，旨在满足多样化的使用场景。关键创新包括采用逐层嵌入的 E2B（有效 20 亿）架构，该架构大幅减少了内存占用，并能在智能手机和树莓派等边缘设备上高效运行。这些模型具备强大的多模态（图像、视频、音频）和多语言（140 多种语言）能力。演讲展示了设备端代码生成、智能体任务和并行推理的实际演示。它强调了模型的 Apache 2.0 许可证、快速的社区采用（一周内下载量超过 1000 万）以及与 Android Studio 等产品的集成。演讲最后鼓励开发者探索在本地运行强大、可定制的开放模型的潜力。 💡 Main Points Gemma 4 是...

Read the original article