Gemma,DeepMind 的开放模型家族 — Omar Sanseviero,Google DeepMind (opens in new tab)
📌 One-Sentence Summary 本次演讲介绍了 Google DeepMind 新发布的 Gemma 4 系列开放模型,重点阐述了其多样的模型尺寸、为边缘部署设计的创新逐层嵌入架构、多模态与多语言能力,以及围绕它们构建的活跃生态系统。 📝 Summary 来自 Google DeepMind 的 Omar Sanseviero 介绍了在一周前发布的 Gemma 4 系列开放模型。该系列包含从 20 亿到 320 亿参数不等的模型,旨在满足多样化的使用场景。关键创新包括采用逐层嵌入的 E2B(有效 20 亿)架构,该架构大幅减少了内存占用,并能在智能手机和树莓派等边缘设备上高效运行。这些模型具备强大的多模态(图像、视频、音频)和多语言(140 多种语言)能力。演讲展示了设备端代码生成、智能体任务和并行推理的实际演示。它强调了模型的 Apache 2.0 许可证、快速的社区采用(一周内下载量超过 1000 万)以及与 Android Studio 等产品的集成。演讲最后鼓励开发者探索在本地运行强大、可定制的开放模型的潜力。 💡 Main Points Gemma 4 是...
Read the original article