LLM 时代的个性化推荐:Spotify 生成式推荐引擎的三大技术支柱 (opens in new tab)
📌 One-Sentence Summary Spotify 技术负责人详解如何以统一 LLM 驱动的生成式推荐引擎取代碎片化的传统推荐流水线,核心支撑三大支柱:用户基础嵌入、语义 ID 目录分词与软分词实时个性化。 📝 Summary Shivam Verma 是 Spotify AI Foundation 团队用户表征组的技术负责人,他以第一视角完整讲解了 Spotify 如何为全球 7.5 亿月活用户现代化推荐基础设施。演讲围绕三大核心支柱展开。第一,用户基础建模:Spotify 从基于自编码器的用户嵌入迁移至以 Transformer 为骨干的序列模型,将用户、歌曲和播客节目映射到同一超球面嵌入空间,实现十亿用户规模下的跨内容建模。第二,通过语义 ID 理解内容目录:将 1000 维内容向量压缩为 4-6 个离散层次化 Token,让在 Spotify 数据上微调的开源 LLM(Llama、Qwen)能够自回归地预测用户下一首播放的歌曲或节目。层次化 Token 结构以 Ariana Grande 和 Bruno Mars 为例,两位艺术家作为流行歌手共享前导 Token...
Read the original article