LinkedIn Feed 如何利用 LLM 服务 13 亿用户 (opens in new tab)

📌 One-Sentence Summary 本文详述了 LinkedIn 的工程历程，即用一个统一的 LLM 驱动模型取代其复杂、多系统的 Feed 检索架构，解决了数据表示、训练效率、序列化排序和大规模服务基础设施方面的挑战。 📝 Summary 本文全面概述了 LinkedIn Feed 工程团队如何彻底改革其内容推荐系统。它描述了从五个独立检索系统（按时间顺序、热门、协同过滤等）的异构架构，向一个基于 LLM 的、用于语义检索的双编码器单一模型的转变。文章探讨了关键的技术挑战和解决方案，包括将结构化数值数据转换为百分位数分桶以供 LLM 理解，通过过滤掉模糊的‘滚动略过’帖子来优化训练，以及实现一种新颖的生成式推荐器模型，该模型将用户的交互历史作为一个连续的故事而非孤立事件来处理。文章还深入探讨了在 LinkedIn 13 亿用户规模下服务此模型所需的关键基础设施投资，涵盖了自定义 GPU 内核、共享上下文批处理和去中心化的服务架构。最后，文章对系统简洁性与鲁棒性之间的权衡，以及所需的巨大工程投入，给出了平衡的观点。 💡 Main Points 用一个基于 LLM 的双编...

Read the original article