Suno CEO Mikey Shulman:人人都能创作音乐的时代已经到来 (opens in new tab)
📌 One-Sentence Summary Suno CEO Mikey Shulman 揭示了 AI 音乐生成的技术哲学——将声音建模为连续声波而非离散音符——并解释为何 Suno 90% 的用户是创作者而非听众,使其成为一个「创意娱乐」平台。 📝 Summary 在这期红杉资本播客中,Mikey Shulman 讲述了 Suno 从最初认为高质量音乐生成在计算上不可能实现,到成为 AI 音乐领域领导者的演变历程。突破来自一个关键架构决策:不以传统音乐理论(12 音阶、固定乐器类别)约束模型,而是将音乐建模为以每秒 48000 次采样的连续声波,用 float-32 数值表示。这种第一性原理的方法消除了人为限制,使模型能够生成在传统约束下不存在的声音——微分音音乐、trap 配西塔琴等跨界融合,乃至全新的声音类别。 Shulman 揭示,音乐生成本质上是研究问题而非规模问题。与 LLM 不同,更大的计算量并不能可靠地提升音乐质量——音乐没有客观的正确答案。人类偏好数据因此成为最重要的信号,形成良性循环:更多用户产生更好的偏好数据,推动更好的研究,吸引更多用户。 核心洞察是 S...
Read the original article