🔬ESMFold2:蛋白质领域的“苦涩教训”——Alex Rives 与 BioHub (opens in new tab)
📌 One-Sentence Summary BioHub 团队推出的开源蛋白质结构预测模型 ESMFold2 表明,在多样化数据上扩展简单的 BERT 类 Transformer,能够在蛋白质相互作用(尤其是抗体)方面超越 AlphaFold3 等专用模型,这标志着计算生物学迎来了“苦涩教训”时刻。 📝 Summary 本文来自 Latent.Space,报道了 Alex Rives 与 ESM 团队在 BioHub 发布 ESMFold2 的消息。该新模型基于名为 ESMC 的“世界模型”构建,该模型在 28 亿条蛋白质序列上训练而成,在蛋白质相互作用(尤其是抗体这一治疗领域的关键区域)上达到了最先进水平。其核心洞见在于,一个普通的 BERT 类 Transformer,只要在足够大且多样化的数据上训练,就能击败依赖多重序列比对(MSA)等归纳偏置的 AlphaFold3 等专用模型。文章认为,MSA 虽然巧妙,但会损害泛化能力,尤其对于抗体这类快速突变的蛋白质。ESMFold2 的方法被视为生物学领域的“苦涩教训”:扩展数据和计算能力,而非依赖领域特定的工程化设计,才是实现...
Read the original article