SpaceX对外出租AI算力内幕曝光:硬件瓶颈致自家AI训练受阻 - SpaceX (opens in new tab)
据知情人士透露,SpaceX原本计划利用三个数据中心园区组成的计算集群提供的海量算力,训练其最先进的AI模型。然而,在将Colossus 1与另外两个距离超过10英里(约合16公里)的数据中心连接时,公司遇到了网络延迟问题,而老化的网络基础设施又让这一情况雪上加霜。需要说明的是,训练规模更大、性能更强的AI模型需要超高速网络连接。如果数据中心之间的连接线路较为老旧或带宽不足,就会产生延迟,从而拖慢整个数据中心集群的运行效率。知情人士称,SpaceX认为,与其继续投入资源解决这些基础设施瓶颈,将Colossus 1的数据中心容量出租给外部客户更具经济价值,这样还能创造新的收入来源。SpaceX在今年早些时候收购了马斯克旗下AI公司xAI,在其重磅IPO路演期间已将数据中心的建设作为向投资者推介的关键卖点之一。Anthropic和谷歌已分别与SpaceX达成了可能为期数年、价值数百亿美元的算力合作协议,这进一步推动了这家火箭制造商向AI基础设施提供商转型的步伐。然而,Colossus 1计划的调整,也从侧面反映出马斯克大举投入AI基础设施建设所面临的挑战。为了支持AI发展,马斯克一直...
Read the original article