钢铁、服务器与电力
24-08-08
人工智能新阶段:硬件建设成为关键
过去12个月,人工智能领域的竞争主要集中在模型性能的提升上,通过研究新技术、改进训练数据和扩大计算集群规模来实现。然而,随着模型规模的增长,人工智能的下一个发展阶段将更多地依赖于物理硬件的建设,而非科学发现。
模型规模的扩大
根据“苦涩教训”,模型规模是性能提升的首要因素。因此,下一代模型的目标是将规模扩大10倍,达到30万个GPU。这需要建立全新的数据中心来容纳这些模型。
影响
- 模型开发周期延长:以往6到12个月的训练周期,现在需要增加18到24个月的建设时间。
- 竞争优势来源变化:在新阶段,建设效率可能比研究突破更为重要。
投资增长
大型科技公司的年度资本支出(CapEx)从1380亿美元增长到2290亿美元,其中新增的910亿美元可以看作是对新AI数据中心建设的投资。
未来1-2年的发展
数据中心建设是一个复杂的过程,涉及土地购买、电力供应、长期租赁、资金筹集、建筑承包等。在这个过程中,日常运营执行将对成功产生最大影响。
竞争格局
目前,五家公司处于数据中心规模扩张的新竞赛起跑线上:微软/ OpenAI、亚马逊/Anthropic、谷歌、Meta和xAI。它们各自拥有经过严格基准测试的模型和必要的资本。
- Meta和xAI:作为消费公司,它们将垂直整合,希望通过单一创始人决策者来简化和紧密耦合模型构建与数据中心设计和建设。
- 微软和亚马逊:拥有经验丰富的数据中心团队和雄厚的资金,与顶级研究实验室建立了合作关系,希望通过向其他公司出售训练服务和模型推理服务来实现盈利。
- 谷歌:拥有消费者业务和云业务,以及自己的内部研究团队。谷歌还通过TPU实现了从芯片层面的垂直整合,这将提供长期结构优势。
随着CapEx计划的确立和竞争格局的形成,人工智能的新阶段开始了。在这个阶段,钢铁、服务器和电力将取代模型、计算和数据,成为任何希望领先者的“必须赢得”的要素。