Sequoia 红杉:AI 现在已经准备好了
本文来自 Sequoia 合伙人 David Cahn,原文《AI is Now Shovel Ready》:
对即将到来的数据中心建设热潮的五项预测,及其对能源和经济的影响。
我们在这里已经详细讨论了 AI 基础设施建设的收入方面。我的上一篇文章《AI 的 6000 亿美元问题》集中讨论了 AI 的隐含收入预期,并质疑我们在多长时间内能够达到这些高远的目标。
这篇文章转向了成本方面的方程式。特别是,我们将关注数据中心的建设、“AI 工厂”的兴起及其对能源、建设和工业供应链的影响。我们相信 2025 年将是“数据中心之年”,我们正处于从炒作周期向工业驱动建设周期过渡的边缘。
一些预测,然后让我们进入细节:
- AI 将催化能源转型。新的太阳能建设、电池创新、核能的复兴——这些将是 AI 浪潮的长期效应
- 一些超大规模公司将发现他们不足以应对快速变化的数据中心需求——新的工业 AI 玩家将出现以填补这一空缺
- 从未来 6 个月开始,将有很多关于液体冷却、集群规模和电力获取问题导致数据中心建设延迟的头条新闻
- 建设新 AI 数据中心所需的工业能力将作为经济刺激并在实体经济中创造就业机会:钢铁、能源、卡车运输和建筑业
- 当新的数据中心容量上线时,由 AWS、Azure 和 GCP 提供的训练和推理成本将下降,这对初创企业有利
- 与 AI 未来的重大技术未知数相比,这里有一丝清晰:我们可以开始计划一个 2-3 年的工业扩展期。我们准备好从抽象的承诺(见下文)转向实际的建设。
以下是去年宣布的新数据中心项目摘要——我们相信这些项目的建设现在将加速:
- 亚马逊:2024年上半年,AWS宣布了价值500亿美元的新数据中心项目,包括216座新建筑。总体而言,亚马逊在未来 15 年内承诺投入 1000 亿至 1500 亿美元。最近的承诺包括:印第安纳州的 110 亿美元园区、密西西比州两个园区的 100 亿美元、沙特阿拉伯的新数据中心 53 亿美元、宾夕法尼亚州塞勒姆附近的新核电数据中心、德克萨斯州朗德罗克附近的新计划数据中心和日本的 150 亿美元承诺。德国、台湾和新加坡也在考虑新项目。
- 微软:微软现在拥有 5GW 的能源容量,并据报道在 2024 年翻倍新数据中心建设。最近的公告包括:威斯康星州芒特普莱森特 33 亿美元,印第安纳州西北部 10 亿美元,佐治亚州弗洛伊德县 10 亿美元,法国 43 亿美元,德国 35 亿美元,英国 32 亿美元,瑞典 32 亿美元,西班牙 22 亿美元,马来西亚 17 亿美元,印度尼西亚 10 亿美元和墨西哥的新数据中心。据报道有一个 1000 亿美元的星门数据中心,虽然这没有得到证实。
- Google:Google 是三大云提供商中规模最小的。GCP 的长期推销是它对 AI 公司更好。现在,这正接受考验。Google 正在印第安纳州建设一个新的 20 亿美元的数据中心,密苏里州堪萨斯城 10 亿美元的数据中心,芬兰 11 亿美元的数据中心和爱荷华州锡达拉皮兹 576 百万美元的数据中心。Google 还面临在某些地点扩展其 TPU 集群的挑战。
- Meta:Meta 不经营云业务,但仍在扩展其数据中心容量以支持 Llama 和其他内部 AI 计划。Meta 最近宣布它已积累了 350,000 个 H100 GPU,作为总共 600,000 个 H100 等效的部分。该公司还宣布了两个专门用于 Llama 3 训练的 24,000 GPU 集群。Meta 目前有四个新的数据中心正在建设中,包括在爱达荷州库纳、德克萨斯州坦普尔、爱荷华州达文波特和怀俄明州夏延。
正在发生的工业规模令人震惊。这些公告代表了一代人中一次或两次的工业扩展。
重要的是要了解即将到来的挑战有多么独特和紧迫。需要连接到电网的能源项目积压很长。即使有更快的互连,我们也需要更多的电力来支持所有这些新数据中心。需要增加发电容量,主要以太阳能和风能的形式,我们需要创造性地利用现有的能源资源。这些电力限制在弗吉尼亚州、内华达州和加利福尼亚州等“主要”数据中心市场尤为深刻。因此,许多新的发展正在怀俄明州、印第安纳州、爱荷华州和伊利诺伊州等“次要”市场发生。在 AI 之前,更多的电力和更好运作的电网需求已经很明显。现在,这变得紧迫。
其他技术问题层出不穷:下一代 Nvidia 芯片将需要液体冷却,而液体冷却供应链现在出现短缺。柴油发电机的等待时间为两年。集群规模达到前所未有的水平:埃隆·马斯克宣布了一个 300,000 GPU 集群。模型变得如此之大,它们最终可能需要在多个数据中心的分布式集群上进行训练。锂离子电池已成为新数据中心建设的主要设备;正在考虑新的方法来进一步降低成本并增加容量。
超大规模企业以其建设数据中心的运营严格著称,但这一波新的建设将考验他们最优秀的团队。预计在超大规模企业中会出现一些分化的结果——这里将有赢家和输家。新的工业 AI 玩家将有机会填补任何运营差距。现有的市场参与者如 Equinix、Digital Realty 和 CyrusOne 正经历“需求冲击”——他们要么将站出来并从中受益,要么将失去市场份额给新进入者。
预计在 2025 年会有很多关于数据中心建设延迟的头条新闻。也预计会有一些大的、意外的成功。当我们离开比特的领域进入原子的领域时,一种新的技能组合将占据主导地位,运营严格性变得至关重要。正如我们在 SpaceX 和特斯拉看到的那样,在这些混乱、快速变化的环境中茁壮成长的公司类型往往不是现有的 incumbents。在复杂变化的时刻,强大的领导力和灵活性会带来最大的回报。
AI 工业阶段应对实体经济产生真正的经济刺激作用,特别是在急需的经济领域。受益者将包括工业供应链中的组件制造商、建设新一代资产(如太阳能和风能)的能源公司、核反应堆运营商等。例如,本周我们正在访问西弗吉尼亚州的一家电池工厂,该工厂建在一个旧煤矿厂的现场。在短期内,更多的就业增长可能会集中在建设和工业劳动力上,而不是在硅谷设计模型的少数研究人员身上。
所有这些增长是如何融资的?在很大程度上,大型科技公司正在从他们的资产负债表上部署资本。现在“辉煌七巨头”占标准普尔 500 指数的 30% 左右,他们部署资本的规模和速度令人叹为观止。金融公司也参与其中,产生额外的杠杆作用。许多私募股权公司乐于提供建设和 GPU 采购的预付资本,以换取微软的借据和合理的收益。
当一切尘埃落定时,我们将拥有很多 AI 工厂。是否会有足够的需求来填补这些工厂,我们还不知道。至少,训练和推理的成本应该会继续下降,这对初创公司有利。