Benchmark 合伙人 Sarah Tavel:LLM 大模型的巨额筹码之战
Benchmark 合伙人 Sarah Tavel 最新文章《The big stack game of LLM poker》,认为随着 LLM 变得越来越复杂,它们能够解锁的经济价值也会越来越大。她前一篇文章《Benchmark 谈最优秀 AI 产品的共同点:Midjourney、HeyGen、ElevenLabs 与 DeepL》谈到了一个结构性成本优势。
结合 Cohere 创始人最新的对话可能更有收获《Cohere 创始人:如果只是出售模型 API,AI 企业将几乎没有利润》,相比于 Cohere 创始人 Aidan Gomez,Sarah Tavel 要乐观很多,下面是全文:
我相信你已经读过 David Cahn 的那篇挑衅性文章《AI 的 6000 亿美元问题》。他在文章中指出,鉴于 NVIDIA 预计 2024 年第四季度的收入年化率为 1500 亿美元,为了偿还用于训练和运行大型语言模型的巨大投资,现在需要 6000 亿美元的 AI 收入,而我们在这笔回报上至少还差 5000 亿美元。
这些数字确实令人震惊……而且只会越来越大。除非我们达到在增加计算资源的边际价值上的有效前沿,或者人们对 Transformer 架构失去信心,现在的局面就是一场“谁先眨眼”的比赛。
如果你是像 META、MSFT、GOOG 这样的巨头,或者是任何基础模型的纯粹玩家,你别无选择,只能全力以赴——“赢”的奖品和力量太大了。如果你犹豫,你将一无所获,看着别人把你的筹码收入囊中。可能会有数千亿美元被摧毁,同时也会有数万亿的收入产生。
现在还早,谁是赢家或输家还不得而知。但对于我们所有处于创业生态系统中的人来说,这将创造出新的 AI 机会浪潮。
退一步讲,随着 LLM(大型语言模型)的进步,它们能够处理越来越复杂的任务。许多基础模型公司用人类完成工作的时间来衡量 LLM 的能力。如果今天的 LLM 能处理人类需要 30 分钟完成的任务,那么随着 LLM 的进步,它们将能够处理需要人类更长时间完成的越来越复杂的任务。在未来十年,人们相信它们将能够处理人类需要数千年才能完成的任务。因此,随着 LLM 变得越来越复杂,它们能够解锁的经济价值也会越来越大。
举个例子,每年全球在软件工程师上的支出估计达到 1 万亿美元。当人们谈论 GitHub Copilot 时,你会听到一些人说它能提高 10-20% 的生产力(当然,GitHub 声称这个数字更高)。如果完全部署,这将每年创造 1000 亿到 2000 亿美元的价值(其中 GitHub 会获得一定比例)。实际上,Copilot 很可能已经为微软带来了数十亿美元的收入。
随着 LLM 的进步,能够超越代码补全(“copilot”)到代码创作(“autopilot”),价值创造几乎没有上限,因为它将显著扩大市场——如果有人能成为主导者,这将是一个潜在的数万亿美元的机会。
这还只是编程领域,我们都体验过 LLM 提升生产力的好处(或者收到过自动客服回复),AI 带来的潜在价值创造和捕获超出了我们现有的思维模型。
挑战在于训练每一个更先进的 LLM 所需的资金量增加了一个数量级,而且一旦一个模型被另一个模型超越,旧模型的定价能力迅速降至零。现在开发者可供选择的 GPT-3.5 等效模型比他们有时间测试的还要多。
这并不意外,GPT-3.5 在 2022 年 11 月发布时,远远领先于任何竞争模型,每 1000 个 token 的价格是 0.0200 美元。而现在的价格是 0.0005 美元——仅为原价的 2.5%,只经历了 1 年半的时间。
我想不出有哪种技术像 LLM 这样迅速成为大众商品。这种动态使得在游戏的这个阶段几乎不可能合理化任何 ROI,因为对 LLM 的任何投资几乎都会被下一个版本迅速贬值。但你不能真的跳过任何一步。你需要经历无数毫无价值的版本,才能最终达到理想中的 AGI(通用人工智能)。
因此你会发现自己处于一种完美风暴中:
- 随着模型的每一次升级,你能够解锁的经济价值应该显著增加。AGI 的经济价值只受限于我们的想象力。
- 定价杠杆效应来自于在某些方面至少比竞争对手领先一大步。如果你落后了,你的模型对外部客户的价值会迅速变得大众化(当然,对于内部用途仍然有价值)。
- 微软、谷歌和 META 有核心业务,它们产生了大量现金流,Anthropic 得到了谷歌和亚马逊的青睐,OpenAI 应该能够继续从拥有大量现金的主权国家那里筹集资金。
最终结果是,在短期内,直到在现有的 Transformer 架构上继续投资基础设施的边际价值达到有效前沿,或者我们耗尽了电力,或者某个群体以不可触及的优势领先,在这个领域的投资应该会继续大幅增加,而成本必然会先于收入。
理论上来说,如果出现一个明确的赢家,奖励是如此巨大,它们的市场机会是无限的,你不得不继续加大赌注。
我们都是这场竞争的巨大受益者。基础设施 / 训练等方面的投资速度之快,再加上只有在激烈竞争中才会出现的紧迫感,给了我们所有人一个疯狂创新的礼物,使用能够以极低价格处理越来越复杂任务的模型。
今天可能还不可能实现的应用,更不用说经济上可行的应用(比如大多数语音和视频应用),在我们意识到之前就会变得盈利。准备好迎接这场挑战吧!