Sequoia 红杉资本:AI 的第二篇章
在关于 AI 的预测文章《Generative AI:A Creative New World》发布一年后,红杉资本(Sequoia Capital)今天发布了关于 AI 的第二篇预测文章《Generative AI Act Two》,认为 AI 已经进入了一个全新的第二个阶段,并绘制了一个新的 AI 图谱。
对于过去一年的第一阶段,Sequoia 认为其核心在基础模型以及由此带来的一波新 AI 应用;而现在第二阶段的核心,则在真正解决客户需求的应用,这些应用与第一波 AI 应用有本质上的不同:
它们倾向于将基础模型作为更全面解决方案的一部分,而不是整个解决方案。它们引入了新的操作界面,使工作流程更加具有粘性,输出也更好,同时它们往往是多模态的。
这个第二阶段里,典型的产品包括了我之前介绍过的法律领域 AI Harvey,AI 伴侣 Character AI 和 Ava 以及企业搜索和知识管理平台 Glean。
其中法律领域的 AI,我认为是目前 AI 真正起飞并且对行业从业者带来的更多是正面影响的一个垂直行业,除了 Harvey 也包括之前介绍过的其它多个产品,比方说 EvenUp,它被 Benchmark 合伙人 Sarah Tavel 认为会在其所在行业占据主导地位,有的律所客户在使用其产品后一个季度的收入已经是其之前一年的了。当然类似 Character AI 这种提供情绪价值的 AI 伴侣产品也是我一直比较看好的一个方向。
红杉也发布了一个新的 AI 图谱,不过这次不是按照模式来归类,而是按照应用场景做的产品分类,它反映了市场上两个重要的推动力:生成式人工智能从技术工具演变为实际应用和价值,以及生成式人工智能应用日益多模态化的特性。如下图:另外,还发布了一个新的 LLM 开发者栈(stack)图谱,它反映了公司在构建生成式 AI 应用程序时所需要的计算和工具产品,基本上覆盖了开发者在开发 AI 应用过程中可能需要用到的所有工具,如下图:
经过一年的发展,红杉认为之前在 AI 预测的第一篇文章里提出的一些观点已经被证实是错误的,这包括了:
1.整个 AI 发展的速度比之前预计的要快很多。去年,红杉预计需要近十年时间才能拥有实习生级别的代码生成、好莱坞级别的视频效果和听起来不那么机械的人类质量语音克隆和生成。但是现在,基于 Eleven Labs 的声音已经在 TikTok 上越来越普及、Runway 已经举办了 AI 电影节,我们可以清楚地看到未来已经在以超光速到来。甚至 3D 模型、游戏和音乐也在迅速变得越来越好。
2.瓶颈在供应端。没有预料到客户对 GPU 的需求大大超过了供应,很多公司的瓶颈都变成了不是客户需求,而是获取英伟达最新 GPU 的渠道。长时间等待变成了一种常态,因此也出现了一个简单的商业模式:支付订阅费以跳过排队,获得更好的模型。
3.垂直分离(Vertical Separation)尚未发生。红杉认为,“应用层”公司和基础模型提供商之间将会有一种分离,模型公司专门从事规模和研究,而应用层公司专门从事产品和用户 UI。但事实上,这种分离还没有完整地发生,现在最成功的面向用户的应用产品一开始就是垂直整合的。
4.残酷的竞争环境和现有者的迅速反应。去年,竞争格局中有一些过度拥挤的行业(尤其是图像和文案生成),但总体上市场是空白的。今天,竞争格局里竞争要多于机会,现有公司的快速反应,从 Google 的 Duet 和 Bard 到Adobe 的 Firefly,以及现有企业愿意冒“风险”,加剧了竞争。即使在基础模型层面上,也能看到客户会选择各种不同的供应商来建立其基础设施。
5.护城河在客户,而不是数据。红杉预测说,最好的生成式人工智能公司可以通过数据飞轮(更多使用→更多数据→更好的模型→更多使用)来产生可持续的竞争优势。虽然这在某种程度上仍然是正确的,特别是在具有非常专业和难以获取数据的领域,但“数据护城河”的基础是不稳固的:应用产品生成的数据并不能创造无法逾越的护城河,下一代基础模型很可能会摧毁初创公司生成的任何数据护城河。相反,工作流程和用户网络似乎正在创造更持久的竞争优势来源。
当然也有一些预测对了的地方,比方说:
1.生成式 AI 确实是一个大事情。突然之间,每个开发者都在开发生成式人工智能应用,每个企业买家都在需要它。市场甚至保持了“生成式人工智能”的名号。人才涌入市场,风险投资资金也蜂拥而至,生成式人工智能甚至成为了流行文化现象。
2.第一批杀手级应用已经出现。有充分的证据表明,ChatGPT 是最快达到 1 亿月活跃用户(MAU)的应用,并且仅用了 6 周的时间。相比之下,Instagram 用了 2.5 年,WhatsApp 用了 3.5 年,YouTube 和 Facebook 用了 4 年才达到这个水平。同时,ChatGPT 并不是一个孤立的现象。Character AI 的深度参与度(平均每次使用 2 小时),Github Copilot 的生产力优势(效率提高 55%),以及 Midjourney 的商业化路径(数亿美元的收入)都表明,第一批杀手级应用已经到来。
3.开发者是关键。像 Stripe 或 Unity 这样以开发者优先的公司的核心洞察之一是,开发者可以打开你甚至无法想象的应用场景。在过去的几个季度中,我们接收到各种各样的创业产品,从音乐生成社区到 AI 红娘到 AI 客户支持代理都有。
4.产品形态在不断演变。AI 应用的第一批产品主要是自动补全和初稿的撰写,但在产品形态上现在正在变得更加复杂。Midjourney 引入的相机平移和填充是一个很好的例子,说明 AI-first 的用户体验变得更加丰富。总体而言,产品形态正在从个人生产力向系统级生产力,以及从人机交互到面向执行的代理系统演变。
5.版权和伦理等问题。这些热门话题的争论一直没有停过,艺术家、作家和音乐家被分成了两派,一些创作者对 AI 可能侵犯其产权感到愤怒, 另一些创作者则非常拥抱 AI 这个新的现实。监管这块也是。
红杉认为,生成式 AI 并不缺应用场景和客户需求,人们都希望能通过它提高效率,这从 ChatGPT 的快速增长就能看出。
但是在用户留存这块还有比较大的空间,红杉将 AI 优先的几个产品和现有一些产品的留存做了一下比较,平均来看还是有不少差距的,如下图:在用户的参与度这块,除了类似 Character AI 这种 AI 伴侣类产品,差距也比较大,这意味着用户还没有发现足够的价值来每天使用生成式人工智能产品。整体来说,红杉认为生成式人工智能最大的问题不是找到应用场景或者说需求,而是如何证明价值。当然 AI 还处于一个非常早期的阶段,这些需要通过时间来慢慢解决。
红杉认为,经过这一年的发展,在大模型的使用和新的 UI 范式这块,已经越来越有一些通用的剧本。这包含了模型的开发栈(The Model Development Stack)以及新兴产品蓝图(Emerging Product Blueprints)。
在 The Model Development Stack 这块:
- 新兴的推理技术,如 chain-of-thought、tree-of-thought 以及 reflexion ,正在提高模型执行更丰富、更复杂推理任务的能力,缩小客户期望和模型能力之间的差距。开发人员正在使用像 Langchain 这样的框架来调用和调试更复杂的多链序列。
- 像 RLHF 和微调这样的迁移学习技术正在变得越来越可行,特别是随着最近 GPT-3.5 和 Llama-2 的微调功能的推出,这意味着公司可以将基础模型适应到他们特定的领域,并从用户反馈中进行改进。开发人员正在从 Hugging Face 下载开源模型并对其进行微调,以实现更好的性能。
- 检索增强生成正在引入业务或用户的上下文背景,减少幻觉,增加真实性和实用性。来自类似 Pinecone 的向量数据库已成为 RAG 的基础设施骨干。
- 新的开发工具和应用框架为公司提供了可重复使用的构建模块,以创建更先进的人工智能应用程序,并帮助开发人员评估、改进和监控生产中的人工智能模型,包括像 Langsmith 和 Weights & Biases 这样的 LLMOps 工具。
- AI 优先的基础设施公司如 Coreweave、Lambda Labs、Foundry、Replicate 和 Modal 正在解构公有云,并提供 AI公司最需要的东西:成本合理、按需可用、高度可扩展的大量 GPU,以及良好的 PaaS 开发者体验。
各种技术的不断发展正在缩小基础模型期望与现实的差距,但产品层面也很重要,因此在 Emerging Product Blueprints 这块,这些变化也在越来越成为一种通用的方式:
- 生成式交互。基于文本的对话式体验是 LLM 之上的默认交互形式。但这种形态在慢慢地发生变化,从 Perplexity 的生成式用户界面到 Inflection AI 的类人声音等新形态。
- 新的编辑体验:从 Copilot 到 Director 模式。比方说 Midjourney 的新平移命令和 Runway 的 Director 模式创造了新的类似相机的编辑体验,Eleven Labs 则在通过提示来操纵声音。
- 越来越复杂的代理系统。生成式人工智能应用不再仅仅是为人类审查提供自动补全或初稿;它们现在具有自主性,能够解决问题,访问外部工具,并代表我们解决问题的整个过程。我们正稳步从 0 级自主性逐渐进展到 5 级自主性。
- 系统范围的优化。一些公司直接解决系统范围的优化问题,而不是嵌入单个用户的工作流程并使该用户更有效率。
整体来看,随着大家对大模型的新奇逐渐消失,生成式 AI 市场的性质正在发生变化,市场更加关心真正的价值和产品的整体体验。红杉认为,杀手级应用的出现和大规模终端用户的需求让我们对市场具有更大信心。