Cohere 创始人:如果只是出售模型 API,AI 企业将几乎没有利润
人工智能(AI)技术的商业模型正在快速变化,这是由 Cohere 的创始人 Aidan Gomez 在最近一次播客中提出的论点。
他指出,目前像 OpenAI 和 Anthropic 这样的公司每年在训练如 GPT-4 和 Claude 这样的模型上花费数十亿美元,但由于激烈的价格竞争,围绕这些平台的商业变得相当不稳定。
Gomez 认为,仅仅通过销售模型,即向开发者提供 API 接口访问 AI 模型,将很快变成一个“零利润业务”。尽管这些 AI 模型的需求在迅速增长,但由于价格战,利润空间将变得非常有限。
Cohere 作为 AI 模型的提供商,也面临着类似的挑战。Gomez 提到,尽管 Cohere 的 AI 模型在长期内将是一个有吸引力的业务,但在短期内,通过产品化可能是实现收入的更有意义的方式。
他强调,目前 AI 模型的成本远远超过了它们所产生的收益,而像微软和谷歌这样的大公司可能能够承受或简单地经受住这种损失,但对于初创公司来说,情况并非如此。
此外,大型科技公司在初创公司有机会成为竞争对手之前,就已经开始“吞噬”这些新兴公司。Gomez 警告说,成为云服务提供商的子公司是非常危险的,因为风险投资人可能只想要一个不错的回报,而云服务提供商可能想要更多。
在这种竞争激烈的环境下,开发前沿 AI 模型的公司面临着越来越大的挑战。虽然有传言称,模型架构、数据效率或计算能力的创新将为这些 AI 模型带来巨大的回报,但没有人知道这一天何时或是否会到来。显然,并非今天的每家 AI 初创公司都能看到那一天。
下面是 20VC 与 Aidan Gomez 的对话内容,由 AI 完成,原对话你可以在这里查看:
20VC:Aiden,我对这次采访感到非常兴奋。我在准备的时候,首先在写日程安排时,我在想从哪里开始,然后我看到了一个笔记,上面写着你是在安大略省的农村长大的,住在你祖父或父亲亲手建造的房子里。那是什么样的体验?你能带我去那里吗?
是的,我在安大略省一个偏僻的地方长大,那是一块 100 英亩的大地,全是森林,是一片枫树林。所以,在最具加拿大特色的环境中长大是非常酷的,但这与科技完全隔绝。
20VC:但你喜欢游戏,对吗?
是的,我确实喜欢游戏。我从一开始就喜欢科技,只是很难接触到它。我们无法上网,只能用拨号上网。我用了很多年拨号上网,当时人们已经有高速互联网了。我的朋友们都在网上玩游戏,做各种事情,而我只是非常嫉妒,或者说错过了互联网这一波科技潮流。这让我对科技产生了痴迷。我会坐在家里,用我们那台糟糕的拨号上网的电脑,试图让它变得更快,尽量利用我所拥有的一切。
最终,这促使我想学习编程,了解网络是如何工作的,看看我能否让这些东西加载得更快,因为我看着像素一行一行地加载。这真的推动我进入了计算机科学领域,迫使我去了解这些技术是如何工作的,以便我能从中获得更多。
在我遇到过的许多令人难以置信的创始人中,我发现一个奇怪的现象,那就是在他们早年玩游戏与他们后来取得成功之间有着极高的相关性。你认为为什么游戏对成功的创始人有如此大的贡献?
电子游戏教会你一些东西,你会更愿意去磨练,去做重复的、困难的、痛苦的事情,以实现某个更大的目标。所以那种韧性是非常重要的。还有,你可以重新尝试,你可以有第二次机会。这种乐观或这种思维方式在很多文化中是非常重要的。
在很多文化中,你只有一次机会,你有一个声誉,如果你搞砸了,那就完了。但也许游戏能给人们一种感觉,那就是你可以搞砸,然后再尝试,并且每次都会做得更好。通过失败取得进步的概念,我认为这对成功非常重要。
我还一直相信游戏设计的力量,比如渐进式的学习方式。游戏设计得一开始比较容易,让你感到很棒,建立信心。你永远不会从一个非常难的第一关开始游戏,让人们觉得不可能完成而放弃。
是的,这在机器学习中被称为课程学习。你希望先让模型学习一些非常简单的东西,然后逐渐增加复杂性,建立在已有的知识之上。有趣的是,课程学习在机器学习中实际上失败了。我们并不真正做课程学习,而是把最难和最简单的材料同时抛给模型,让它自己去弄清楚。但对于人类来说,这种方法非常有效,这是我们学习的一个重要部分。有趣的是,这种方法在机器学习中并没有流行起来。
20VC:你提到只需增加计算能力。我想直接深入这个问题,因为这可能是大家都在问的问题。每个人都在说,只需要更多的计算能力,这是我们今天遇到的最大瓶颈。我们只需要更多的计算能力,性能就会提高。你认为这是事实吗?还有更多的提升空间吗?还是其他因素现在在阻碍性能的提升?
确实,如果你增加模型的计算能力,让模型变得更大,它会变得更好。这是提高模型性能最可靠的方法,也是最笨的方法。如果一切都失败了,就把模型做大。对于那些有很多钱的人来说,这是一个非常有吸引力的策略,风险很低,你知道它会变得更好,只需扩大模型,支付更多的费用。
但我认为这非常低效,有更好的方法。如果你看看过去一年半的时间,从 ChatGPT 问世或 GPT-4 问世到现在,如果 GPT-4 真的是 1.7 万亿参数这么大,我们有比这个模型更好的模型,只有 130 亿参数。所以这种变化的规模非常大,变得更便宜的速度是惊人的,几乎有点不真实。所以是的,你可以通过扩大规模来实现这种模型质量,但你可能不应该这样做。
20VC:这种进步会继续以同样的速度进行吗?还是会在某个点上达到顶峰?你提到摩尔定律,总有一天它只是一个更好的计算器。
我认为它确实需要指数级的投入,你需要不断地加倍计算能力,以维持智能的线性增长。但我认为这种情况会持续很长时间,它会变得越来越聪明。但你会遇到经济上的限制。
并不是很多人购买了原始的 GPT-4,特别是企业,因为它非常庞大,效率极低,成本高昂,智能不足以证明其成本。所以我认为市场对更小、更高效的模型有很大的压力,通过数据和算法方法使模型变得更聪明,而不仅仅是通过扩大规模。
20VC:我们生活在一个非捆绑的垂直模型的世界中,这些模型更高效、更小,专为特定用例设计。还是会有三到五个大型模型主导一切?
两者都会存在。过去几年中我们看到的一个模式是,人们喜欢用一个普遍智能的模型进行原型设计。他们不想用一个特定的模型进行原型设计,也不想花时间微调模型,使其在他们关心的特定领域表现出色。
他们想要做的是抓取一个昂贵的大模型进行原型设计,证明它可以完成任务,然后将其提炼成一个高效、专注的模型,专注于他们关心的特定事情。所以这种模式已经显现出来了。我认为我们将继续生活在一个多模型的世界中,有些模型是专注和垂直化的,另一些则是完全水平化的。
20VC:你提到成本和需要加倍计算能力以保持同样的智能水平。成本是巨大的,几乎不像我们以前在科技领域见过的情况。我认为 OpenAI 的开支大约是 30 亿美元。除非你是微软、亚马逊、谷歌或 Facebook,否则你如何负担得起在这场竞赛中保持领先地位?
如果你只是做扩展项目,你必须是其中之一,或者是其中之一的有效子公司。但还有很多其他的事情可以做。如果你不仅仅依赖于规模是唯一的前进道路,如果你相信数据创新、模型和方法创新……
20VC:你能解释一下什么是数据创新和模型及方法创新吗?
当然。几乎所有在开源领域中取得的主要进展都来自于数据改进。通过从互联网上获取更高质量的数据,改进模型。更好的网页抓取算法,提取网页中的正确部分,提升互联网中最有价值的知识部分,并将其强调给模型。
合成数据和创建新数据的能力也是非常可扩展的,你可以获得数十亿字甚至数亿页的内容,但这些都没有人类参与,完全由模型编写。这些创新——提高数据质量的能力,已经带来了我们现在看到的绝大多数进步。
20VC:那么模型和方法创新呢?
这是指新的强化学习算法,比如有很多关于 Q-Star 的传言,以及搜索解决方案的想法。当前模型的现状是我问你一个问题,你是一个模型,模型被期望立即给出正确答案。这对模型来说是一个非常高的负担。
你不能对一个人这样做,你不能问一个人一个难题并期望他们立即回答。他们需要思考,解决问题。现在的模型没有解决问题的概念。
20VC:解决问题是否等同于推理?
是的。推理并不难,难的是没有足够的训练数据来展示推理过程。互联网大部分是推理过程的输出。当你在网上写东西时,你不会展示你的工作过程,而是呈现你的结论或想法,这是经过大量思考和讨论后的结果。所以我们缺乏展示推理过程的训练数据。这就是像 Cohere、OpenAI 和 Anthropic 等公司现在正在做的事情——收集展示人类推理的数据。
20VC:你如何看待与 OpenAI 的用户生成内容(UGC)策略竞争?
这是非常困难的,特别是在企业中,他们从不允许你使用他们的数据进行训练。我们不能使用任何客户的数据,这些数据非常私密。他们认为他们的数据是他们的知识产权,里面有太多的秘密,所以他们不愿意这样做。
我对此非常理解。因此,我们的重点是合成数据,我们也有自己的团队以及像 Scale 这样的合作伙伴来进行人类标注。这是我们必须承担的负担,因为我们不是一家消费品公司,我们必须自己生成这些数据。好处是我们更加专注,覆盖面较小。
20VC:未来 10 年,合成数据市场会是什么样子?会被两到三家供应商主导吗?
我听说当前的大语言模型 API 市场主要由合成数据主导,人们主要是在用这些大模型生成数据,以微调更小、更高效的模型。我不确定这是否是一个可持续的市场,但我肯定总会有新的任务或问题需要数据,不管这些数据是来自模型还是人类,我们都需要满足需求。
20VC:我有一个担忧,OpenAI 在价格上进行倾销,Meta 免费发布模型,宣扬开放生态系统的价值。我们是否正在看到这些模型的价值逐渐减少,这是一场向底线和零价格的竞赛吗?
如果你只卖模型,在未来一段时间内会非常艰难。这不会是一个小市场,因为人们需要这些技术,它在快速增长,但至少现在,利润率会非常低。
因此,应用层的兴奋是有道理的,我认为市场的讨论也正确地指出,价值发生在芯片层,因为每个人都在花费大量资金购买芯片来构建这些模型,然后在应用层,比如 ChatGPT,它按用户收费,这似乎是目前价值所在。我认为从长远来看,模型层是一个有吸引力的业务,但在短期内,由于价格倾销和免费模型的存在,它是一个低利润、商品化的业务。
20VC:你提到芯片层,如何看待你们今天在芯片上的支出,以及这在时间上的变化?
支出大大增加了,现在是我们支出中的很大一部分,甚至太多了。
20VC:你们与 Nvidia 有直接的关系吗?
是的,我们与许多芯片厂商关系密切,包括 Nvidia、AMD 和许多初创公司,我们也在使用 Google 的 TPU。
20VC:这是因为你们不想有单一的依赖点吗?
主要是因为市场需求。我们的客户希望能够在许多不同的平台上运行,他们希望有选择的余地,不想被锁定在一个平台上。所以我们需要提供一个非常多样化的平台基础,类似于我们避免被锁定在一个云服务商上,我们希望在每个云服务商上都可用,因为市场需要它,客户希望有选择的余地。
20VC:你认为每个人都会在新世界中垂直整合自己的芯片能力吗?
我认为会的。现在芯片的利润非常高,市场上选择非常少,但这正在改变。我认为在推理方面已经有很多选择了,你实际上已经有很多选择了,但在训练方面,目前基本上只有一家公司生产你可以用来训练大模型的芯片,这种情况还在继续,但我认为很快会有更多选择。
20VC:你们是否需要建立自己的数据中心?
不,我们与合作伙伴合作。如果建立自己的数据中心更便宜,我们会考虑这样做,但目前我们认为从供应商那里获得的价格使得自己建立数据中心不是一个有吸引力的选择。另一个原因是如果有一个芯片非常有吸引力,但没有供应商愿意为我们采购,我们可能会考虑自己建立数据中心。
20VC:在早期,你们在获取大量计算芯片方面遇到过挑战吗?
我们已经存在了 5 年,所以在整个事情爆发之前我们就已经在了。我们很幸运,当时并没有太多的供应链问题。
20VC:你预料到会爆发吗?
我不会创办公司如果我不预料到,但我没有预料到会以这样的方式爆发,尤其是在 2017 年发布 Transformer 论文的时候,我只是个实习生,我认为这只是研究,改进翻译分数 3%,就是这样。我没有预料到 Transformer 架构会带来如此巨大的变化,整个社区对它的喜爱以及将其作为构建 AI 平台的标准。
20VC:你认为爆发的转折点是什么?
显然是 ChatGPT。把技术直接放在用户面前,不需要解释,你可以体验与这些模型对话的感觉。
20VC:你认为聊天是消费者最好的界面吗?
对于某些事情是的,但对于其他事情,图形用户界面(GUI)可能更好。我不认为我们应该把所有东西都替换成文本框,但聊天确实提供了一个非常有吸引力的界面,尤其是语音,语音是神奇的。
20VC:你认为语音是下一个消费者界面吗?
绝对是的。与模型进行语音对话是一个非常好的体验,模型展示情感、语调、呼吸声、嘴唇的声音,这些都让人印象深刻。
20VC:我们总是被告知短期内高估技术,长期内低估技术。你认为这是这种情况吗?
有两个现象,一是改进模型变得更困难,二是随着模型变得更智能,人们区分它们的能力变得更难。每个人的知识水平有限,不能感受到模型之间的差异,但实际上这些模型在特定能力或原始智能方面有很大变化。尽管如此,继续投资是值得的,因为它对某些人来说非常有价值。
20VC:你提到有效的子公司,许多公司被收购或合并。你认为未来 3 到 5 年大多数小型模型提供商会被大云服务商收购吗?
是的,我认为会有整合的趋势,已经开始了。很多构建模型的公司已经被收购或合并。这是非常危险的,当你成为云服务商的子公司时,你的筹资方式会非常不同,经济上也会受到限制。
20VC:你认为风险投资者会从模型投资中获利吗?
Cohere 的投资者会,他们会赚很多钱。我们的第一位投资者是 Radical Ventures 的 Jordan Jacobs,他仍然在我们的董事会,我称他为 Cohere 的第四位联合创始人。
20VC:最新的估值是多少?
媒体报道是 55 亿美元左右。这确实带来了压力,我们需要成长到这个估值,但我相信市场需求强劲。尽管利润率受到价格倾销和免费模型的压力,但随着时间的推移,这种情况会改变,Cohere 的产品栈也会发展。
20VC:你最尊敬哪家公司?
我会说是 OpenAI,因为他们铺平了道路,对扩展的信念改变了世界。尽管面临很多阻力,他们坚持了下来。
20VC:你认为 OpenAI 的最佳赌注是什么?
扩展假说,认为模型会随着投入的增加变得更好。
20VC:你认为人们对 AI 社区未来 12 到 24 个月的最大误解是什么?
有一种说法认为我们已经达到顶峰,进展放缓了,但我认为这是错误的。实际上,我们在方法上的进步,比如推理和规划,模型尝试、失败并从中恢复的能力,将带来巨大的变化。
20VC:作为投资者,你认为机会在哪里?
我认为应用层仍然非常有吸引力,会有新的产品出现,改变社交媒体和其他领域。
20VC:你认为这是好事吗?你在一个非常健康的自然环境中长大,你希望你的孩子在一个与模型对话比与人类对话更多的世界中长大吗?
你可能错了,我认为你可能希望你的孩子与一个非常有同情心、极其聪明和知识渊博、安全的智能体对话,它可以教他们东西并和他们玩耍,而不是一个会疲倦、发脾气或欺负他们的人类。没有什么可以取代人类,但 AI 可以成为一个很好的补充。
20VC:你认为 AI 今天做不到的事情,在三年内会完全改变什么?
我认为机器人技术将是一个突破点。成本需要降低,但已经在下降。我们需要更强大的模型,我认为人们已经在研究这一领域。
20VC:为什么你对机器人技术持乐观态度?
因为许多障碍已经消失。以前,机器人软件非常脆弱,需要为每个任务编程,现在我们有了更动态、更自然的推理模型。我认为在未来 5 到 10 年内,我们将看到通用的、廉价的、强大的类人机器人出现。
20VC:我们来做一个快速问答环节吧。我说一个短句,你给出你的即时想法,好吗?
好的,来吧。
20VC:过去 12 个月中,你改变最多的看法是什么?
数据的重要性。我以前低估了它,现在我认识到数据质量对构建技术至关重要。
20VC:你们总共筹集了多少钱?
大约 10 亿美元。
20VC:最容易筹集的轮次是哪一轮?
可能是第一轮,那时只是一场对话,然后就筹集到了几百万美元。
20VC:你是否觉得当 5000 万美元进入账户时有点不可思议?
是的,我的经济观念已经被 Cohere 打破了。相对于竞争对手,这并不多。
20VC:如果你可以选择任何一个董事会成员,你会选择谁,为什么?
我会选择 Mike Volpi 和 Jordan Jacobs,他们是现任董事会成员。Mike 非常有经验,几乎所有问题他都遇到过,并且有解决方案。
20VC:Geoff Hinton 和 Yann LeCun,你更喜欢哪一个?
我更喜欢 Geoff,我和他关系更近。尽管 Yann 更乐观,我更倾向于他的观点,但 Geoff 是一个非常深思熟虑的人。
20VC:你们在伦敦有团队,你现在住在伦敦。每个人都在谈论欧洲的衰落,你怎么看?
英国在欧洲中脱颖而出,这里有技术乐观主义和投资意愿。在欧洲大陆,文化对科技不友好,更多是监管,但法国正在变得更有雄心,可能需要十年时间才能看到变化。
20VC:你们是远程工作还是在办公室?
我们是完全远程的,但在多伦多、伦敦、纽约和旧金山有办公室。人们每天都会来办公室,面对面的工作效率更高。
20VC:最后一个问题,你从未被问到但应该被问到的问题是什么?
你希望事情朝哪个方向发展?我被问到很多关于技术的担忧,但很少有人讨论机会。我希望 AI 能提高生产力,使人类更有效率,做更多的事情。