成立才 1 年半时间,MosaicML 卖了 13 亿美金
尽管 AI 领域还处于非常早期的阶段,但收购行为已经在不断的发生中。3 月份的时候,Stability AI 就收购了一个拥有 1500 万用户的 ClipDrop 背后开发商 Init ML,希望可以将自身的模型与应用场景更紧密的结合起来。
前段时间,AI 搜索引擎 Neeva 被 Snowflake 收购,这个收购被视为 Neeva 在 C 端尝试的失败,不过 Snowflake 希望能将其 AI 能力更多应用到 B 端场景。
今天,又一家 AI 领域的初创公司 MosaicML 被 Databricks 收购了,并且此次收购的价格高达 13 亿美金,而 MosaicML 在 2021 年 10 月份才成立,时间不过 1 年半左右,市场确实有点过于疯狂。
目前 MosaicML 拥有 62 名员工,在 2021 年 10 份成立后,已经获得了共计 6400 万美金的融资,投资机构包括了 Lux、DCVC、AME、Atlas、Playground Global 以及 Samsung Next 等,其最新一轮的估值为 2.22 亿美金,此次 13 亿美金的收购价格,相当于给出了 6 倍的溢价。
MosaicML 一直是我最近想介绍的一家 AI 公司,其愿景是让任何组织都可以自定义 AI 模型的开发,也就是帮助企业轻松地在其自己的数据和安全环境中训练和部署构建自己的 LLMs 和其它 AI 能力。
MosaicML 创始人在其官网说,其创办 MosaicML 是为了解决必要的困难工程和研究问题,使每个人都能更容易地进行大规模神经网络训练和推理。 随着最近的生成式人工智能浪潮,这一任务已成为焦点。
我们从根本上相信一个更美好的世界,每个人都有权训练自己的模型,充满自己的数据、智慧和创造力,而不是将这种能力集中在几个通用模型中。
简单来说,就是针对类似 OpenAI 的通用封闭的 AI 模型。根据 MosaiML 前两天刚发布的博客,其开源基础模型 MPT 已经发展到最新的 MPT-30B,这是一个获得商业用途许可的新型开源模型,其功能比 MPT-7B 更强大,性能优于原始的 GPT-3 ,并且在此基础上还通过微调推出了多个模型,整个 MPT 系列已经被下载了超过 300 多万次。
并且相比于 GPT-3 高达数千万美金的训练成本,MPT-30B 的训练成本在 70 万美金左右,整体的成本和模型规模都要小很多。
据 MosaicML 称,其自动优化模型训练可提供比标准方法快 2 倍到 7 倍的训练速度。结合近乎线性的资源扩展,数十亿参数的模型可以在数小时而不是数天内完成训练。 借助 Databricks 和 MosaicML,未来训练和使用 LLMs 的成本将在数千美元,而不是数百万美元。
因此相比于其它模型,MosaicML 主打的一个就是开源,另一个则是让企业可以根据自己的数据构建自己的 LLMs,如果要说第三个,我觉得是 MosaicML 几乎专注在 ToB 企业级市场。
这也是最近 AI 领域一个比较大的趋势:企业级市场。目前像 Replit 和 Glean.ai 等都已经是 MosaicML 的客户。对于此次收购,Databricks 的联合创始人兼 CEO Ali Ghodsi 说:
每个组织都应该能够从人工智能革命中受益,并更好地控制其数据的使用。Databricks 和 MosaicML 有一个难得的机会,使人工智能更加的民主化,并使 Lakehouse(Databricks 的产品) 成为构建生成式 AI 和 LLM 的最佳场所。
Databricks 一直是开源的坚定支持者,其发布的 Dolly 开源模型不仅成本极低,而且所需的数据以及训练时间都要少很多很多,号称只需 30 美元、一台服务器和三个小时,我们就能教 Dolly 开始进行人类级别的交互。
根据去年 Databricks 公布的数据,其 ARR 已经超过了 10 亿美金,在 2021 年完成 16 亿美金的 H 轮后,其估值为 380 亿美金,目前总计拿了 35 亿美金的融资,因此 Databricks 这次以 13 亿美金的价格对 MosaicML 的收购可以说非常有分量了。
作为 MosaicML 的投资人,Lux Capital 合伙人 Shahin Farshchi 之前曾分享了他对开源、超级大模型以及专业中小模型的一些看法:
- 超级大模型会给消费者带来很大价值,但较小的专业模型同样会扮演非常重要的角色。OpenAI 通过出色的能力掌握了强大的力量,但其核心问题可能是当它出现规模收益递减时。
- 在电影行业,我们现在既有具有强大预算的超级电影,也有基于社交媒体的小微电影内容,在交通工具领域,我们骑自行车、坐公共汽车,也坐飞机和高铁,甚至在疾病治疗领域,也变得越来越个性化。
- 尽管我们都喜欢灵丹妙药,但是大多数解决方案并没办法“一刀切”,通用人工智能可能会获得最多的关注,但长期来看可能远不及专业模型。在电脑领域,我们也经历了超级计算机,之后是个人电脑以及手机,而现在我们可以根据自己的工作负载调用计算能力。
- 基于过去的经验,我们可以期待巨型模型会在某些广泛的领域起作用,就像公共汽车一样,而较小的模型会针对特定领域快速发展,就像 F1 赛车。
- OpenAI “这辆公共汽车”将通过在数据管理、针对通用领域的指令微调以及高效地执行 RLHF 方面进行创新来进行解决。甚至构建在社交媒体上抓取音频和视频的模型,以进一步训练他们的模型。
- 这些公共汽车将非常适合大众,但同时,“有用”的工作将由专门的模型完成,这些模型使用高质量的数据进行训练,并使用特殊的算法来充分利用每个令牌来提高训练效率。
从长远来看,未来的 AI 既有类似公共汽车这种广泛可用的 GLLM、经过微调的类似出租车和自有车队的 GLLM,也会有更专业细分类似自有跑车这种在通用平台上大规模定制的 LLM,它将是一个非常丰富的组合,而这个过程中的每一步可能都拥有非常巨大的机会。
而在投了 MosaicML 后,Lux 最近又领投了一个主打开源的 AI 项目 Together,种子轮就拿了 2000 万美金。跟 MosaicML 比较类似,Together 也声称自己的使命是通过提供领先的开源 AGI 模型和云平台来增强创新和创造力,使任何人在任何地方都可以使用 AI,其目的是帮助创建超越封闭模型的开放模型,并将开源作为整合 AI 的默认方式。
Together 认为大型开放模型应该像开源一样易于使用,利用其产品,研究人员、开发人员和公司能够通过一个结合数据、模型和计算的直观平台来利用和改进人工智能。
此次收购,我觉得是开源的又一次价值展现。