登录
首页
快讯
邮件订阅
会员专属
Memo AI
联系我们

4 个月 3000 万美金 ARR,做 AI 评测榜单的 LMArena 为何值 17 亿美金

26-01-07
LMArena 的核心壁垒既不是技术也不是数据,而是网络效应
会员
查看原文
这个 AI 拿钱了
ARR 破新记录

AI 火了后,有很多人都在做榜单的生意,但是能把一个榜单在 2 年时间做到超过 17 亿美金估值的公司,就很少见了,LMArena 成为了第一个。

半年前种子轮刚拿了 1 亿美金的 AI 评测产品 LMArena,今天宣布再次完成了超 1.5 亿美金的 A 轮融资,估值直接飙升到了 17 亿美金,比之前的 6 亿美金估值涨了快 3 倍。此轮融资由 Felicis 和加州大学投资公司(UC Investments)领投,a16z、KP 以及 Lightspeed 等跟投。

我之前对其做过一些简单介绍《做 AI 评测种子轮拿了 1 亿美金,以及一传统人力服务转型 AI 的典型案例》,其核心产品是一个 AI 对话机器人 Chatbot Arena,用户可在平台上对比 AI 模型给出的回答,通过投票选择哪个的回答更好,最后通过投票结果来构建模型的排行榜单。

无论是之前种子轮的 1 亿美金融资还是此次 17 亿美金的估值,都有很多人在质疑它怎么能这么值钱。此次 LMArena 公布的一些数据或许给出了一些答案。在过去 7 个月时间:

  • LMArena 的用户数增长了 25 倍,独立用户超过了 3500 万
  • 收入在 4 个月时间从 0 做到了近 3000 万美金的 ARR(LMArena 去年 9 月份才推出付费产品)
  • 在文本、视觉、网页开发、搜索、视频和图像等多种模式下获得的投票达到了 5000 万次
  • 月活用户 500 万(来自 150 多个国家)
  • 每月的对话达到了 6000 万次
  • 评估的模型超过了 400 个

LMArena 核心想解决什么问题

之前 a16z 领投其种子轮时曾提到,那些让 AI 变得“乏味”的公司将创造出一些最具价值的成果。这里的“乏味”并非指平淡无奇,而是指可靠、可预测且值得信赖。而 LMArena 正在构建的是一个基础设施,以使 AI 像数据库一样“乏味”。

LMArena 正在解决的是人工智能领域最紧迫、最困难、最有价值的问题之一:大规模解决人工智能的可靠性问题。而 LMArena 提供了一个中立、开放、社区驱动的平台,用于使用真实用户查询对人工智能模型进行基准测试和评估,这对于理解和提升人工智能在实际环境中的性能至关重要。

Felicis 也在此次投资的博客里提到,AI 模型的能力几乎每周都在大力提升,但如此快速的发展也带来了两个问题:我们如何衡量和推动所有模型的进展和性能?以及我们如何在现实世界用例中对不同模型的性能进行基准测试?

随着模型不断涌现且能力出现分化,世界就需要一种清晰且持续的方式来了解哪些模型在进步、它们之间如何比较,以及它们在实际任务中的表现如何。

这个时候 LMArena 的诞生正是为了解决这个问题:一个由人类驱动的基准和数据源,助力推动所有 AI 模型的发展。

而这个项目最早是从一句玩笑话开始的一个开源项目,2023 年春天的时候,伯克利的研究团队刚刚发布了开源聊天机器人 Vicuna,用户想要将它与斯坦福大学的竞品 Alpaca 进行比较。于是 Ion Stoica 教授和他的两个学生 Wei-Lin Chiang 和 Anastasios Angelopoulos,决定让这两个模型"血战"一场比比。

没想到社区的用户对这个非常痴迷,很快,这个简单的对比工具演变成了一个让任意两个 AI 模型随机对战、由用户投票决定胜负的平台。

伯克利大学的副教授 Joseph Gonzalez 后来说:"这一切都很有趣。" 但从这种"乐趣"中,诞生了今天的 Chatbot Arena。不仅 7 个月时间拿了 2.5 亿美金的融资,并且在推出付费产品进行商业化仅 4 个月的时间,其 ARR 就做到了近 3000 万美金。

LMArena 成功背后的一位关键人物和 5 个正确的决策

不过要理解 LMArena 到底是如何取得今天的成就、商业化逻辑以及它在哪些方面做对了,我们必须了解伯克利大学教授 Ion Stoica,虽然他从未离开过大学课堂,但如今

解锁
这是一篇只对付费会员开放的文章,请先订阅成为会员
订阅

Memo Newsletter

订阅 Memo 邮件列表,过滤噪音,捕捉最具价值的创投行业信号

最顶尖的 AI 行业创业者和投资人都在看

Subscribe
头像
Memo Team
Signal, not noise!
相关文章