奶牛版 Oura 估值 10 亿美金,AI+PDF 让它拿了 1700 万美金融资
市场上有无数的 AI PDF 类产品,但基本上都是 ChatPDF 的模式,也就是解析 PDF 的内容后跟它进行对话,目前大多数时候是一个 C 端使用场景。
但作为商业交流非常重要的一个文档介质,PDF 在整个企业里扮演了非常重要的角色,它的商业价值仍然有很多未被开发。特别是企业的最关键数据往往都在这些最传统的载体中——PDF 文档、扫描件和手写表格里,这些非结构化数据就像被锁在保险柜里的宝藏,企业明知价值巨大却难以获取。
于是硅谷的两位工程师就瞄准了这块,做了 Extend AI 这个产品,最近拿了 1700 万美金的融资,由 Innovation Endeavors 领投,YC、Homebrew、Character VC 以及 Adobe前首席安全官 Scott Belsky、Vercel CEO Guillermo Rauch 和 Stripe产品负责人 Jeff Weinstein 跟投。
并且还拿下了 Brex、Square、Checkr、Flatiron Health 以及多家财富 500 公司的企业客户,其收入已经做到了数百万美金的 ARR。
这个产品让我觉得有意思的是,它把大家关注在 PDF 对话这块移到了有更高要求的企业级需求场景,特别是手写内容、表格、签名以及图像等,也是一个将非结构化数据结构化的典型案例,并且不再是一个单纯的工具,而是将它打造成为了一个平台。
Extend 由 Kushal Byatnal 和 Eli Badgio 联合创立,其解决的问题也很常见,在与众多企业接触过程中,创始人发现传统的文档处理方案存在这么几个问题:
- 传统 OCR 技术的局限性:无法有效处理手写笔记、复杂表格和图像内容;
- 准确率瓶颈:即使是 99% 的准确率,在关键业务场景中也可能不够;
- 开发成本高昂:企业需要投入"工程师年"级别的努力来构建文档处理系统;
- 系统复杂度:需要整合 VLM 解析引擎、LLM 上下文管理、数据标注工具等多个组件;
创始人意识到,高质量的文档处理实际上是一个数据和系统工程问题,而不仅仅是 OCR 或基础模型可以解决的。于是他们希望重新定义文档处理的方式,通过 多模态大语言模型(VLM)集成,突破传统 OCR 限制,能够理解手写内容、表格、签名和图像。
其次,通过语义分块技术,将文档元素语义化组合,创建人类和机器都易于理解的清洁输出;第三, 内置评估工具,为客户提供分析和评估性能的方法;最后,利用自适应学习,让客户参与帮助微调 LLM 能力,更好地理解其特定文档的复杂性。提供了一个 端到端的解决方案,统一的平台避免了客户整合多个工具的复杂性。
在产品差异化这块,Extend不仅仅是 API,还提供了完整的基础设施和工具集;它不仅 面向开发者也面向操作者;另外还对一些特定行业进行了优化,比方说医疗、金融、物流等高精度要求的行业。
现在,Extend 能够在各种文档类型上实现 95% 以上的准确率,无论是清晰的 PDF 还是退化的扫描件。在公司成立一年后,已经将收入做到了数百万美金 ARR 并且现在为正,其处理的文档达到了数百万份,得到了像 Brex、Checkr 这种企业客户的认可。
其长期目标是成为"文档处理云"——就像云平台为存储、计算和协作提供服务一样,Extend 要为文档处理提供专门构建的全栈系统。AI 时代数据越来越重要,我觉得 Extend 所处的位置是一个很有价值的事情。
另外,我之前介绍过智能戒指 Oura,它通过人们携带的戒指这个场景持续跟踪获取健康数据,打造除了一个硬件+软件+服务平台,出售的戒指已经突破 250 万枚,让自己估值做到了 52 亿美金《智能戒指 Oura 融资 2 亿估值 52 亿美金,又一 AI 2 个月 5 亿美金了》。
这个模式后来被用在了宠物狗狗和鸟以及小孩身上,其中有的只是订阅服务这块的 ARR 就已经做到了 1 亿美金《新一波硬件+订阅公司兴起,多个产品收入超过了 1 亿美金》。
现在,有人将这个模式应用在了奶牛身上打造了一个奶牛版的 Oura,已经成为农场农民离不开的一个产品,其 ARR 同样增长迅猛,最新