再融 5 亿美金,新模型带动 Kimi 海外 API 收入呈4 倍级速度增长
2025 年的最后两天,没想到两个国内 AI 团队给行业带来了非常不错利好的消息。在 Manus 被高价收购后,Kimi(月之暗面)昨天也宣布完成了 5 亿美金的 C 轮融资,投后估值达到了 43 亿美金。
次轮阿里、腾讯、高榕以及王慧文等老股东均超额认购。月之暗面创始人兼 CEO 杨植麟在公司内部信里说,公司账上现金储备超过了 100 亿人民币。
我比较关注的商业化这块,杨植麟在内部信里也简单说了一下,自 2025 年 9 月至 11 月,Kimi 在国内外付费用户的月度环比增长(MoM)超过了 170%,9-11月海外 API 收入增长了 4 倍。
而这个增长得益于 Kimi 这一年在技术上的突破,特别是 K2 Thinking 的发布。技术突破带来的商业化快速增长,又让这轮融资在一级市场得到超额认购:
Kimi 产品从 5 月开始高频推出新的 Agent 功能,发布了 Researcher, OK Computer, PPT, Kimi Code 等新品,功能日渐强大。借助 K2 模型的 sota 表现,C 端商业化指数增长。
K2 和 K2 Thinking 分别作为大规模基座模型与强化版思考模型,标志着 Kimi 在 “复杂推理、长链思考” 上取得实质突破。不仅发布了中国首个程度扩展到万亿参数级别的大模型,还搭建了第一个开源 Agentic 思考模型,在多个核心 Benchmark 上达到甚至超越 OpenAI 同类模型的表现。
K2 Thiking 算得上是一个真正意义上的“支持数百步工具调用的思考模型”,其技术突破的核心落脚点不再只是单一的大模型,而是能连续进行自我推理和工具调用的思考型智能体。他让模型在执行复杂任务时,可以像人一样持续思考、验证信息、横向探索答案。
比方说它可以连续执行 200–300 轮工具调用而无需人为干预,使得模型从“被动回答”向“主动分析解决问题”转变。相比只擅长生成文本、工具链集成较弱的传统大模型,K2 Thinking 表示出了“模型能自己思考如何获取与组合知识”的真正智能体潜力,这种能力对于自动化决策、科研助手等方向极其重要。

而在国内同行如智谱、MiniMax 等纷纷加速上市的情况下,杨植麟认为相比于二级市场,他们的判断是还可以从一级市场募集更大量资金。他说他们的 B/C 轮融资金额就超过绝大部分 IPO 募资及上市公司的定向增发,所以短期不着急上市,也不以上市为目的。
我在之前的文章《别只顾着追赶 OpenAI,成为估值 1830 亿美元的 Anthropic 也不错》里提到,Anthropic 通过 Coding 和 Agent 能力的突破,成功挑战了 OpenAI 设定的技术路线图,走出了一条自己独特的道路。
鉴于中国 AI 大模型创业公司在融资金额普遍有限的情况下,大家也越来越多意识到 OpenAI 的路线不是唯一解,开始加快追赶 Anthropic 的步伐,其中 Kimi 就从 K2 模型时开始发力 Agentic 能力。
对于此次融资后 Kimi 未来,杨植麟也将目标瞄准了 Anthropic,希望超越 Anthropic 等前沿公司成为世界领先的 AGI 公司,核心是冲锋 K3 模型:通过技术改进和进一步 Scaling,提升等效 FLOPs 至少一个数量级,在预训练水平上追平世界前沿模型。
这里的 FLOPs 指的是用于预训练的大量计算资源——也就是说 K3 不只是更大,而是更深入训练、更高效学习、更强泛化能力的模型。
同时要垂直整合模型训练和 Agent 产品 Taste,让 K3 不仅在 Benchmark 上领先,更能在真实应用场景中展现出独特的 Agent 能力和用户体验。 也就是在用户体验与定制能力上更贴近产品化需求,而非只有 Benchmark 分数。
这块之前 Kimi 团队在 Reddit AMA(线上问答)透露了一些未来的架构方向,比方说 K3 有可能引入 KDA(Kimi Delta Attention)等新架构模块,尝试解决传统 Transformer 在长上下文和效率上的不足。
KDA 是一种线性注意力或优化注意力机制的尝试,它有望让模型在更大的上下文窗口、更低的计算成本、更高的记忆效率 上表现更优。这个架构是从“规模化计算”向“结构性智能”进化最核心部分。
以下是杨植麟发的内部信全文:
2025年即将过去,借此机会祝贺大家在今年取得的 sota 成绩!
在大家的一同努力下,2025 年是 Kimi 充满突破的一年。K2 和 K2 Thinking 的发布标志着我们在 AGI 道路上走出重要一步。中国首个万亿参数基座模型、第一个开源的 agentic model、在最核心 benchmark例如 HLE 上超越 OpenAI取得 sota、独具特色的创意写作风格得到全球用户喜爱、第一次成功使用二阶优化器做大规模训练,K2 系列模型让Kimi 从中国走向了世界,在硅谷以及更广泛的全球技术圈产生了重大影响力,登上 twitter 全球热搜,得到 Nvidia 创始人、All-In Podcast 主播、Anthropic 联合创始人、Perplexity 创始人、a16z 创始人、Vercel 创始人、诺奖得主等知名技术领袖的高度评价。
技术的突破也为产品的爆发和商业上的飞速进展奠定基础。Kimi 产品从 5 月开始高频推出新的 agent 功能,发布了 Researcher, OK Computer, PPT, Kimi Code 等新品,功能日渐强大。借助 K2 模型的 sota 表现,C 端商业化指数增长,9-11 月,海外和国内付费用户数平均 MoM 增长超过 170%。同时,K2 Thinking 的发布也显著带动了 API 收入的增加,9-11 月海外 API 收入增长 4 倍。
得益于上述突破,公司近期完成了 5 亿美元 C 轮融资且大幅超募,当前现金持有量超过 100 亿元。相比于二级市场,我们判断还可以从一级市场募集更大量资金,事实上,我们 B/C 轮融资金额就超过绝大部分 IPO 募资及上市公司的定向增发。所以我们短期不着急上市,也不以上市为目的。当然未来我们计划将上市作为手段来加速 AGI,择时而动,主动权掌握在我们手中。
C 轮融资资金将用于更加激进地扩增显卡,加速 K3 模型的训练和研发。部分资金也将用于 2026 年的激励计划和期权回购计划。2025 年,基于 sota 结果产出,调薪、期权奖励、现金奖励等各种激励措施累计 324 人次。2026 年春节之前会确定 K2 Thinking 及后续模型和产品发布的奖励方案并发放。2026 年公司的平均激励预计是 2025 年的 200%,同时计划大幅上调期权回购额度,详细方案即将公布。
接下来公司最重要的目标是超越 Anthropic 等前沿公司成为世界领先的 AGI 公司。2026 年的战略会按如下几个方面推进:
- K3 模型通过技术改进和进一步 scaling,提升等效 FLOPs 至少一个数量级,在预训练水平上追平世界前沿模型
- 垂直整合模型训练和 agent 产品 taste,让 K3 成为更“与众不同”的模型,让用户体验到全新的、其他模型没有定义过的能力
- 产品和商业化上聚焦 agent,不以绝对用户数量为目标,持续追求智能上限,创造更大的生产力价值,营收规模实现数量级增长
这是一个喧嚣的时代,但对我来说,Kimi 的起点很简单,就是单纯的好奇,好奇 AGI 的上限在哪,好奇我们心中的理想模型是什么样,好奇我们想要的模型能力怎么做出来。这份好奇带来的快乐是很真实的。当我们熬夜做的 agent 功能终于上线,当来自乌克兰的用户使用 Kimi 在战乱中教学,当每天醒来打开 tensorboard 看到惊为天人的训练曲线。我们共享了这些宝贵的接近真相的过程,也相信这种简单的快乐能让我们在喧嚣中穿越周期。
2026 年 Kimi 会成为一个“与众不同”和“不被定义”的 LLM。不管是别人没敢押注的技术无人区,还是需要一点偏执的审美坚持,我相信有更多 Kimi-defined 的创新能对人类文明加速发展产生独特贡献。这种独特性是我们存在的最大意义。共勉!
