a16z 或领投 Mistral 估值 20 亿美金,MIT 新 AI 公司种子轮超 3 亿美金估值
尽管 2023 年已经到最后一个月了,不过 AI 领域的发展不仅没有慢下来,反而迎来了一个新的高潮。OpenAI 的内部斗争刚刚结束,Google 终于在 AI 领域拿出了自己的杀手锏,发布了大家期待已久的 Gemini 1.0。
作为从第一天开始就是多模态的大模型,Gemini 跨越了文本、 图像、 视频、 音频和代码的无缝推理能力。因此无论是文本、图片还是音视频的输入,它都可以将这些类型的输入转换为类似类型的输出,基本上实现了听说读写样样精通,其发布的几个 Demo 视频非常详细的展示了这些能力。
Google 声称 Gemini 是第一个在 MMLU(大规模多任务语言理解)上超越人类专家的模型,MMLU 是测试 AI 模型知识和问题解决能力的最流行方法之一。并且 Google 这次 一下发布了 3 个版本:Ultro、Pro 和 Nano。
其中 Ultra 是最大、最有能力的模型,适用于高度复杂的任务,会在明年推出;Pro 是可扩展各种任务的最佳模型,将支持 Google Bard;而 Nano 则是最高效的设备端任务模型,可以放到智能手机中,并将从今天开始为 Pixel 8 Pro 智能手机提供功能。
Google CEO Sundar Pichai 在博客里说,Gemini 代表了 Google 作为一家公司所做出的最大的科学和工程努力之一,而 Gemini 将开始渗透到公司几乎所有的产品生态系统中。
我注意到在此次 Gemini 1.0 的发布中,Google 特别强调了多模态的重要性,Google Deepmind CEO 在接受采访时说:
多模态是非常重要的——它是构建智能体 Agent 所需的基本要素之一。如果你想象一下机器人,甚至只是数字 Agent,了解用户界面以及如何与外界交互。在你能够以有用的方式在世界上行动之前,你必须多模态地解析你所处的环境。因此,你可以将其视为计划和交互阶段的先决条件。
Sundar Pichai 则声称,Google 搜索引擎一直在努力推动的一件事就是多模态。为此他们不得不做所有艰苦的工作,使搜索实现多模式化,此次 Gemini 作为基础模型赋予了这种能力,所以他认为这是 Google 将要进行创新的领域。
与此同时,成立 4 周在种子轮拿了 1.13 亿美金融资号称开源版 OpenAI 的 Mistral AI,正在进行新一轮的融资,融资金额高达 4.5 亿欧元(4.87 亿美金),估值则可能在 20 亿美金左右,比种子轮的 2.6 亿美金估值增加了快 8 倍。
目前传出来的领投方为 a16z,金额在 2 亿欧元左右,此外英伟达和 Salesforce 可能会提供 1.2 亿欧元,剩下的应该就是其他跟投方了。如果这笔交易完成,将让 Mistral AI 在不到一年时间实现 20 亿美金的估值。
我之前曾详细介绍过 Mistral AI,包括其融资的 Pitch Deck,其核心定位就是打造一个开源版的 OpenAI,并且解决 AI 模型里的幻觉问题,使人工智能有用。
同样在今天,还有一个非常值得关注的 AI 公司 Liquid AI 宣布了融资,种子轮 3750 万美金,估值 3.03 亿美金。投资人包括了像 OSS Capital、WordPress 母公司 Automattic、Samsung Next 等机构,以及像 GitHub 联合创始人 Tom Preston Werner、Shopify 联合创始人 Tobias Lütke 和 Red Hat 联合创始人 Bob Young 等天使投资人。
Liquid AI 由 MIT 和机器人学杰出人物 Daniela Rus 共同创立,算是 MIT 的一个 Spinoff,目标是基于第一性原理来构建通用人工智能系统,该系统由一种相对较新的人工智能模型提供支持,这个模型被称为液体神经网络(liquid neural network)。
其团队主要由 MIT 麻省理工学院计算机科学和人工智能实验室 (CSAIL) 人工智能和机器学习科学家四人组成(Ramin Hasani、Mathias Lechner、Alexander Amini 和 Daniela Rus)。团队在博客里说,Liquid AI 建立在一个可实现因果关系、可解释性和效率的框架之上,其模型超越了生成式预训练 Transformer (GPT)。 一位投资人说,
Liquid AI 的技术将大大降低公司与当前基于Transformer 的模型相比的人工智能成本,并且在训练后仍然具有适应性。它还允许解释,而不是现有模型的黑匣子模式。它是一种三重威胁技术,可以用作功能应用和垂直市场的基础模型。它基于生物学、物理学、神经科学、数学和计算机科学跨学科方法基本事实的整合。
Liquid AI 的团队在 2020 年底发表了一篇叫 Liquid Time-constant Networks 的研究论文,这个所谓的 liquid neural network 由方程控制的“神经元”组成,预测每个神经元随时间的行为,就像大多数现代模型架构一样。liquid 这个术语指的是架构的灵活性;受到蛔虫“大脑”的启发,液体神经网络不仅比传统的人工智能模型小得多,而且需要更少的计算能力来运行。
根据 TechCrunch 提供的信息,今年早些时候,Rus 和 Liquid AI 团队的其他成员根据专业无人机飞行员收集的数据训练了一个液体神经网络。然后,他们将该算法部署在一组四旋翼飞行器上,并在一系列户外环境(包括森林和人口稠密的城市社区)中进行了远距离目标跟踪和其他测试。
结果显示,液体神经网络击败了其他经过训练的导航模型,即使在存在噪音和其他挑战的情况下,也能够做出决策,引导无人机飞向先前未探索过的空间中的目标。此外,液体神经网络是唯一能够可靠地推广到它从未见过的场景而无需任何微调的模型。
因此像无人机搜索、救援、野生动物监测和交付都是液体神经网络非常明显的应用场景。但团队认为,该架构适合分析任何随时间波动的现象,包括电网、医疗读数、金融交易和恶劣天气模式。只要有一个包含顺序数据的数据集,比如视频,液体神经网络就可以对其进行训练。
尽管对技术方面我不是特别理解,不过从应用场景来看,Liquid AI 可能会在我们的实际生活场景中提供更好的解决方案,就像上面提到的那些场景一样,而这块是目前的 AI 模型好像还不是特别擅长的地方。
据说马斯克的 AI 公司 xAI 正在进行 10 亿美金的新一轮融资。AI 正在各个领域全面开花,2024 年应该是值得期待的一年!