英国AI初创公司Cosine筹资250万美元,其AI开发者超越人类程序员
24-08-13
英国人工智能初创公司Cosine在人工智能开发领域取得了突破性进展,其人工智能开发者Genie在SWE-Bench(软件工程技能评估)上取得了30%的得分,超越了人类程序员。该公司最近从SOMA和Uphonest等投资者那里筹集了250万美元的资金。Cosine的人工智能开发者Genie能够自主或与人类开发者合作解决错误、构建功能、重构代码等任务。Cosine的软件是通过模仿人类软件开发者的行为来执行编码领域的复杂任务而开发的,其在推理方面非常“人性化”。该公司在SWE-Bench上的得分是迄今为止任何公司所取得的最高分,比之前最好的成绩(Factory的19%)提高了56%,比OpenAI的GPT4(1.31%)提高了2196%。Cosine的方法通过微调模型来模仿人类推理,击败了AWS的Amazon Q Developer和Cognition的Devin等竞争对手,这些竞争对手在同一基准测试中的得分都低于20%。Cosine的首席执行官Alistair Pullen表示,他们的突破使他们能够训练AI模型执行超出当前软件开发团队可用的狭窄任务范围和严格限制的提示。Cosine的产品能够在完成复杂软件任务方面击败OpenAI等竞争对手,而且所需的时间和金钱都比竞争对手少。Cosine的首席运营官Yang Li表示,他们正在改变开发和开发者的工作方式。Uphonest Capital的合伙人Ellen Ma表示,Cosine不仅在改进AI,他们还在从根本上教会AI进行推理,为公司提供了一个真正的AI同事。