卖图片给大模型训练,Shutterstock 去年版权收入 1.04 亿美金
对于 AI 大模型公司来说,优质的数据是其训练大模型非常关键的一环,因此拥有版权内容的公司正在成为 AI 大模型合作的对象。
前段时间 OpenAI 分别与 Reddit、新闻集团以及 Vox Media 等达成内容授权合作就是为了这个目的。而这块到底有多值钱,我们看看几个数据就知道了。
根据 Bloomberg 的报道,Shutterstock CEO 在一次采访中称,去年他们在授权其内容版权给 AI 公司这块的收入是 1.04 亿美金,而它最新达成的一个合作对象是 Reka AI,Reka AI 最近正传与 Snowflake 商谈以 10 亿美金的价格收购。
Shutterstock 与客户签订的协议基本上每年在 1000 万美金,目前其合作对象包括了像 Meta、Alphabet、Amazon 和苹果,它们都是训练数据的客户。
OpenAI 则在 2023 年与 Shutterstock 签订了为期六年的协议,下图是这几年 Shutterstock 在内容版权这块的授权收入情况。
虽然许多从 Shutterstock 获得授权数据的公司已经有了世界上大部分内容,但他们想要合法获得这些图像,并包含有助于训练过程的高质量描述,这是其另一个价值所在。
据说 Reddit 每年从 Google 获得约 6000 万美元的内容授权收入,加上最近与 OpenAI 的授权协议,估计仅这两家收入就过亿了。而另一家图片供应商 Getty Images 与Runway 达成了类似协议。
目前 Shutterstock 拥有 7.71 亿张图像、5400 万个视频、400 万条音轨和 100 万个 3D 图形。而 Shutterstock 还不断通过收购其他媒体库来增强自己在内容这块的积累,特别是视频内容这块,CEO 说之前收购专注于视频的 Pond5 就对 AI 训练非常有价值。
Pika 今天在宣布完成 8000 万美金新一轮融资的同时,也说自己已经完成了基础模型的训练,作为 AI 视频产品,我估计 Pika 对这块同样有不小需求,因此那些对数据做了一定结构化处理的内容平台,无论是图片还是视频,估计在未来的价值会越来越高。