Mistral 发布其首个多模态模型 Pixtral 12B
24-09-12
法国人工智能初创公司 Mistral 发布了其首个多模态模型 Pixtral 12B,这是一个具有 120 亿参数的模型,大小约为 24GB。
多模态模型能够处理图像和文本,Pixtral 12B 基于 Mistral 的文本模型 Nemo 12B 构建,能够回答关于任意数量和任意大小图像的问题,无论是通过 URLs 还是使用 base64 编码的图像。理论上,Pixtral 12B 能够执行如图片字幕生成和计算照片中对象数量等任务。
Mistral 在完成一轮由 General Catalyst 领投的 6.45 亿美元融资后,公司估值达到 60 亿美元。这家成立一年多的公司,微软持有少数股份,被许多 AI 领域的人士视为欧洲版的 OpenAI。Mistral 的策略包括发布免费的“开放”模型,对这些模型的托管版本收费,并向企业客户提供咨询服务。