OpenAI 发布 GPT-4o mini,一款更小更便宜的 AI 模型
OpenAI 推出了一款新型小型人工智能模型 GPT-4o mini。这款模型在成本和速度上都优于 OpenAI 现有的尖端 AI 模型,旨在为开发者和消费者通过 ChatGPT 的网页和移动应用程序提供服务。从发布当天开始,开发者和消费者就可以使用 GPT-4o mini,而企业用户将在下周获得访问权限。
GPT-4o mini 在涉及文本和视觉的理解任务上超越了业界领先的小型 AI 模型。随着小型 AI 模型性能的提升,它们因速度和成本效率而受到开发者的欢迎,尤其适用于开发者可能需要 AI 模型重复执行的高容量简单任务。
GPT-4o mini 将取代 GPT-3.5 Turbo,成为 OpenAI 提供最小的模型。该公司声称,其最新 AI 模型在 MMLU(一种衡量推理能力的基准测试)上的得分为 82%,而 Gemini 1.5 Flash 为 79%,Claude 3 Haiku 为 75%。在 MGSM(一种衡量数学推理能力的测试)上,GPT-4o mini 的得分为 87%,而 Flash 为 78%,Haiku 为 72%。
OpenAI 表示,GPT-4o mini 的运行成本显著低于其先前的前沿模型,比 GPT-3.5 Turbo 便宜 60% 以上。目前,GPT-4o mini 的 API 支持文本和视觉,并且 OpenAI 表示该模型未来将支持视频和音频功能。
OpenAI 产品经理 API 负责人 Olivier Godement 表示:“为了让世界各地的每一个角落都能通过 AI 获得赋能,我们需要使模型更加负担得起。我认为 GPT-4o mini 是朝这个方向迈出的真正重要的一步。”
对于在 OpenAI 的 API 上构建的开发者,GPT-4o mini 的定价为每百万输入令牌 15 美分,每百万输出令牌 60 美分。该模型具有 12.8 万个令牌的上下文窗口,大约是一本书的长度,并且知识截止日期为 2023 年 10 月。
OpenAI 没有透露 GPT-4o mini 的具体大小,但表示它与其他小型 AI 模型如 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash 大致处于同一级别。然而,该公司声称 GPT-4o mini 比业界领先的小型模型更快、更具成本效益和更智能,这是基于在 LMSYS.org 聊天机器人竞技场的预发布测试。早期的独立测试似乎证实了这一点。
此外,OpenAI 还宣布了针对企业客户的新工具。在博客中,OpenAI 宣布了企业合规性 API,以帮助高度受监管行业的企业(如金融、医疗保健、法律服务和政府)符合日志记录和审计要求。
该公司表示,这些工具将允许管理员审核并采取行动,以处理他们的 ChatGPT 企业数据。API 将提供包括对话、上传的文件、工作区用户等在内的时间戳交互记录。
OpenAI 还在为企业用例定制的特定版本的 ChatGPT(称为工作区 GPT)提供更细粒度的控制。以前,管理员只能完全允许或阻止在他们的工作区创建的 GPT 操作,但现在工作区所有者可以创建一个 GPT 可以交互的已批准域名列表。