OpenAI 发布 GPT-4o mini，一款更小更便宜的 AI 模型

24-07-19

免费

快讯

AIGC

OpenAI 推出了一款新型小型人工智能模型 GPT-4o mini。这款模型在成本和速度上都优于 OpenAI 现有的尖端 AI 模型，旨在为开发者和消费者通过 ChatGPT 的网页和移动应用程序提供服务。从发布当天开始，开发者和消费者就可以使用 GPT-4o mini，而企业用户将在下周获得访问权限。

GPT-4o mini 在涉及文本和视觉的理解任务上超越了业界领先的小型 AI 模型。随着小型 AI 模型性能的提升，它们因速度和成本效率而受到开发者的欢迎，尤其适用于开发者可能需要 AI 模型重复执行的高容量简单任务。

GPT-4o mini 将取代 GPT-3.5 Turbo，成为 OpenAI 提供最小的模型。该公司声称，其最新 AI 模型在 MMLU（一种衡量推理能力的基准测试）上的得分为 82%，而 Gemini 1.5 Flash 为 79%，Claude 3 Haiku 为 75%。在 MGSM（一种衡量数学推理能力的测试）上，GPT-4o mini 的得分为 87%，而 Flash 为 78%，Haiku 为 72%。

OpenAI 表示，GPT-4o mini 的运行成本显著低于其先前的前沿模型，比 GPT-3.5 Turbo 便宜 60% 以上。目前，GPT-4o mini 的 API 支持文本和视觉，并且 OpenAI 表示该模型未来将支持视频和音频功能。

OpenAI 产品经理 API 负责人 Olivier Godement 表示：“为了让世界各地的每一个角落都能通过 AI 获得赋能，我们需要使模型更加负担得起。我认为 GPT-4o mini 是朝这个方向迈出的真正重要的一步。”

对于在 OpenAI 的 API 上构建的开发者，GPT-4o mini 的定价为每百万输入令牌 15 美分，每百万输出令牌 60 美分。该模型具有 12.8 万个令牌的上下文窗口，大约是一本书的长度，并且知识截止日期为 2023 年 10 月。

OpenAI 没有透露 GPT-4o mini 的具体大小，但表示它与其他小型 AI 模型如 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash 大致处于同一级别。然而，该公司声称 GPT-4o mini 比业界领先的小型模型更快、更具成本效益和更智能，这是基于在 LMSYS.org 聊天机器人竞技场的预发布测试。早期的独立测试似乎证实了这一点。

此外，OpenAI 还宣布了针对企业客户的新工具。在博客中，OpenAI 宣布了企业合规性 API，以帮助高度受监管行业的企业（如金融、医疗保健、法律服务和政府）符合日志记录和审计要求。

该公司表示，这些工具将允许管理员审核并采取行动，以处理他们的 ChatGPT 企业数据。API 将提供包括对话、上传的文件、工作区用户等在内的时间戳交互记录。

OpenAI 还在为企业用例定制的特定版本的 ChatGPT（称为工作区 GPT）提供更细粒度的控制。以前，管理员只能完全允许或阻止在他们的工作区创建的 GPT 操作，但现在工作区所有者可以创建一个 GPT 可以交互的已批准域名列表。

Memo AI

AI is everything!

OpenAI 发布 GPT-4o mini，一款更小更便宜的 AI 模型

Memo Newsletter